티스토리 뷰

1. 왜 perf를 써야 할까?

서비스를 운영하다 보면 CPU 사용률이 높다는 건 알겠는데, 어떤 함수가 실제로 CPU를 많이 쓰는지는 쉽게 파악하기 어렵습니다.
이럴 때 사용하는 대표적인 도구가 바로 perf입니다.

perf는 Linux 커널에서 제공하는 성능 분석 도구로, 다음과 같은 정보를 얻을 수 있습니다:

  • 함수별 CPU 사용량
  • Call stack 기반 병목 분석
  • Cache miss, branch miss 같은 Low-level metric
  • Flame Graph 생성용 데이터 수집

2. perf 기본 개념

perf는 크게 두 단계로 나뉩니다:

  1. record: 성능 데이터 수집
  2. report: 수집된 데이터 분석

3. 함수별 CPU 사용량 측정하기

3.1 실행 중인 프로세스 분석

perf record -F 99 -p <PID> -g -- sleep 30

설명:

  • -F 99 : 초당 샘플링 횟수 (99Hz)
  • -p : 대상 프로세스 ID
  • -g : call graph 수집 (핵심!)
  • sleep 30 : 30초 동안 수집

3.2 결과 확인

perf report

여기서 확인할 수 있는 것:

  • 어떤 함수가 CPU를 많이 사용하는지
  • call stack 구조
  • 병목 함수 위치

예시:

  40.12%  myapp  my_function
  25.33%  myapp  another_function

→ my_function이 가장 큰 CPU 소비


4. 특정 실행 파일 분석

perf record -F 99 -g ./my_program
perf report

프로그램 실행과 동시에 profiling 가능


5. Flame Graph로 시각화하기 (핵심 🔥)

5.1 데이터 변환

perf script > out.perf

5.2 Flame Graph 생성

stackcollapse-perf.pl out.perf > out.folded
flamegraph.pl out.folded > flamegraph.svg

5.3 결과 해석

  • 가로 폭 = CPU 사용량
  • 깊이 = call stack
  • 넓은 블록 = 병목 지점

6. 자주 쓰는 옵션 정리

옵션설명

-g call graph 수집
-F sampling frequency
-p 특정 PID 대상
-a 전체 시스템
--call-graph dwarf 더 정확한 stack 추적

7. 실무 팁

7.1 debug symbol 필수

정확한 함수 이름을 보려면:

-g 옵션으로 빌드 (gcc -g)

또는

apt install <package>-dbg

7.2 권한 문제 해결

sudo sysctl -w kernel.perf_event_paranoid=-1

7.3 Java / Python 분석

  • Java: -XX:+PreserveFramePointer 옵션 필요
  • Python: native + interpreter stack 섞여서 나옴

8. 언제 perf를 쓰면 좋은가?

  • CPU 사용률이 높은데 원인을 모를 때
  • 특정 함수가 느린 것 같을 때
  • production 환경에서 low overhead profiling이 필요할 때

9. 정리

perf는 단순한 모니터링 도구가 아니라,
"CPU를 누가 얼마나 쓰는지 정확히 보여주는 현미경"입니다.

특히 다음 조합이 가장 강력합니다:

  • perf record + perf report
  • perf + Flame Graph

이 두 가지만 제대로 활용해도 대부분의 CPU 병목은 잡을 수 있습니다.

 

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/03   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함