본문 바로가기

전체 글

(30)
Advanced profiling topics. PEBS and LBR. multiplexing and scaling events If there are more events than counters, the kernel uses time multiplexing(switch frequency = HZ, generally 100 or 1000) to give each event a chance to access the monitoring hardware. Multiplexing only applies to PMU events. Multiplexing을 사용하면 event 들이 매번 측정되지 않는다. 실행의 마지막에 tool이 따로 계산을 수행한다. final_count = raw_count * time_enabled/time_running. 그러므로 workload에 따라 bl..
IOPS Are A Scam Introduction IOPS란 Input/Output Operations Per Second로써, 디바이스에서 1초에 얼마나 많은 물리적인 read/write 동작이 수행가 능한지를 나타내는 척도이다. 많은 벤더들이 이러한 메트릭을 통해서 자신의 상품들을 광고한다. 하지만 사실 7,000 IOPS 스펙을 가진 디바이스와 300 IOPS 스펙의 디바이스 중 항상 7,000 IOPS 디바이스가 빠르다고 장담할 수는 없다. Background Latency vs IOPS Latency는 하나의 요청(request)이 발생하고 그에 대한 응답(response)을 받기까지 걸린 시간이다. Latency는 스토리지 디바이스의 성능을 나타내기 위한 하나의 중요한 메트릭이다. HDD의 동작 구조를 알고 있다면, 물..
[20 CCF Tran HPC] APMT: an automatic hardware counter‑based performance modeling tool for HPC applications Abstract HPC 어플리케이션과 컴퓨터 구조의 복잡도가 늘어가면서 어플리케이션의 동작을 이해하는 노력에 대한 비용 또한 점차 증가하고 있다. 이 논문에서는 performance를 효율적으로 이해하고 예측하기 위한 APMT(Automatic Performance Modeling Tool)을 소개한다. APMT에서는 hardware counter 기반 프로파일링을 사용하여 key kernel 과 non-scalable kernel를 구분하여 performance model을 만든다. 또한, CPI(Cycles-Per-Instruction)을 더욱 자세하게 계산하기 위해 선택적 개선 모델링 프레임워크(optional refinement modeling framwork)를 제공한다. APMT는 몇 가지 소..