분류 전체보기 (30) 썸네일형 리스트형 Perf Events Counter, MSRs - model specific registers https://easyperf.net/blog/2018/06/01/PMU-counters-and-profiling-basics Counting vs. Sampling Counting - disable counting - set all the counters to 0 - configure evenst that we want to measure - enable counting - run the application - disable counting - read the values of the counters Sampling - set counter to 0 - enable counting - wait for the overflow an.. CPU cycle에 대한 고찰 What is retired instruction? Modern processors execute much more instructions that the program flow needs. This is called a speculative execution. Instructions that were “proven” as indeed needed by the program execution flow are “retired”. What is reference cycle? Having a snippet A to run in 100 core clocks and a snippet B in 200 core clocks means that B is slower in general (it takes double t.. BTF, CO-RE Brendan Greeg's Blog [link] BTF: BPF Type Format, which provides struct information to avoid needing Clang and kernel headers. CO-RE: BPF Compile-Once Run-Everywhere, which allows compiled BPF bytecode to be relocatable, avoiding the need for recompilation by LLVM. PingCAP Article [link] BCC 단점 BCC(BPF Compiler Collection) toolkilt은 효과적인 kernel tracing을 지원하기 위해 만들어졌지만 여러 단점이 있다. BCC는 LLVM 이나 Cla.. [12 SYSTOR] Analytic Modeling of SSD Write Performance Abstract SSD는 기존 데이터를 덮어쓰는것 대신 새로운 복사본을 기록하는 방식으로 데이터를 업데이트하고 이전의 동일한 데이터는 무효화(invalidate)한다. 이러한 write 동작은 page 단위로 수행되는 반면, erase 동작은 multi-page로 이루어진 block 단위로 수행된다. 그러므로 erase가 동작하기 전에 block에 남아있는 valid page들을 복사해둘 필요가 있다. 이러한 cleaning process의 효율성은 random workload에서 큰 영향을 끼친다. 더 자세하게 말하자면, SSD의 write bottleneck은 대부분 intermal media throughput과 write amplification으로 인해 발생하고 이러한 추가적인 copy 동작이 .. [14 SIMULTECH] Analytical Model of SSD Parallelism 0 Abstract SSD는 IO 성능을 높이기 위해 channel parallelism, way parallelism, plane pallelism과 같은 여러 IO 병렬 메커니즘을 지원한다. 시뮬레이션을 통해 SSD의 성능을 측정하기 위해서 시뮬레이터는 내부 IO 동작을 모델링하여 SSD의 병렬 IO 작업을 지원해야한다. 이 논문에서는 multiple channel 및 multiple way로 설계된 SSD의 IO 대기 시간을 계산하는 분석 모델을 개발하였다. SSD의 IO 유형을 단일 페이지 읽기/쓰기 작업과 다중 페이지 읽기/쓰기 작업의 두 가지 작업으로 분류하여 IO 대기 시간에 대한 공식을 만들었다. IO 대기 시간 모델을 사용하여 실제 SSD인 Intel X25-M의 IO성능을 3.8% 오차.. PCI dmidecode 명령어로 H/W 정보 많이 알 수 있음 (sudo 권한 필요) Scanning /dev/mem for entry point. 로 시작함 - OEM-specific Type (?) - BIOS setting - System Information - Base Board Information - Chassis Information - Processor Information - Cache Information (L1, L2, L3) - Port Connector Information - System Slot Information ... Memory Device Array Handle: 0x003E Error Information Handle: Not Provided Total Width: 64.. [18 CLOUD] Estimating Cloud Application Performance Based on Micro-Benchmark Profiling 0. ABSTRACT 클라우드 컴퓨팅 시장의 지속적인 성장은 클라우드 서비스의 전례없는 다양성으로 이어졌다. 마이크로 벤치마크는 적절한 서비스를 선택하기 위해 널리 사용된다. 하지만 이러한 합성(synthetic) 마이크로 벤치마크가 실제 어플리케이션의 성능에 대한 통찰을 얻는데 얼마나 관련이 있는지가 불분명하다. 그러므로 이 논문에서는 마이크로 벤치마크를 사용하여 어플리케이션을 프로파일링 하고 어플리케이션의 성능을 예측하는데 사용하는 클라우드 벤치마킹 방법을 개발한다. Amazon EC2 환경에서 23개 마이크로 벤치마크의 38개 메트릭과 서로 다른 도메인의 2개의 어플리케이션을 사용하여 성능 추정 모델을 정량적으로 평가하기 위한 연구를 진행하였다. 그 결과 클라우드 서비스 성능 변동성(performa.. Ubuntu 자꾸 절전 모드 될 때 절전모드 해제 sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target 절전모드 설정 sudo systemctl unmask sleep.target suspend.target hibernate.target hybrid-sleep.target 아직 원인은 모르지만.. 해당 현상이 나타났던 Ubuntu version - 20.04.3 Technical Writing Lecture 01 Basic Skills Basic communication skills Wordy Phrases: during, can, usually, generally, if, daily 등등의 같은 단어구를 잘 활용하기 Redundancies: 중복 의미 제거 Big Words: 길고 복잡한 단어는 짧고 쉬운 단어로 Appropriateness: 구어체 대신 문어체로 Plagiarism and paraphrasing plagiarism 피하는 방법: Quotations, Summarizing, Paraphrasing (가장 흔한 방법) paraphrase 조건 1) Technical term이 아닌 Non-Content word는 바꾸기 2) 문장 구조도 바꾸기 3) 원래 의미가 변형되면 안됨 .. [17 SOSP] Canopy: An End-to-End Performance Tracing And Analysis System Evaluation Canopy는 Facebook의 production 환경에서 지난 2년 동안 배포 및 사용되어 왔다. 이번 장에서는 Facebook 엔지니어가 성능 문제를 진단하기 위해 Canopy가 어떻게 사용되어 왔는지를 보여준다. Canopy의 오버헤드와 load-shedding 속성들을 평가한뒤 2.2장에서 설명한 챌린지들을 해결하기 위한 방법을 보여준다. Canopy는 - 서로 다른 동작을 하는 여러 이기종 시스템에서 신속한 성능 진단 및 성능 모델을 만들 수 있게 한다. - 많은 사용자가 동시에 서로 다른 목적의 용례를 위한 커스터마이징을 가능하게 한다. - 새로운 용례 및 실행 조건에 맞게 독립적으로 trace model을 개선할 수 있게 한다. - 적은 오버헤드로 많은 수의 trace를.. 이전 1 2 3 다음