전체 글 (30) 썸네일형 리스트형 [14 ASPLOS] Quasar: Resource-efficient and QoS-Aware Cluster Management 0 Absctract 클라우드 컴퓨팅은 사용자에게는 유연성과 고성능을, 운영자에게는 높은 비용 효율성을 약속한다. 그럼에도 불구하고 대부분의 클라우드 시스템에서는 매우 낮은 utilization으로 동작하기 때문에 cost-efficiency와 scalability을 모두 저해하고 있다. Resource utilization을 높여 지속적으로 높은 애플리케이션 성능을 제공할 수 있는 클러스터 관리 시스템인 Quasar를 소개한다. Quasar는 세 가지 기술을 사용한다. 첫째, 사용자에 의한 복잡한 코드를 통해 workload dynamics 및 물리적 리소스 요구 사항을 제시해야하는 resource reservation 방법에 의존하지 않는 대신 사용자로부터 각 워크로드에 대한 성능 제약만을 표기하도록.. [12 NOMS] Workload Characterization and Prediction in the Cloud: A Multiple Time Series Approach 0 Abstract 클라우드 컴퓨팅은 컴퓨팅 요구 사항을 충족하기 위해 high scalability, flexibility and cost-effectiveness를 약속한다. 클라우드에서 컴퓨팅 리소스를 효율적으로 프로비저닝하기 위해 시스템 관리자는 VM의 워크로드를 특성화하고 예측하는 기능이 필요하다. 이 논문에서는 실제 데이터 센터에서 얻은 데이터 추적을 사용하여 이러한 기능을 개발합니다. 먼저, 각 VM에서 실행되는 어플리케이션 간의 종속성으로 발생하는 VM 간 워크로드의 correlation를 탐색하여 repeatable workload pattern을 탐색한다. 워크로드 데이터 샘플을 time series로 처리하여 correlated workload pattern을 자주 나타내는 VM 그룹.. [20 OSDI] Serving DNNs like clockwork: Performance predictability from the bottom up 0 Abstract Machine learning inference는 intractive 웹 어플리케이션의 핵심 building block이 되고 있다. 그 결과 기저에 모델이 서비스되는 시스템은 낮은 latency를 유지하는 것을 목표로 해야한다. 기존의 모델을 제공하는 아키텍처는 잘 알려진 reactive 기술을 사용하여 일반적인 경우의 latency 원인을 완화하지만 예측할 수 없는 execution time으로 인한 tail latency를 효과적으로 줄일 수는 없다. 그러나 기본 execution time은 근본적으로 예측할 수 없는 것이 아니며, 논문에서는 DNN(Deep Neural Network) 모델을 사용한 inference(추론)이 deterministic performance를 갖는.. 이전 1 ··· 6 7 8 9 10 다음