ApacheCon2013 - Hadoop and HBase on the Cloud: A Case Study on Performance and Isolation

2013年6月23日星期日

ApacheCon2013 - Hadoop and HBase on the Cloud: A Case Study on Performance and Isolation

圖片來源：改編自網路圖片

(這篇真的壓了好久喔....Orz...沒時間好好研究和收集這方面的資料...)

還記得之前我之前曾經寫過兩篇文章：到底功夫熊貓(Xen)踢不踢的動大象(Hadoop)呢和"要使用大象，真的得養頭大象嗎？為何不使用AWS EMR，剛好這次ApacheCon2013就有談到這個題目：

Hadoop and HBase on the Cloud: A Case Study on Performance and Isolation.

by Konstantin Shvachko, Jagane Sundar

這個talk討論的正是如何用虛擬化提高Hadoop的使用效能!? 一般來說談到虛擬化，第一直覺反應通常是使用後往往會拉低使用效能，怎麼反而還可以提高呢？所以這個題目讓我特別感興趣，讓我們來看看他的論點。

首先他的假設前提是 "Low average CPU utilization on Hadoop Clusters"，因為他認為Disk I/O和Network 都是可以透過設計和規劃提高一定的效能，但是CPU utilization is bad，他列兩點原因：