2013年3月27日 星期三

觀察各公司在Hadoop Ecosystem 的committer 與PMC 數量


圖片來源:Datameer 2013

相信這張圖大家應該都看過,是關於Hadoop Ecosystem technology partnerships之間的關係,第一名的是Cloudera。

剛好今天收到一封信說Hortonwork在Hadoop 專案的數量遠遠超過Cloudera,我就在想這樣看不準啊,因為cloudera在其他專案也有投入許多人力啊!?於是就燃起我一定要察個水落石出的念頭!!(工程師魂~~~~~)

剛好這也算是由另一個角度來分析,藉由觀察各公司在Hadoop Ecosystem (個專案) 的Commiter 與PMC 數量,來看個公司的主力方向以及參與程度。

整理的方法,就是收集Hadoop ecosystem 比較主要專案的PMC 與 committer 名單,雖然發現有幾個committer有跨專案,不過這邊最主要是要比較每間公司佔各專案的人數,所以就先不管混在一起計算(其實是偷懶....),另外我也只計算幾個人數比較多的大公司,其他小公司或獨立開發者就沒特別列出來。


Ambari Hortonworks 18
IBM 2
Avro Cloudera 4
Pig Hortonworks 5
Cloudera 1
IBM 1
Twitter 3
Yahoo 3
Hive Facebook 6
Hoetonwork 1
Sqoop Cloudera 9
Mahout LinkedIn 2
HCatalog Facebook 1
Hortonworks 6
Twitter 1
Yahoo 2
Oozie Cloudera 3
Hortonworks 2
Yahoo 3
MS 2
Flume Cloudera 12
BigTop Cloudera 8
Facebook 2
Hortonworks 3
ZooKeeper Cloudera 4
Hortonworks 2
Yahoo 6
Hbase Cloudera 9
Facebook 5
Hortonworks 4
Hadoop PMC Cloudera 7
Facebook 3 + 2
Hortonworks 13+ 4
Yahoo 3 +7
IBM 0+ 3

--------------------------------------
所以最後統計結果如下,果然還是Hortonwork 大勝!!

Hortonworks 61
Cloudera 48
Yahoo 27
Facebook 17
IBM 6
Twitter 9
LinkedIn 4

報告完畢~~我真無聊....XD
張貼留言