虛擬世界 vs 實體世界的資料 (Internet of Things, IOT)


虛擬世界的資料  vs . 實體世界的資料

網路流量,Facebook  like,Blogger 的文章數...等,這些資料都是屬於虛擬世界的資料,鄉對應的物聯網的資料,就是屬於實體世界的資料。

物聯網 (Internet of Things, IOT)

物聯網(Internet of Things, IOT)一詞,最早由國際電信聯盟(International Telecommunication Union, ITU)於2005年所發布的報告「The Internet of Things」中提出,係指在網路化的時代下,除了人跟人之間可以透過網路相互聯繫、人也可透過網路取得物件的資訊外,物件與物件之間可以互通的網路環境。物聯網的概念主要來自Sensor networks,各種Sensor device大量的收集各種資訊,進而用來做出許多判斷與控制,最有名的應用應該就屬RFID,不過更廣義的來說只要有聯網的設備,都可以算是物聯網的範疇。


物聯網的組成就跟Data ware house一樣是由三個維度所構成 -「時間」(Time)、「地點」(Place)與「物件」(Thing)三個維度,隨著物聯網發展的趨於成熟將創造出所有物件皆可在任何時間、任何地點相互溝通的環境。其涵蓋了「人與人」、「物件與物件」及「人與物件」三大範疇,當這些資料都需要收集起來被分析時,可想而知這資料量會有多驚人。

根據IBM Innovation 研究院的VP Bernie Meyerson定義 
物聯網出現創造了如洪水般的數據資料,只有最先進的信息技術可以收集,篩選,秩序和審問的結果,大量數據集也就是我們所稱的Big Data。

The Big Data

根據wiki 的定義:
Big data is a term applied to data sets whose size is beyond the ability of commonly used software tools to capture, manage, and process the data within a tolerable elapsed time. Big data sizes are a constantly moving target currently ranging from a few dozen terabytes to many petabytes of data in a single data set.

The application of IOT and Big Data

讓我們來看看一個美國農業的案例 - How Climate Corp. is pitting big data against Mother Nature[4],就是透過Sensor 收集大量農地的資訊,加以分析和概估(probabilities),下面是他們列出來他們必須要分析的資料量:
  • About 200TB of historical data stored in Amazon S3.
  • Monthly predictive simulations and daily forecasts for each location it insures.
  • Data volumes have grown about 15x since last year.
  • Each simulation:
    • Uses between 4,000 and 5,000 computing cores on Amazon Elastic MapReduce.
    • Considers 10,000 scenarios for each of the next 730 days.
    • Analyzes 5 trillion data points.
    • Consumes 20TB of uncompressed data.
Cloud + IOT +Big Data 是我蠻有興趣的Topic,我也覺得這對台灣來說是一個很好的施力點,台灣的硬體和網路技術是世界數一數二的,此外這個時間點 Big Data 處理與Cloud 都還在戰國時代,還沒有被特定的廠商壟斷或把持,如果能搭配好硬體與軟體絕對能有一番作為,只要有時間,我應該會持續收集整理這方面的資料。


