開源與閉源的融合有利于構建大數據分析生態

2016-05-28 09:05:24來源：至頂網原標題：開源與閉源的融合構建大數據分析生態關鍵詞：開源閉源大數據分析閱讀量：32393

導讀：大數據分析在日積月累的過程中正在不斷發生著改變，之前數據分析更多聚焦在B2C領域，現在隨著物聯網的發展則轉向B2B領域，形成B2B B2C的模式。

　　【中國智能制造網技術前沿】大數據分析在日積月累的過程中正在不斷發生著改變，之前數據分析更多聚焦在B2C領域，現在隨著物聯網的發展則轉向B2B領域，形成B2B B2C的模式。麥肯錫報告顯示，數據分析70%的價值來自于B2B，30%的價值來自于B2C，所以大家都在向2B市場分析來做轉型。

　　
　　但目前B2B數據分析整個市場總量還很小，而且對數據分析的要求更高。因為單一平臺不能解決大數據的所有問題，這也有了開源與閉源技術的混合需求，構建大數據分析的生態系統，在IoT數據大量爆發的時代為各行各業提供對應的分析能力。
　　
　　IoT數據分析需要7大支撐
　　
　　IoT的快速發展讓數據分析也要更進一步，因為IoT的數據量是傳統數據的100倍，這就需要強大可擴展的數據平臺來存儲和處理這些數據；IoT的地理空間數據比例非常大，需要擁有先進的地理空間分析能力；IoT中有大量基于時間序列的時間數據需要分析，傳統SQL并不善于處理。
　　
　　數據量、地理空間數據、時間序列數據三方面都是IoT數據相比于傳統數據的不同之處。Teradata天睿公司技術官寶立明提到，隨著IoT數據的可分析也標志著我們已經真的進入了“萬物皆可分析”的時代，通過傳感器采集到的數據終于可以發揮其價值。
　　
　　構建大數據分析生態實現開源與閉源的融合
　　
　　其實在2015年TeradataPartners大會上，Teradata就提出了“萬物皆可分析”的概念。但基于傳感器的數據應用更多集中在制造業層面，所以Teradata的一個業務重點便是要向制造業轉移。當然萬物皆可分析也包含了來自各行各業的數據，如電信行業收集手機的地理位置信息，醫療行業醫療設備收集的身體指標數據等等。
　　
　　在Teradata提供的產品中對于IoT數據的分析可以分為七類，、TeradataListener框架，以實時的方式把海量的數據導入到Teradata系統；第二、利用RESTfulAPI實現各種技術平臺的對接；第三、可靠、高可伸縮的數據傳輸技術；第四、存儲技術；第五、可兼容技術；第六、壓縮技術；第七、即將推出TeradataIntelliFlex一體機產品，采用下一代海量并行處理（MPP）架構，能以非常高的經濟性，有效地進行海量數據的處理。
　　
　　除了剛剛說到的七部分，Teradata實現萬物皆可分析的基礎還是統一數據架構（UDA），其結合了Teradata的技術、開源技術、數據湖等技術。
　　
　　“我們可以將數據先放到數據湖中存儲，經過Aster進一步處理，導入到數據倉庫為BI使用。”寶立明說道，UDA中的Aster是一個非常適合處理傳感器數據的平臺，而且已經被移植到Hadoop上，既可以在文件系統上去執行，也可以在開源的數據庫上應用。
　　
　　從跳高演變看技術整合
　　
　　正如UDA的架構，開源和閉源已經實現融合，而這在之前是不可想象的。寶立明用跳高姿勢的演變舉例，在之前跳高的姿勢都是剪刀腿，而到了80年代跳高遇到了一個轉型期，背越式的出現比剪刀腿能取得更好的成績。
　　
　　這也使得越來越多的選手開始采用背越式，當然選手可以依然待在安全區，但你終不會成為贏家。通過12年的發展背越式完全取代了剪刀腿，這就如同采用新技術也是一個痛苦的過程一樣，企業需要實現商業技術和開源技術的整合。
　　
　　在15年前，Teradata就已經把數據庫產品跑在Unix、Linux開源的版本之上，一直到今天也是如此。
　　
　　在UDA的組合中不僅有開源Hadoop，寶立明還特別提到同Facebook合作研發的開源分布式SQL查詢引擎Presto，以及運行在Presto上面的QueryGrid，其可以在Hadoop平臺發起并完成跨平臺查詢，所以UDA已經是一個商業技術和開源技術融合的開放架構。
　　
　　同時Teradata也為機器學習提供一個具有高可延展性的大數據平臺，把機器學習的算法，像R、Ruby內嵌到平臺之上，供Teradata的數據科學家做各種各樣的實驗和探索，更好地找到一些成熟可商用的技術，整合到解決方案中。
　　
　　在云計算戰略上，為了和企業的應用趨勢匹配，數據分析的重心也正在向云中轉移，尤其是現在企業的業務系統逐漸前移到云端，分析也將轉移到云端。
　　
　　Teradata的原則是給客戶提供同類佳技術的選擇，AWS是目前宣布的家公有云合作伙伴，未來在MicrosoftAzure、谷歌云上都會提供服務，目標是在不同云平臺上都可以提供同樣的數據分析能力。

上一篇：視覺搜索地圖問世神經網絡實現逆向圖像搜索

下一篇：如何幫助金融企業實現大數據場景落地

我要評論

建筑孿生市場：徹底改變建筑和智能基礎設施
這一技術的核心理念源自“數字孿生”(Digital Twin)概念，即利用物聯網(IoT)、人工智能(AI)與大數據分析，構建與現實實體同步的虛擬模型。對于建筑行業而言，建筑孿生不僅是數字化管理的延伸，更是實現智能建造、綠色運維與城市智慧化管理的重要基礎設施。
人工智能大數據分析
2025-10-15 11:29:52
深入探討2024年大數據分析領域的十大新趨勢對各行各業產生哪些深遠影響
進入2024年，隨著人工智能(AI)、機器學習(ML)、邊緣計算、云計算等技術的融合，企業對數據分析的需求不僅僅局限于傳統的報告生成和趨勢發現，更多的是基于實時數據做出快速決策、預測未來發展、優化資源配置和提高客戶體驗。
大數據分析人工智能
2024-12-16 10:37:01
我國開源參與者居世界前列，鴻蒙搭載設備超9億臺
目前我國開源參與者數量、增長速度均位居世界前列；開源歐拉社區匯聚貢獻者2萬余人，用戶數量超過350萬；開源鴻蒙項目吸引340余家生態單位共建，搭載設備數量超過9億臺；木蘭中文開源許可協議實現國際通用。
開源鴻蒙搭載設備
2024-09-27 10:15:24
機遇與挑戰|研發類工業軟件開源生態發展觀察
近年來，工業軟件開源生態的國際化程度逐漸深入，開源體系建設也從平穩起步邁向加速發展的新階段。依托開源模式實現加速發展，成為新晉工業軟件廠商們選擇的重要模式，也是推動工業軟件創新的一條重要路徑。
工業軟件開源
2024-08-23 09:49:33
大數據分析如何重塑物聯網（IoT）？
大數據分析和物聯網之間的融合帶來了大量的商業機會，可以更深入地了解其運營功能及客戶偏好。讓我們來了解一下。
大數據分析物聯網
2023-02-19 09:10:30
重磅！阿里云淮北地區雙碳數字經濟產業園項目成功簽約
中國數字經濟規模占47個國家總量的18%以上，位居世界第二。有專家認為，我國數字經濟發展勢頭強勁，不同城市均被數字經濟所帶動，依據自身的優勢和方向，走出了各具特色的“數字實體經濟”結合之路。
數字經濟數據倉庫大數據分析
2023-01-05 09:28:15

版權與免責聲明：

凡本站注明“來源：智能制造網”的所有作品，均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品，未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明“來源：智能制造網”。違反上述聲明者，本站將追究其相關法律責任。

本站轉載并注明自其它來源（非智能制造網）的作品，目的在于傳遞更多信息，并不代表本站贊同其觀點或和對其真實性負責，不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時，必須保留本站注明的作品第一來源，并自負版權等法律責任。如擅自篡改為“稿件來源：智能制造網”，本站將依法追究責任。

鑒于本站稿件來源廣泛、數量較多，如涉及作品內容、版權等問題，請與本站聯系并提供相關證明材料：聯系電話：0571-89719789；郵箱：1271141964@qq.com。