5.需要實時流式計算。各種實時預警或預測已經(jīng)不是簡單的基于某一個閾值進行,而是需要通過將一個或多個設(shè)備產(chǎn)生的數(shù)據(jù)流進行實時聚合計算,不只是基于一個時間點、而是基于一個時間窗口進行計算。不僅如此,計算的需求也相當復雜,因場景而異,應(yīng)容許用戶自定義函數(shù)進行計算。6.需要支持數(shù)據(jù)訂閱。與通用大數(shù)據(jù)平臺比較一致,同一組數(shù)據(jù)往往有很多應(yīng)用都需要,因此系統(tǒng)應(yīng)該提供訂閱功能,只要有新的數(shù)據(jù)更新,就應(yīng)該實時提醒應(yīng)用。而且這個訂閱也應(yīng)該是個性化的,容許應(yīng)用設(shè)置過濾條件,比如只訂閱某個物理量五分鐘的平均值。7.實時數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實時數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲介質(zhì)里,而且可能依據(jù)時長,保留在不同存儲介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲,給用戶和應(yīng)用呈現(xiàn)的是同一個接口和界面。無論是訪問新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時間參數(shù)不同之外,其余應(yīng)該是一樣的。這些場景并不需要什么實時性,批處理即可。珠海企業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)平臺數(shù)據(jù)分析
需要支持邊云協(xié)同。要有一套靈活的機制將邊緣計算節(jié)點的數(shù)據(jù)上傳到云端,根據(jù)具體需要,可以將原始數(shù)據(jù),或加工計算后的數(shù)據(jù),或**符合過濾條件的數(shù)據(jù)同步到云端,而且隨時可以取消,更改策略。16.需要單一的后臺管理系統(tǒng)。便于查看系統(tǒng)運行狀態(tài)、管理集群、管理用戶、管理各種系統(tǒng)資源等,而且系統(tǒng)能夠與第三方IT運維監(jiān)測平臺無縫集成,便于管理。17.便于私有化部署。因為很多企業(yè)出于安全以及各種因素的考慮,希望采用私有化部署。而傳統(tǒng)的企業(yè)往往沒有很強的IT運維團隊,因此在安裝、部署上需要做到簡單、快捷,可維護性強。以上總結(jié)了物聯(lián)網(wǎng)大數(shù)據(jù)平臺的主要功能和特點,而物聯(lián)網(wǎng)大數(shù)據(jù)平臺本身也在演變之中,但總的目標不會改變,那就是高效、可伸縮、實時、可靠、靈活、開放、簡單、易維護。廣州工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)平臺監(jiān)測實時數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲介質(zhì)里,而且可能依據(jù)時長,保留在不同存儲介質(zhì)里。
數(shù)據(jù)處理:數(shù)據(jù)處理包括實時計算和離線計算兩種。TIZASTAR采用Storm作為實時處理引擎,并在它的基礎(chǔ)上包裝了自己的實時計算服務(wù),可以支持應(yīng)用層的調(diào)度和管理?;趯崟r計算服務(wù)可以很容易實現(xiàn)對物聯(lián)網(wǎng)數(shù)據(jù)的清洗、解析、報警等實時的處理。離線計算支持MapReduce和Hive等,主要用于對物聯(lián)網(wǎng)數(shù)據(jù)做日/周/月/年等多個時間維度做報表分析和數(shù)據(jù)挖掘,并將結(jié)果輸出到關(guān)系數(shù)據(jù)庫中?!駭?shù)據(jù)交換接口:數(shù)據(jù)交換接口支持SQL、Restful、Thrift和JavaAPI等,用戶可以根據(jù)實際情況靈活選擇數(shù)據(jù)交換的方式。數(shù)據(jù)交換的內(nèi)容包括物聯(lián)網(wǎng)終端的當前狀態(tài)、物聯(lián)網(wǎng)終端的歷史狀態(tài)/軌跡、指令下發(fā)、數(shù)據(jù)訂閱與發(fā)布等等?!衿脚_管理:平臺管理包括監(jiān)控報警和管理UI。監(jiān)控報警采用Ganglia和Nagios結(jié)合的形式,包括硬件級別(服務(wù)器、cpu、內(nèi)存、磁盤等)、進程級別(進程不存在、端口***異常等)、關(guān)鍵業(yè)務(wù)指標(中間隊列的元素數(shù)、網(wǎng)關(guān)建立的tcp連接數(shù)等)等三個級別。管理UI包括界面化安裝部署、用戶管理、終端管理、集群管理、數(shù)據(jù)接入管理、實時和離線計算任務(wù)界面化管理。
9.數(shù)據(jù)多維度分析需要對數(shù)據(jù)支持靈活的多維度分析。對于聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù),需要進行各種維度的統(tǒng)計分析,比如從設(shè)備所處的地域進行分析,從設(shè)備的型號、供應(yīng)商進行分析,從設(shè)備所使用的人員進行分析等等。而且這些維度的分析是無法事先想好的,而是在實際運營過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來的。因此物聯(lián)網(wǎng)大數(shù)據(jù)系統(tǒng)需要一個靈活的機制增加某個維度的分析。10.支持數(shù)據(jù)計算需要支持數(shù)據(jù)降頻、插值、特殊函數(shù)計算等操作。原始數(shù)據(jù)的采集可能頻次挺高,但具體分析時,往往不需要對原始收據(jù)進行,而是數(shù)據(jù)降頻之后。系統(tǒng)需要提供高效的數(shù)據(jù)降頻操作。設(shè)備是很難同步的,不同設(shè)備采集數(shù)據(jù)的時間點是很難對齊的,因此分析一個特定時間點的值,往往需要插值才能解決,系統(tǒng)需要提供線性插值、設(shè)置固定值等多種插值策略才行。工業(yè)互聯(lián)網(wǎng)里,除通用的統(tǒng)計操作之外,往往還需要支持一些特殊函數(shù),比如時間加權(quán)平均。上海物聯(lián)網(wǎng)大數(shù)據(jù)平臺哪家好?
而且這個訂閱也應(yīng)該是個性化的,容許應(yīng)用設(shè)置過濾條件,比如只訂閱某個物理量五分鐘的平均值。7.和歷史數(shù)據(jù)處理合二為一實時數(shù)據(jù)和歷史數(shù)據(jù)的處理要合二為一。實時數(shù)據(jù)在緩存里,歷史數(shù)據(jù)在持久化存儲介質(zhì)里,而且可能依據(jù)時長,保留在不同存儲介質(zhì)里。系統(tǒng)應(yīng)該隱藏背后的存儲,給用戶和應(yīng)用呈現(xiàn)的是同一個接口和界面。無論是訪問新采集的數(shù)據(jù)還是十年前的老數(shù)據(jù),除輸入的時間參數(shù)不同之外,其余應(yīng)該是一樣的。8.數(shù)據(jù)持續(xù)穩(wěn)定寫入需要保證數(shù)據(jù)能持續(xù)穩(wěn)定寫入。對于物聯(lián)網(wǎng)系統(tǒng),數(shù)據(jù)流量往往是平穩(wěn)的,因此數(shù)據(jù)寫入所需要的資源往往是可以估算的。但是變化的是查詢、分析,特別是即席查詢,有可能耗費很大的系統(tǒng)資源,不可控。因此系統(tǒng)必須保證分配足夠的資源以確保數(shù)據(jù)能夠?qū)懭胂到y(tǒng)而不被丟失。準確的說,系統(tǒng)必須是一個寫優(yōu)先系統(tǒng)。9.數(shù)據(jù)多維度分析需要對數(shù)據(jù)支持靈活的多維度分析。對于聯(lián)網(wǎng)設(shè)備產(chǎn)生的數(shù)據(jù),需要進行各種維度的統(tǒng)計分析,比如從設(shè)備所處的地域進行分析,從設(shè)備的型號、供應(yīng)商進行分析,從設(shè)備所使用的人員進行分析等等。而且這些維度的分析是無法事先想好的,而是在實際運營過程中,根據(jù)業(yè)務(wù)發(fā)展的需求定下來的。因此物聯(lián)網(wǎng)大數(shù)據(jù)系統(tǒng)需要一個靈活的機制增加某個維度的分析。金華高效物聯(lián)網(wǎng)大數(shù)據(jù)平臺哪家好
需要支持數(shù)據(jù)降頻、插值、特殊函數(shù)計算等操作。珠海企業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)平臺數(shù)據(jù)分析
物聯(lián)網(wǎng)是一個很寬泛的概念,是指各種設(shè)備、機器都通過互聯(lián)網(wǎng)連接起來,車聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)等都屬于物聯(lián)網(wǎng)范疇。聯(lián)網(wǎng)的設(shè)備在2019年已經(jīng)超過142億,預計2021年將達到250億,這是一個巨大的數(shù)量。毫無疑問,我們需要一個物聯(lián)網(wǎng)大數(shù)據(jù)平臺來處理這些聯(lián)網(wǎng)設(shè)備產(chǎn)生的海量數(shù)據(jù)。1.必須是高效的分布式系統(tǒng)。物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量巨大,*中國而言,就有5億多臺智能電表,每臺電表每隔15分鐘采集一次數(shù)據(jù),***全國智能電表就會產(chǎn)生500多億條記錄。這么大的數(shù)據(jù)量,任何一臺服務(wù)器都無能力處理,因此處理系統(tǒng)必須是分布式的,水平擴展的。為降低成本,一個節(jié)點的處理性能必須是高效的,需要支持數(shù)據(jù)的快速寫入和快速查詢。珠海企業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)平臺數(shù)據(jù)分析