從上述定義可以看出,大數(shù)據(jù)并不僅僅是數(shù)據(jù)本身,還包括大數(shù)據(jù)技術(shù)以及應(yīng)用。從數(shù)據(jù)本身的角度出發(fā),大數(shù)據(jù)是指大小、形態(tài)超出常規(guī)數(shù)據(jù)管理系統(tǒng)采集、存儲(chǔ)、管理和分析能力的規(guī)模較大的數(shù)據(jù)集,同時(shí)這些數(shù)據(jù)間存在著直接或間接的關(guān)聯(lián),利用者通過(guò)大數(shù)據(jù)技術(shù)從而實(shí)現(xiàn)數(shù)據(jù)隱藏信息的挖掘和展示。根據(jù)來(lái)源的不同,大數(shù)據(jù)大致可分為以下3類:
(1)來(lái)源于人:人們?cè)诨ヂ?lián)網(wǎng)以及移動(dòng)互聯(lián)網(wǎng)活動(dòng)中所產(chǎn)生的文字、圖片、視頻等數(shù)據(jù)。
(2)來(lái)源于機(jī)器:以文件、數(shù)據(jù)庫(kù)、多媒體等形式存在的計(jì)算機(jī)信息系統(tǒng)產(chǎn)生的數(shù)據(jù)。
(3)來(lái)源于物聯(lián)網(wǎng)智能終端:隨著物聯(lián)網(wǎng)智能終端盼陜速部署,各類物聯(lián)網(wǎng)智能終端所采集的數(shù)據(jù),包括智能攝像頭采集的視頻、車聯(lián)網(wǎng)產(chǎn)生的各種實(shí)時(shí)交通流量、各種可穿戴設(shè)備收集人體的各種健康指數(shù)監(jiān)控等。
大數(shù)據(jù)技術(shù)包括數(shù)據(jù)采集、預(yù)處理、存儲(chǔ)、處理、分析和可視化,是將數(shù)據(jù)中的信息挖掘并展示的一系列技術(shù)和手段。
大數(shù)據(jù)應(yīng)用則是對(duì)特定的大數(shù)據(jù)集,使用大數(shù)據(jù)技術(shù)和手段,實(shí)現(xiàn)有效信息的獲取過(guò)程。大數(shù)據(jù)技術(shù)研究的最終目標(biāo)就是從規(guī)模龐大的數(shù)據(jù)集中發(fā)現(xiàn)新的模式與知識(shí),從而挖掘到數(shù)據(jù)隱藏的有價(jià)值的新信息。