當(dāng)前位置: 首頁(yè) > 工業(yè)控制產(chǎn)品 > 自動(dòng)化控制 > 人工智能
發(fā)布日期:2022-10-09 點(diǎn)擊率:52
目前的深度學(xué)習(xí)主要是建立在大數(shù)據(jù)的基礎(chǔ)上,即對(duì)大數(shù)據(jù)進(jìn)行訓(xùn)練,并從中歸納出可以被計(jì)算機(jī)運(yùn)用在類似數(shù)據(jù)上的知識(shí)或規(guī)律。那么,到底什么是大數(shù)據(jù)呢?
人們經(jīng)常籠統(tǒng)地說,大數(shù)據(jù)就是大規(guī)模的數(shù)據(jù)。
這個(gè)說法并不準(zhǔn)確。“大規(guī)模”只是指數(shù)據(jù)的量而言。數(shù)據(jù)量大,并不代表著數(shù)據(jù)一定有可以被深度學(xué)習(xí)算法利用的價(jià)值。例如,地球繞太陽(yáng)運(yùn)轉(zhuǎn)的過程中,每一秒鐘記錄一次地球相對(duì)太陽(yáng)的運(yùn)動(dòng)速度、位置,可以得到大量數(shù)據(jù)。可如果只有這樣的數(shù)據(jù),其實(shí)并沒有太多可以挖掘的價(jià)值,因?yàn)榈厍驀@太陽(yáng)運(yùn)轉(zhuǎn)的物理規(guī)律,人們已經(jīng)研究得比較清楚了。
那么,大數(shù)據(jù)到底是什么?大數(shù)據(jù)是如何產(chǎn)生的?什么樣的數(shù)據(jù)才最有價(jià)值,最適合作為計(jì)算機(jī)的學(xué)習(xí)對(duì)象呢?
根據(jù)馬丁·希爾伯特的總結(jié),今天我們常說的大數(shù)據(jù)其實(shí)是在2000年后,因?yàn)樾畔⒔粨Q、信息存儲(chǔ)、信息處理三個(gè)方面能力的大幅增長(zhǎng)而產(chǎn)生的數(shù)據(jù):
信息交換:據(jù)估算,從1986年到2007年這20年間,地球上每天可以通過既有信息通道交換的信息數(shù)量增長(zhǎng)了約217倍,這些信息的數(shù)字化程度,則從1986年的約20%增長(zhǎng)到2007年的約99.9%。在數(shù)字化信息爆炸式增長(zhǎng)的過程里,每個(gè)參與信息交換的節(jié)點(diǎn)都可以在短時(shí)間內(nèi)接收并存儲(chǔ)大量數(shù)據(jù)。
信息存儲(chǔ):全球信息存儲(chǔ)能力大約每3年翻一番。從1986年到2007年這20年間,全球信息存儲(chǔ)能力增加了約120倍,所存儲(chǔ)信息的數(shù)字化程度也從1986年的約1%增長(zhǎng)到2007年的約94%。1986年時(shí),即便用上我們所有的信息載體、存儲(chǔ)手段,我們也不過能存儲(chǔ)全世界所交換信息的大約1%,而2007年這個(gè)數(shù)字已經(jīng)增長(zhǎng)到大約16%。信息存儲(chǔ)能力的增加為我們利用大數(shù)據(jù)提供了近乎無限的想象空間。
信息處理:有了海量的信息獲取能力和信息存儲(chǔ)能力,我們也必須有對(duì)這些信息進(jìn)行整理、加工和分析的能力。谷歌、Facebook等公司在數(shù)據(jù)量逐漸增大的同時(shí),也相應(yīng)建立了靈活、強(qiáng)大的分布式數(shù)據(jù)處理集群。
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV