百度大數(shù)據(jù)查詢平臺(tái) 大數(shù)據(jù)在科研上的應(yīng)用有哪些?
大數(shù)據(jù)在科研上的應(yīng)用有哪些?大數(shù)據(jù)可以對(duì)科研有以下幫助:· 大型強(qiáng)子對(duì)撞機(jī)實(shí)驗(yàn)代表約 1.5 億個(gè)傳感器每秒提供 4000 萬次數(shù)據(jù)。每秒有近 6 億次碰撞。經(jīng)過篩選并避免記錄超過 99.9
大數(shù)據(jù)在科研上的應(yīng)用有哪些?
大數(shù)據(jù)可以對(duì)科研有以下幫助:
· 大型強(qiáng)子對(duì)撞機(jī)實(shí)驗(yàn)代表約 1.5 億個(gè)傳感器每秒提供 4000 萬次數(shù)據(jù)。每秒有近 6 億次碰撞。經(jīng)過篩選并避免記錄超過 99.99995% 的這些數(shù)據(jù)流后,每秒有 100 個(gè)目標(biāo)的沖突。
因此,僅使用小于 0.001% 的傳感器數(shù)據(jù)流,來自所有四個(gè) LHC 實(shí)驗(yàn)的數(shù)據(jù)流在復(fù)制之前的年度速率為 25 PB(截至 2012 年)。復(fù)制后這將變成近 200 PB。
如果所有傳感器數(shù)據(jù)都記錄在 LHC 中,那么數(shù)據(jù)流將非常難以處理。在復(fù)制之前,數(shù)據(jù)流量每年將超過 1.5 億 PB,或者將近 500 EBabytestes。以數(shù)字來看,這相當(dāng)于每天500 個(gè)字節(jié)(5×1020)字節(jié),幾乎是世界上所有其他來源的 200 倍。
· Square Kilometer Array 是由數(shù)千個(gè)天線構(gòu)成的射電望遠(yuǎn)鏡。預(yù)計(jì)到2024年將投入使用。總的來說,這些天線預(yù)計(jì)將收集 14 EB 字節(jié),并且每天存儲(chǔ) 1 PB 字節(jié),這被認(rèn)為是有史以來最雄心勃勃的科學(xué)計(jì)劃之一。 · 當(dāng)斯隆數(shù)字巡天(SDSS)在 2000 年開始收集天文數(shù)據(jù)時(shí),它在頭幾周收集的數(shù)據(jù)比以前天文學(xué)歷史上收集的數(shù)據(jù)要多。 SDSS 以每晚 200GB 的速度繼續(xù)運(yùn)行,累積了超過 140TB 的信息。當(dāng) SDSS 的繼任者,大型綜合測(cè)量望遠(yuǎn)鏡在 2020 年上線時(shí),其設(shè)計(jì)人員預(yù)計(jì)它將每五天獲取一次該數(shù)據(jù)量。
· 解碼人類基因組原本需要 10 年 的時(shí)間來處理,現(xiàn)在可以在不到一天的時(shí)間內(nèi)完成。在過去的十年中,DNA 測(cè)序儀已經(jīng)將測(cè)序成本減少了10,000,這比按照摩爾定律預(yù)測(cè)的成本降低便宜了 100 倍 。
了解更多硅谷前沿深度訊息請(qǐng)看 硅發(fā)布 微信公眾號(hào)