阿里云數(shù)據(jù)庫(kù)多少錢一年 大數(shù)據(jù)和商業(yè)智能的關(guān)系是什么?
大數(shù)據(jù)和商業(yè)智能的關(guān)系是什么?大數(shù)據(jù)和商業(yè)智能BI的關(guān)系從應(yīng)用上來(lái)講,BI(BusinessIntelligence)即商業(yè)智能,它是一套完整的解決方案,用來(lái)將企業(yè)中現(xiàn)有的數(shù)據(jù)進(jìn)行有效的整合,快速準(zhǔn)確
大數(shù)據(jù)和商業(yè)智能的關(guān)系是什么?
大數(shù)據(jù)和商業(yè)智能BI的關(guān)系從應(yīng)用上來(lái)講,BI(BusinessIntelligence)即商業(yè)智能,它是一套完整的解決方案,用來(lái)將企業(yè)中現(xiàn)有的數(shù)據(jù)進(jìn)行有效的整合,快速準(zhǔn)確的提供報(bào)表并提出決策依據(jù),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營(yíng)決策。
商業(yè)智能BI在數(shù)據(jù)架構(gòu)中處于前端分析的位置,其核心作用是對(duì)獲取數(shù)據(jù)的多維度分析、數(shù)據(jù)的切片、數(shù)據(jù)的上鉆和下鉆、cube等。通過(guò)ETL數(shù)據(jù)抽取、轉(zhuǎn)化形成一個(gè)完整的數(shù)據(jù)倉(cāng)庫(kù)、然后對(duì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)進(jìn)行抽取,而后是商業(yè)智能的前端分析和展示。
商業(yè)智能BI處理的數(shù)據(jù)量是極大的,如 FineBI商業(yè)智能,自帶ETL,可在短時(shí)間內(nèi)響應(yīng)數(shù)據(jù)處理的請(qǐng)求,并輸出分析結(jié)果。
BI對(duì)穩(wěn)定性以及易用性有一定要求,這是其他數(shù)據(jù)分析工具所不能比擬的。
大數(shù)據(jù)的應(yīng)用的數(shù)據(jù)來(lái)源包括結(jié)構(gòu)化數(shù)據(jù),如各種數(shù)據(jù)庫(kù)、各種結(jié)構(gòu)化文件、消息隊(duì)列和應(yīng)用系統(tǒng)數(shù)據(jù)等,其次才是非結(jié)構(gòu)化數(shù)據(jù)。
國(guó)內(nèi)銀行系統(tǒng)用美國(guó)甲骨文Oracle數(shù)據(jù)庫(kù)不怕泄密嗎?
典型的總有刁民想害朕的心態(tài)[靈光一閃]
為什么傳統(tǒng)行業(yè)幾乎都用Oracle,而互聯(lián)網(wǎng)行業(yè)幾乎都不用Oracle呢?
首先銀行要求絕對(duì)穩(wěn)定性,使用付費(fèi)不開源產(chǎn)品可以完全責(zé)任委托,而且數(shù)據(jù)庫(kù)廠商還會(huì)有專門維護(hù),省心,省力,安全。
mysql呢,開源產(chǎn)品,穩(wěn)定性沒(méi)有o高,如果要深度開發(fā)倒是很省事,不過(guò)使用mysql就完全要看自己了,銀行不會(huì)為了一個(gè)隨時(shí)都有可能出現(xiàn)意外的定時(shí)炸彈找專門團(tuán)隊(duì)維護(hù),而且銀行交易量很大,但并非像互聯(lián)網(wǎng)應(yīng)用一樣超級(jí)并發(fā),大部分都是內(nèi)部接口使用,而且分地區(qū)都是不同的服務(wù)器,每個(gè)地區(qū)只存儲(chǔ)自己相關(guān)的數(shù)據(jù),比如你從廣東給山東異地轉(zhuǎn)賬,原始山東賬戶里并不存你的記錄,轉(zhuǎn)了之后山東數(shù)據(jù)庫(kù)才有記錄,在依賴oracle商業(yè)委托的基礎(chǔ)下,銀行還會(huì)有對(duì)賬,來(lái)保證數(shù)據(jù)一致性。
但是反觀互聯(lián)網(wǎng)企業(yè)就不一樣了,超級(jí)并發(fā),小型機(jī)已經(jīng)不滿足這種并發(fā)條件了,哪怕oracle足夠優(yōu)秀,所以要使用應(yīng)對(duì)更高并發(fā)特制的mysql,需要有專業(yè)的團(tuán)隊(duì)進(jìn)行維護(hù),穩(wěn)定性不如oracle,不過(guò)分布式集群可以避免這種情況。而且mysql因?yàn)殚_源還可以針對(duì)自己的需求特制功能。不過(guò)大部分企業(yè)用不上[捂臉],小公司用啥都一樣。阿里重新開發(fā)mysql除了自己用外還可以賣服務(wù)。
再說(shuō)一句,阿里其實(shí)棄o選m其實(shí)除了并發(fā)問(wèn)題,還因?yàn)閛racle太貴,因?yàn)槠髽I(yè)要考慮收支,就算阿里利潤(rùn)率也比不上銀行[靈光一閃]
Facebook用戶量十分龐大,為什么還使用MySQL數(shù)據(jù)庫(kù)?
盡管Facebook使用MySQL,但它們并不是一成不變的使用它。 事實(shí)上,他們的團(tuán)隊(duì)已經(jīng)提交了許多MySQL核心和Innodb插件的高性能增強(qiáng)。 他們的主要重點(diǎn)是增加性能計(jì)數(shù)器到Innodb。 其他更改集中在IO子系統(tǒng)上,包括以下新功能:
1 innodb_io_capacity:設(shè)置服務(wù)器的IO容量以確定后臺(tái)IO的速率限制
2 innodb_read_io_threads, innodb_write_io_threads:設(shè)置后臺(tái)IO線程
3 innodb_max_merged_io:設(shè)置可能合并到一個(gè)大IO請(qǐng)求中的相鄰IO請(qǐng)求的最大數(shù)量
Facebook使用MySQL作為鍵值存儲(chǔ),其中數(shù)據(jù)隨機(jī)分布在一大組邏輯實(shí)例中。 這些邏輯實(shí)例分散在物理節(jié)點(diǎn)之間,負(fù)載均衡在物理節(jié)點(diǎn)級(jí)完成。 Facebook已經(jīng)開發(fā)了一個(gè)分區(qū)方案,其中全局ID被分配給所有的用戶數(shù)據(jù)。 他們也有一個(gè)自定義的歸檔方案,它基于每個(gè)用戶的頻繁和最近的數(shù)據(jù)。 大部分?jǐn)?shù)據(jù)是隨機(jī)分布的。 令人驚訝的是,據(jù)傳Facebook有1800個(gè)MySQL服務(wù)器,但只有3個(gè)全職DBA
Facebook主要將MySQL用于結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),例如墻貼,用戶信息等。這些數(shù)據(jù)在各個(gè)數(shù)據(jù)中心之間復(fù)制。 對(duì)于blob存儲(chǔ)(照片,視頻等),F(xiàn)acebook使用一個(gè)自定義的解決方案,涉及外部的CDN和內(nèi)部的NFS
同樣重要的是,F(xiàn)acebook大量使用Memcache,這是一種內(nèi)存緩存系統(tǒng),通過(guò)在RAM中緩存數(shù)據(jù)和對(duì)象來(lái)加速動(dòng)態(tài)數(shù)據(jù)庫(kù)驅(qū)動(dòng)的網(wǎng)站,以減少閱讀時(shí)間。 Memcache是Facebook的主要緩存形式,大大減少了數(shù)據(jù)庫(kù)的負(fù)載。 擁有一個(gè)緩存系統(tǒng)可以使Facebook的速度與調(diào)用數(shù)據(jù)一樣快。 如果不需要訪問(wèn)數(shù)據(jù)庫(kù),則只需根據(jù)用戶標(biāo)識(shí)從緩存中獲取數(shù)據(jù)
所以,“Facebook使用什么數(shù)據(jù)庫(kù)”似乎是一個(gè)簡(jiǎn)單的問(wèn)題,你可以看到他們已經(jīng)添加了各種其他系統(tǒng),使其真正的具有網(wǎng)絡(luò)可擴(kuò)展性。 但是,仍然可以自由地使用這樣一個(gè)觀點(diǎn):“MySQL和Oracle或者M(jìn)S SQL Server一樣好或者更好,因?yàn)榫退阒挥蠪acebook使用它,它也有5億用戶!”