林子雨 大數(shù)據(jù)課程 想自學(xué)大數(shù)據(jù),不知道從哪里學(xué)起,有什么書籍和學(xué)習(xí)路線推薦么?
想自學(xué)大數(shù)據(jù),不知道從哪里學(xué)起,有什么書籍和學(xué)習(xí)路線推薦么?謝謝!筆者剛剛簽了一份大數(shù)據(jù)挖掘工程師的合同,到了研究生階段才轉(zhuǎn)向大數(shù)據(jù)方向。目前大數(shù)據(jù)火爆,很多學(xué)生都想上交,但自學(xué)的學(xué)習(xí)路線因人而異。以
想自學(xué)大數(shù)據(jù),不知道從哪里學(xué)起,有什么書籍和學(xué)習(xí)路線推薦么?
謝謝!筆者剛剛簽了一份大數(shù)據(jù)挖掘工程師的合同,到了研究生階段才轉(zhuǎn)向大數(shù)據(jù)方向。目前大數(shù)據(jù)火爆,很多學(xué)生都想上交,但自學(xué)的學(xué)習(xí)路線因人而異。
以我自己為例,作者出生于Python數(shù)據(jù)分析領(lǐng)域,具有通用編程能力。因此,在此基礎(chǔ)上,他首先學(xué)習(xí)了Linux的基本操作命令,安裝了Ubuntu的雙系統(tǒng),并進(jìn)一步安裝了Hadoop和spark組件。在此基礎(chǔ)上,他利用pypark操作spark大數(shù)據(jù)框架進(jìn)行學(xué)習(xí)。您可以推薦以下書籍:
pypark實(shí)用指南
,由淺入深,非常好用。
想做大數(shù)據(jù)處理分析,該專注于學(xué)spark還是深度學(xué)習(xí)呢?
Spark是一種工具,而深度學(xué)習(xí)是一種解決問題的策略。如果做大數(shù)據(jù)分析,至少要熟練使用一種工具,深入了解常用的算法。對(duì)于大數(shù)據(jù)分析,您不需要在代碼級(jí)別和架構(gòu)級(jí)別熟悉spark。因?yàn)樗皇且粋€(gè)工具,你可以熟練地使用它。如果主題有很好的編程基礎(chǔ),一個(gè)月就足夠?qū)W好SPARKSQL和SPARKML了。算法學(xué)習(xí)需要花費(fèi)更多的精力。但如果受試者想學(xué)習(xí)深度學(xué)習(xí),則不建議學(xué)習(xí)spark。由于目前常用的CNN、RNN等模型通常使用GPU代替CPU進(jìn)行計(jì)算,而spark是一種內(nèi)存計(jì)算框架,主要在CPU上完成計(jì)算,因此計(jì)算效率不如GPU高。因此,如果將深度學(xué)習(xí)用于大數(shù)據(jù)分析,則可以使用tensorflow和其他框架。
哪些spark大數(shù)據(jù)開發(fā)的實(shí)例可以用來快速入門?
在我的標(biāo)題中查找案例?
根據(jù)當(dāng)前的市場發(fā)展,大數(shù)據(jù)的學(xué)習(xí)需要一定的編程基礎(chǔ)。現(xiàn)在主流的是Java和python,但是大部分都是在實(shí)際工作中使用的,這是很多大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)推出的Java編程大數(shù)據(jù)開發(fā)培訓(xùn)課程,所以從這個(gè)角度來說,我們還是需要一些基礎(chǔ)的Java編程。但是,許多想要參與大數(shù)據(jù)培訓(xùn)和學(xué)習(xí)的小伙伴現(xiàn)在沒有編程基礎(chǔ),他們中的大多數(shù)想要從其他行業(yè)切換到大數(shù)據(jù)。他們能在沒有編程基礎(chǔ)的情況下學(xué)習(xí)大數(shù)據(jù)嗎?!對(duì)于零基礎(chǔ)的學(xué)生,他們不需要擔(dān)心他們將無法學(xué)習(xí)沒有java或Python相關(guān)編程語言的大數(shù)據(jù)。該培訓(xùn)機(jī)構(gòu)還設(shè)有專門為零基礎(chǔ)學(xué)生設(shè)計(jì)的大數(shù)據(jù)培訓(xùn)課程。在早期階段,他們首先學(xué)習(xí)java編程或python編程。在掌握了一些必要的編程基礎(chǔ)之后,他們就可以這樣學(xué)習(xí)大數(shù)據(jù),大數(shù)據(jù)學(xué)習(xí)就可以順利進(jìn)行。
因此,我們?cè)趯W(xué)習(xí)大數(shù)據(jù)的時(shí)候,也要注意課程的安排,并考慮如何根據(jù)自己的情況和大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)的課程安排來選擇。如果我們從事java或Python相關(guān)的開發(fā)已經(jīng)有一定的基礎(chǔ),那么就沒有必要學(xué)習(xí)相關(guān)內(nèi)容,直接選擇學(xué)習(xí)大數(shù)據(jù)技術(shù),比如如果你是一個(gè)零基的學(xué)生,你應(yīng)該選擇一個(gè)用java或Python基金會(huì)的課程。以上是蕭邊對(duì)“學(xué)習(xí)大數(shù)據(jù)需要什么基礎(chǔ)”的理解?這個(gè)問題的答案,希望對(duì)您有所幫助,如果您有任何疑問,可以留言交流。
學(xué)習(xí)大數(shù)據(jù)需要什么基礎(chǔ)?
Spark是用功能強(qiáng)大的Scala語言開發(fā)的。它還支持斯卡拉、Python、java(java 8支持)和R.!一般來說,如果你有java或Python基金會(huì),你可以學(xué)習(xí)SARD的RDD操作符操作,并執(zhí)行開發(fā)任務(wù)。