人工智能十大算法 本科非計算機系,想去研究大數據,我該自學什么?python還是c語言?
本科非計算機系,想去研究大數據,我該自學什么?python還是c語言?第一步:統(tǒng)計概率的理論基礎這是最重要的。它從地基土開始,最重要的是底層。統(tǒng)計思維、統(tǒng)計方法,這里先是對市場調研數據的采集和整理,然
本科非計算機系,想去研究大數據,我該自學什么?python還是c語言?
第一步:統(tǒng)計概率的理論基礎
這是最重要的。它從地基土開始,最重要的是底層。統(tǒng)計思維、統(tǒng)計方法,這里先是對市場調研數據的采集和整理,然后是最簡單的描述性分析,接下來是常用的推理分析、方差分析,再到高級相關、回歸等多元統(tǒng)計分析,掌握這些原理,就可以進行下一步。
第二步:軟件操作結合分析模型進行實際應用
數據分析的主流軟件有(由淺入深):Excel、SPSS、Stata、R、SAS等。首先,學習如何操作這些軟件,然后從數據清洗開始,利用軟件對數據進行一步一步的處理和分析,最后輸出結果,測試和解釋數據。
第三步:數據挖掘或數據分析方向選擇
事實上,數據分析也包括數據挖掘,但在工作中,會細分為分析方向和挖掘方向。兩者之間有區(qū)別。數據挖掘還涉及到很多模型算法,如關聯規(guī)則、神經網絡、決策樹、遺傳算法、可視化技術等
第四步:數據分析和業(yè)務應用
這一步也是最難學的。采用不同行業(yè)、不同業(yè)務、不同分析方法。實際工作就是解決業(yè)務問題,所以對業(yè)務的洞察非常重要,這種能力需要在工作中一點一點積累。也許我們現在用一些回歸的方法來做零售會有幫助,但是當我們轉向電子商務的時候,我們會用其他的挖掘方法。雖然業(yè)務是千變萬化的,但是分析方法總是在變化的,所以掌握技術和使用任何環(huán)境只取決于業(yè)務經驗的積累。