張量分解定理 張量分解如何應(yīng)用于數(shù)據(jù)挖掘?
張量分解如何應(yīng)用于數(shù)據(jù)挖掘?舉一個(gè)非常簡(jiǎn)單的例子。首先構(gòu)造目標(biāo)數(shù)據(jù)集的張量,然后對(duì)張量進(jìn)行分解。這里的分解就是精確的截距分解。數(shù)據(jù)恢復(fù)后,恢復(fù)的數(shù)據(jù)并不完全等于原始數(shù)據(jù)。一些沒(méi)有數(shù)據(jù)的地方有新的數(shù)據(jù)。
張量分解如何應(yīng)用于數(shù)據(jù)挖掘?
舉一個(gè)非常簡(jiǎn)單的例子。
首先構(gòu)造目標(biāo)數(shù)據(jù)集的張量,然后對(duì)張量進(jìn)行分解。這里的分解就是精確的截距分解。數(shù)據(jù)恢復(fù)后,恢復(fù)的數(shù)據(jù)并不完全等于原始數(shù)據(jù)。一些沒(méi)有數(shù)據(jù)的地方有新的數(shù)據(jù)。這種方法通常用于數(shù)據(jù)補(bǔ)全,當(dāng)然也可以用于推薦系統(tǒng)等。
計(jì)算機(jī)編程算法和數(shù)學(xué)有什么關(guān)系?
數(shù)學(xué)對(duì)于計(jì)算機(jī)算法編程非常重要。我將主要從以下兩個(gè)方面來(lái)解釋為什么它如此重要
數(shù)學(xué)和算法編程需要很強(qiáng)的邏輯思維能力。程序代碼的邏輯結(jié)構(gòu)、連接方式和處理方式需要較強(qiáng)的邏輯思維能力。如果你學(xué)好數(shù)學(xué),有很強(qiáng)的邏輯思維能力,你通常會(huì)對(duì)算法編程有更深的理解。
這應(yīng)該是為什么數(shù)學(xué)和算法編程更相關(guān)的一個(gè)重要原因。無(wú)論是計(jì)算機(jī)的底層還是底層,數(shù)學(xué)知識(shí)都處處體現(xiàn)。例如,計(jì)算機(jī)底層的二進(jìn)制、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的梯度求導(dǎo)、SVD分解、張量分解、PCA特征值、優(yōu)化問(wèn)題、密碼學(xué)的大數(shù)分解、概率圖模型等都與數(shù)學(xué)有著密切的關(guān)系。我舉兩個(gè)例子來(lái)實(shí)現(xiàn)
代碼實(shí)現(xiàn)如下
代碼比(float)(1.0/sqrt(x))快4倍,計(jì)算性能有了質(zhì)的飛躍。為此,專(zhuān)門(mén)有一篇論文《快速平方根逆》來(lái)解釋這段代碼的數(shù)學(xué)原理。感興趣的同學(xué)可以找這篇文章學(xué)習(xí)。
如果不直接使用數(shù)學(xué)知識(shí)和搜索,時(shí)間復(fù)雜度為O(n),效率較低,很難按照目前的計(jì)算機(jī)水平進(jìn)行計(jì)算。如果我們知道Brahmagupta–Fibonacci恒等式、Pollard-Rho分解法、二次同余方程的解、歐氏除法等數(shù)學(xué)知識(shí),那么求解這個(gè)問(wèn)題的時(shí)間復(fù)雜度就大大降低,結(jié)果保證在0.2秒之內(nèi)。
如果工作是算法崗位,數(shù)學(xué)更重要,因?yàn)闄C(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、NLP等方向的基本原理基本上都離不開(kāi)數(shù)學(xué)。
機(jī)器學(xué)習(xí)需要哪些數(shù)學(xué)基礎(chǔ)?
主要是線(xiàn)性代數(shù)和概率論。
現(xiàn)在最流行的機(jī)器學(xué)習(xí)模型,神經(jīng)網(wǎng)絡(luò)基本上有很多向量、矩陣、張量。從激活函數(shù)到損失函數(shù),從反向傳播到梯度下降,都是對(duì)這些向量、矩陣和張量的運(yùn)算和操作。
其他“傳統(tǒng)”機(jī)器學(xué)習(xí)算法也使用大量線(xiàn)性代數(shù)。例如,線(xiàn)性回歸與線(xiàn)性代數(shù)密切相關(guān)。
從線(xiàn)性代數(shù)的觀點(diǎn)來(lái)看,主成分分析是對(duì)協(xié)方差矩陣進(jìn)行對(duì)角化。
尤其是當(dāng)你讀論文或想更深入的時(shí)候,概率論的知識(shí)是非常有用的。
它包括邊緣概率、鏈?zhǔn)揭?guī)則、期望、貝葉斯推理、最大似然、最大后驗(yàn)概率、自信息、香農(nóng)熵、KL散度等。
神經(jīng)網(wǎng)絡(luò)非常講究“可微性”,因?yàn)榭晌⒛P涂梢杂锰荻认陆捣▋?yōu)化。梯度下降和導(dǎo)數(shù)是分不開(kāi)的。所以多元微積分也需要。另外,由于機(jī)器學(xué)習(xí)是以統(tǒng)計(jì)方法為基礎(chǔ)的,因此統(tǒng)計(jì)知識(shí)是必不可少的。但是,大多數(shù)理工科專(zhuān)業(yè)學(xué)生都應(yīng)該學(xué)過(guò)這兩部分內(nèi)容,所以這可能不屬于需要補(bǔ)充的內(nèi)容。
量子糾纏的速度是光速的起碼10000倍,違反相對(duì)論嗎?
當(dāng)然,違反相對(duì)論的原因是相對(duì)論有邊界條件,假設(shè)光子或量子的質(zhì)量為零,光速是宇宙中的最大速度。然而,黑洞可以吸入光子或量子的事實(shí)證明了它們的質(zhì)量不是零,但我們目前的技術(shù)無(wú)法探測(cè)光子或量子的質(zhì)量。
量子是能量與物質(zhì)臨界點(diǎn)的最小單位,因此量子糾纏是能量與質(zhì)量之間的相互制約或包容,其中糾纏速度應(yīng)該是能量的傳播速度,這是宇宙中真正的最大速度。
至于量子的糾纏速度是光速的10000倍還是多少倍,目前還不得而知。要理解這一點(diǎn),我們必須首先找出以下問(wèn)題:
1。能量的本質(zhì)是什么?
我們?cè)鯓硬拍苷业郊兡芰炕虬的芰?。我們目前?duì)能量的理解是依賴(lài)于物質(zhì)的能量。例如,太陽(yáng)能是依靠空氣、水和地球上其他物體的能量,來(lái)自太陽(yáng)輻射。化學(xué)能是依賴(lài)于原子間化學(xué)鍵的能量。核能是依賴(lài)于原子核中粒子結(jié)合的能量,而生物能是依賴(lài)于生物體的能量,等等。那么純能量在哪里呢?你怎么看?
3. 我們?nèi)绾巍安蹲健奔兡芰炕虬的芰浚?/p>
閃電的真正形成機(jī)制可能是大自然給我們的“抓住”暗能量的暗示之一。現(xiàn)在雷達(dá)的形成機(jī)理是空氣中的正負(fù)粒子分別聚集在云層的上下層,最終達(dá)到放電狀態(tài)。這是事實(shí)嗎?暗能量與此有關(guān)嗎?如果是這樣,是什么物質(zhì)或粒子使暗能量參與閃電能量的聚集?
如果我們把以上三個(gè)方面搞清楚,我們的人類(lèi)科學(xué)技術(shù)就會(huì)向前邁出一大步,突破目前所有的技術(shù)瓶頸。
應(yīng)該指出的是,除了由于錯(cuò)誤的假設(shè)而導(dǎo)致的相對(duì)論的局限性之外,我們對(duì)溫度沒(méi)有上限的理解是錯(cuò)誤的。
溫度有一個(gè)上限,即能將物質(zhì)(包括量子)完全轉(zhuǎn)化為能量的溫度,即自然界或宇宙的溫度上限。氣溫上限約為數(shù)億攝氏度至數(shù)十億攝氏度。確切的溫度正在等待科學(xué)的解釋。