java區(qū)間怎么表示 搜索引擎能如此快速的在全網(wǎng)范圍內(nèi)檢索并抓取關(guān)鍵字,是怎么做到的?
搜索引擎能如此快速的在全網(wǎng)范圍內(nèi)檢索并抓取關(guān)鍵字,是怎么做到的?要回答這個(gè)問(wèn)題,讓我們玩一個(gè)游戲。游戲規(guī)則如下:1。A提前在一張紙上寫(xiě)一個(gè)小于1000的數(shù)字。B不知道。B會(huì)猜到的。2. 每次B猜到一個(gè)
搜索引擎能如此快速的在全網(wǎng)范圍內(nèi)檢索并抓取關(guān)鍵字,是怎么做到的?
要回答這個(gè)問(wèn)題,讓我們玩一個(gè)游戲。游戲規(guī)則如下:1。A提前在一張紙上寫(xiě)一個(gè)小于1000的數(shù)字。B不知道。B會(huì)猜到的。
2. 每次B猜到一個(gè)數(shù)字,a需要告訴B它是否正確。如果不是,a需要告訴B他猜測(cè)的數(shù)字是大于還是小于紙上的數(shù)字。
3. 如果B猜不到12次,他就會(huì)贏。
你能在12次內(nèi)猜出1000以?xún)?nèi)的數(shù)字嗎?如果你不懂?dāng)?shù)學(xué)原理,那就很難了。如果你知道“折衷方法”,那就很容易了。每次1000除以2,11乘以1。
假設(shè)紙上的數(shù)字是639。如果你從一個(gè)開(kāi)始,一次加一個(gè),你必須猜639次。如果從1000開(kāi)始,每次減去1,就需要300多次。B第一次猜500(1000的一半),a告訴他他更年輕。
B第二次猜到了750,但a說(shuō)它太大了。
B第三次猜到625,a說(shuō)太小了。
B第四次猜到687(625和750的中間值是四舍五入的),a說(shuō)它太大了。
第五次B猜656(625和687的中位數(shù)),a說(shuō)太大了。
B第六次猜到641(625和656的中位數(shù)),a說(shuō)它太大了。
B第七次猜到了633(625和641的中位數(shù)),a說(shuō)這個(gè)數(shù)字很小。
B第八次猜到了637,但a說(shuō)它太小了。
第九個(gè)猜測(cè)是639(637和641的中位數(shù)),a說(shuō)是正確的。
只花了九次就猜到了。
事實(shí)上,只要13次就可以猜出10000以?xún)?nèi)的數(shù)字。如果數(shù)字小于10萬(wàn),最多可以猜17次。
搜索引擎索引原則與此類(lèi)似,但不限于這些原則。例如,有二叉樹(shù)等等。
搜索系統(tǒng)將首先使用爬蟲(chóng)程序?qū)⒚總€(gè)網(wǎng)站的網(wǎng)頁(yè)信息爬網(wǎng)到自己的服務(wù)器上,以建立索引。建立索引的方法將使用與上述類(lèi)似的數(shù)學(xué)原理。
有了索引,搜索速度更快。索引就像一本書(shū)的目錄,雖然書(shū)很厚,但是有目錄,你可以很快翻到你要找的章節(jié)。如果你沒(méi)有目錄,那么你翻閱你想去的章節(jié)會(huì)很慢。