卖逼视频免费看片|狼人就干网中文字慕|成人av影院导航|人妻少妇精品无码专区二区妖婧|亚洲丝袜视频玖玖|一区二区免费中文|日本高清无码一区|国产91无码小说|国产黄片子视频91sese日韩|免费高清无码成人网站入口

如何用C語言做出搜索引擎?

網(wǎng)友解答: 個人覺得完全用C語言去做一個搜索引擎,是能辦到,但是成本會很高。首先我們來看一個通用的搜索引擎需要哪些模塊。一. 網(wǎng)絡(luò)爬蟲要用C語言去做一個爬蟲系統(tǒng),成本會非常高,很多東西都

網(wǎng)友解答:

個人覺得完全用C語言去做一個搜索引擎,是能辦到,但是成本會很高。首先我們來看一個通用的搜索引擎需要哪些模塊。

一. 網(wǎng)絡(luò)爬蟲

要用C語言去做一個爬蟲系統(tǒng),成本會非常高,很多東西都需要自己實現(xiàn)。而爬蟲系統(tǒng),個人覺得Python的Scrapy框架是一個很好的選擇,從網(wǎng)頁爬取到數(shù)據(jù)存入數(shù)據(jù)庫有一條完整的鏈路。爬蟲系統(tǒng)對性能的要求不高,Python完全可以勝任。

二. 倒排索引

倒排索引主要包括索引建立和索引更新。索引的數(shù)據(jù)結(jié)構(gòu)以及一些算法,用C語言完全可以的,在線索引實時更新通過C語言實現(xiàn)效率也能高一些。

三. 檢索模型

如果只需要做一個簡單的檢索系統(tǒng),直接BM25算法就可以了。如果系統(tǒng)比較復雜,考慮到線上效果,那么需要結(jié)合機器學習模型或深度學習模型,考慮到檢索相關(guān)性,有很多復雜的設(shè)計。不過在線部分完全可以通過C語言實現(xiàn)。

一般來說,做一個搜索引擎需要根據(jù)不同的模塊情況而選擇不同的語言實現(xiàn),充分發(fā)揮各種語言的優(yōu)勢即可。

網(wǎng)友解答:

在當前環(huán)境下這個操作不推薦,并不是說C語言無法寫搜索引擎,而是C語言的優(yōu)勢不在這里。作為大多數(shù)流行的現(xiàn)代語言鼻祖xC語言在運行效率方面的確具有較大優(yōu)勢,但是,其標準庫支持的功能主要在一些基礎(chǔ)的功能實現(xiàn)上。相比之下,python、java這些現(xiàn)代語言則擁有大量豐富的第三方庫,在程序設(shè)計中有一條箴言叫做不要重復造輪子,既然已經(jīng)有前人提供的庫(也就是輪子),自己再從頭再來的話效率與可靠性方面都會下降。因此,從效率角度來講,采用python等語言設(shè)計搜索引擎可能更快更容易實現(xiàn)。

回到問題上,有一個(應(yīng)該是)日本作者寫的《自制搜索引擎》,可以解決制作搜索引擎技術(shù)線路的問題

標簽: