最干凈的搜索引擎 中國(guó)十大搜索引擎排名?
最干凈的搜索引擎 有哪些全文搜索引擎?中國(guó)十大搜索引擎排名? 全文搜索引擎有: 1. Lucene Lucene開(kāi)發(fā)語(yǔ)言是Java,也是Java家族中最著名的開(kāi)源搜索引擎之一,Java
最干凈的搜索引擎

有哪些全文搜索引擎?
中國(guó)十大搜索引擎排名?
全文搜索引擎有:
1. Lucene
Lucene開(kāi)發(fā)語(yǔ)言是Java,也是Java家族中最著名的開(kāi)源搜索引擎之一,Java世界上已經(jīng)是標(biāo)準(zhǔn)的全文檢索程序了,它提供了完整的查詢引擎和索引引擎,沒(méi)有中文分詞引擎,需要自己去實(shí)現(xiàn),所以用Lucene做搜索引擎需要自己去架構(gòu).此外,它不支持實(shí)時(shí)搜索,但linkedin和twitter有分別對(duì)Lucene實(shí)時(shí)搜實(shí)時(shí)搜素. 其中Lucene有一個(gè)C 移植版叫CLucene,CLucene因?yàn)槭褂肅 寫(xiě),所以理論上比較lucene快.
官方主頁(yè):http://lucene.apache.org/
CLucene官方主頁(yè):http://sourceforge.net/projects/clucene/
2. Sphinx
Sphinx是一個(gè)用C 語(yǔ)言寫(xiě)的開(kāi)源搜索引擎也是主流搜索引擎之一。與索引事件相比,Lucene索引文件比例快50%,Lucene大一倍,所以Sphinx索引的建立是空間交換事件的策略,在檢索速度、和諧、和諧、lucene差別不大,但檢索精度方面,Lucene要優(yōu)于Sphinx,另外,在加入中文分詞引擎的難度方面,Lucene要優(yōu)于Sphinx.其中Sphinx支持實(shí)時(shí)搜索,使用方便.
官方主頁(yè):http://sphinxsearch.com/about/sphinx/
3. Xapian
Xapian是一個(gè)用C 編寫(xiě)的全文檢索程序,api并且檢索原理和lucene很多方面都很像,算是填補(bǔ)了lucene在C 中的一個(gè)空缺.
官方主頁(yè):http://xapian.org/
4. Nutch
Nutch是一個(gè)用java開(kāi)源web包括爬蟲(chóng)在內(nèi)的搜索引擎crawler,索引引擎,查詢引擎. 其中Nutch是基于Lucene的,Lucene為Nutch提供文本索引和搜索API.
應(yīng)使用Lucene還是使用Nutch,如果不需要抓取數(shù)據(jù),應(yīng)該使用Lucene,最常見(jiàn)的應(yīng)用是:你有數(shù)據(jù)源,需要為這些數(shù)據(jù)提供一個(gè)搜索頁(yè)面。在這種情況下,最好的方法是直接從數(shù)據(jù)庫(kù)中取出數(shù)據(jù),并使用它們Lucene API建立索引.
官方主頁(yè):http://nutch.apache.org/
5. DataparkSearch
DataparkSearch是一個(gè)用C語(yǔ)言實(shí)現(xiàn)開(kāi)源搜索引擎. 其中網(wǎng)頁(yè)排序采用神經(jīng)網(wǎng)絡(luò)模型. 其中支持HTTP,HTTPS,F(xiàn)TP,NNTP等下載網(wǎng)頁(yè).包括索引擎、檢索引擎和中文分詞引擎(這也是唯一開(kāi)源的搜索引擎中有中文分詞引擎).可以個(gè)性化定制搜索結(jié)果,有完整的日志記錄.
官方主頁(yè):http://www.dataparksearch.org/
6. Zettair
Zettair是根據(jù)Justin Zobel基于研究成果的全文檢索實(shí)驗(yàn)系統(tǒng).它是用C語(yǔ)言實(shí)現(xiàn)的. 其中Justin Zobel它在全文搜索領(lǐng)域非常有名,是業(yè)內(nèi)第一個(gè)系統(tǒng)提出倒排序索引差分壓縮算法的人。倒排列表的壓縮大大提高了檢索和加載的性能,空間膨脹率也降低到了非常好的水平. 由于Zettair代碼來(lái)自學(xué)術(shù)界,RMIT University搜索引擎組織寫(xiě)的,所以它的代碼簡(jiǎn)潔精致,算法高效,是學(xué)習(xí)反向索引經(jīng)典算法的非常好的例子. 其中支持linux,windows,mac os等系統(tǒng).
官方主頁(yè):http://www.seg.rmit.edu.au/zettair/about.html
7. Indri
Indri是一個(gè)用C語(yǔ)言和C 語(yǔ)言寫(xiě)的全文檢索引擎系統(tǒng),由University of Massachusetts和Carnegie Mellon University開(kāi)源項(xiàng)目合作推出. 特點(diǎn)是跨平臺(tái),API接口支持Java,PHP,C .
官方主頁(yè):http://www.lemurproject.org/indri/
8. Terrier
Terrier是由School of Computing Science,Universityof Glasgow用java全文檢索系統(tǒng)的開(kāi)發(fā).
官方主頁(yè):http://terrier.org/
9. Galago
Galago是一個(gè)用java關(guān)于文本搜索的語(yǔ)言寫(xiě)作工具集. 包括索引擎和查詢引擎,還包括一個(gè)叫做TupleFlow分布式計(jì)算框架(和google的MapReduce很像).這個(gè)檢索系統(tǒng)支持很多Indri查詢語(yǔ)言.
官方主頁(yè):http://www.galagosearch.org/
10. Zebra
Zebra是一個(gè)用C語(yǔ)言檢索程序的特點(diǎn)是支持大數(shù)據(jù),支持EMAIL,XML,MARC等格式數(shù)據(jù).
官方主頁(yè):https://www.indexdata.com/zebra
11. Solr
Solr是一個(gè)用java開(kāi)發(fā)的獨(dú)立企業(yè)級(jí)搜索應(yīng)用服務(wù)器,它提供了類似的企業(yè)級(jí)搜索應(yīng)用服務(wù)器Web-service的API接口,它是基于的Lucene全文檢索服務(wù)器,也算是Lucene很多一線互聯(lián)網(wǎng)公司都在使用一個(gè)變種Solr,也算是一種成熟的解決方案.
官方主頁(yè):http://lucene.apache.org/solr/
12. Elasticsearch
Elasticsearch是一個(gè)采用java基于語(yǔ)言開(kāi)發(fā)Lucene開(kāi)源結(jié)構(gòu),分布式搜索引擎. 設(shè)計(jì)用于云計(jì)算,能實(shí)現(xiàn)實(shí)時(shí)搜索,穩(wěn)定可靠. Elasticsearch數(shù)據(jù)模型是JSON.
官方主頁(yè):http://www.elasticsearch.org/
13. Whoosh
Whoosh是一個(gè)用純python開(kāi)源搜索引擎.
官方主頁(yè):https://bitbucket.org/mchaput/whoosh/wiki/Home
誰(shuí)推薦一個(gè)好用干凈的網(wǎng)站導(dǎo)航?
蜘蛛網(wǎng)站導(dǎo)航 這個(gè)網(wǎng)站頁(yè)面清爽干凈,沒(méi)有討厭的廣告 值得推薦。 是我遇到的最好的網(wǎng)站導(dǎo)航站。他們網(wǎng)站的口號(hào)是蜘蛛網(wǎng)站導(dǎo)航,安全、實(shí)用、干凈。!網(wǎng)站上沒(méi)有廣告 頁(yè)面干凈清爽 你可以試試 網(wǎng)站頂部有各種搜索引擎的搜索框 搜索信息也很方便。我一直把這個(gè)網(wǎng)站設(shè)置為瀏覽器主頁(yè)