中國免費(fèi)文獻(xiàn)檢索網(wǎng)站 全文檢索默認(rèn)哪種排序方式?
全文檢索默認(rèn)哪種排序方式?全文搜索可以認(rèn)為是搜索引擎最重要的功能,很多系統(tǒng)(如Luence)也支持全文搜索。全文搜索背后涉及的最重要的原理有兩個:倒排索引、搜索結(jié)果排序。1、倒排索引:給定若干搜索詞
全文檢索默認(rèn)哪種排序方式?
全文搜索可以認(rèn)為是搜索引擎最重要的功能,很多系統(tǒng)(如Luence)也支持全文搜索。全文搜索背后涉及的最重要的原理有兩個:倒排索引、搜索結(jié)果排序。
1、倒排索引:
給定若干搜索詞 {Ti},可以根據(jù)倒排索引快速搜得相關(guān)的文檔 {Di}。
2、搜索結(jié)果排序(文檔排序),主要思想是先找出搜索詞扮重要作用的文檔(定評價標(biāo)準(zhǔn)),接著通過比較作用的大小來排序(通過評價標(biāo)準(zhǔn)評價)。分兩步:
2.1、找出各搜索詞在各搜得的文檔內(nèi)的權(quán)重Wtd,從而得到搜得的每個文檔的搜索詞權(quán)重向量
2.2、將各搜索詞也看做一個文檔,得到相應(yīng)的權(quán)重向量,比較文檔權(quán)重向量與搜索詞權(quán)重向量越近則越相關(guān)。