計算機檢索系統(tǒng)中常用的運算符 構(gòu)建檢索表達(dá)式的基本要素主要是那四個?
構(gòu)建檢索表達(dá)式的基本要素主要是那四個?檢索表達(dá)式主要包括邏輯表達(dá)式、截止表達(dá)式、位置檢索表達(dá)式等。其中,邏輯表達(dá)式是最常用的。1、邏輯表達(dá)式是指用布爾邏輯運算符來表達(dá)檢索詞之間的關(guān)系,也稱為布爾邏輯表
構(gòu)建檢索表達(dá)式的基本要素主要是那四個?
檢索表達(dá)式主要包括邏輯表達(dá)式、截止表達(dá)式、位置檢索表達(dá)式等。其中,邏輯表達(dá)式是最常用的。
1、邏輯表達(dá)式是指用布爾邏輯運算符來表達(dá)檢索詞之間的關(guān)系,也稱為布爾邏輯表達(dá)式。布爾邏輯是目前計算機檢索最簡單、最基本的匹配,也是計算機檢索領(lǐng)域廣泛使用的邏輯表達(dá)式。布爾運算符包括邏輯與、邏輯或、邏輯非等。
2.截取檢索表達(dá)式是指檢索詞的某一部分在檢索公式中用特殊符號(截斷符號)表示,并且在檢索詞中允許某些變化。由檢索詞的未改變部分加上由截斷符號表示的任何改變形成的詞是合法的檢索詞。截取檢索表達(dá)式在西文檢索中應(yīng)用廣泛,在中文信息檢索中也有一些應(yīng)用。利用截短詞檢索表達(dá)式,既能防止漏檢,又能節(jié)省時間,是提高檢索效率的有力措施。不同的檢索系統(tǒng)使用不同的分詞符號,如 " "和 "* "。
切字的方法有很多種,按切的位置分,有前切、中切、后切。根據(jù)截斷字符的數(shù)量,可分為有限截斷和無限截斷。
3.位置檢索表達(dá)式表示兩個檢索詞之間的位置鄰近關(guān)系(不同的檢索系統(tǒng)可能采用不同的表達(dá)式符號)。
常用的有:
W (NW): W是with的縮寫,(W)表示兩邊的搜索詞必須按順序出現(xiàn)在記錄中,兩個詞之間不允許插入其他詞,只能是空格或一個標(biāo)點符號。(nW)表示兩邊的搜索詞之間最多只能插入n個詞,搜索詞的位置不能顛倒。
F:是fi
高級檢索的表達(dá)式怎么?
因為在最近的一個項目中使用了solr,所以solr語句可以編寫更復(fù)雜的語句。
現(xiàn)在要對外提供一個接口,為了安全起見,需要充分理解傳入查詢語句的元素,比如字段、值、運算符等。而且也有必要不要直接向外界公開solr語句,這意味著字段名需要獨立定義,然后進(jìn)行轉(zhuǎn)換。
It 很難發(fā)現(xiàn)這涉及到語法分析~ ~ ~
大概是這樣的:a: AAA和b: AAA或者(b: AAA和c: AAA)不是b: AAA和d: AAA 10。.......