lucene原理 如何理解Lucene的Index索引文檔模型?
如何理解Lucene的Index索引文檔模型?Lucene主要有兩種文檔模型:文檔和字段。一個(gè)文檔可以包含多個(gè)字段。每個(gè)字段都有不同的策略:1。是否要編制索引,請(qǐng)?jiān)诜治龊髮⒆侄翁砑拥剿饕?,該字段不?/p>
如何理解Lucene的Index索引文檔模型?
Lucene主要有兩種文檔模型:文檔和字段。一個(gè)文檔可以包含多個(gè)字段。每個(gè)字段都有不同的策略:
1。是否要編制索引,請(qǐng)?jiān)诜治龊髮⒆侄翁砑拥剿饕校撟侄尾皇窃嘉谋尽?/p>
2. 如果它是索引的,您可以選擇是否保存“術(shù)語(yǔ)向量”以進(jìn)行類似檢索。
3. 您可以選擇是否存儲(chǔ),直接復(fù)制原始文本而不編制索引,并將其用于檢索。Lucene中的文檔模型與數(shù)據(jù)庫(kù)相似,但并不完全相同,主要體現(xiàn)在以下幾個(gè)方面:1。沒(méi)有標(biāo)準(zhǔn)格式,即不需要固定的架構(gòu)、不需要列等預(yù)設(shè)計(jì),同一索引中添加的文檔可以包含不同的字段。2信息化。Lucene中的文檔模型是一個(gè)平面結(jié)構(gòu),沒(méi)有遞歸定義、自然連接等復(fù)雜結(jié)構(gòu)。