雖然分析程序用於索引和查詢,但不一定要對這兩個操作使用相同的分析程序。對於索引,您通常會想要簡化或正規化單字。例如,將所有字母設定為小寫、消除標點符號和重音符號、將單字對應到它們的詞幹等等。這樣做可以增加回想率,因為例如,「ram」、「Ram」和「RAM」都會匹配「ram」的查詢。為了提高查詢時的精確度,篩選器可以縮小匹配範圍,例如,如果您對公羊感興趣,而不是隨機存取記憶體,則可以忽略所有大寫的縮寫。
分析程序輸出的符號會定義該欄位的值或詞彙,並用於在新增新文件時建立這些詞彙的索引,或是識別哪些文件包含您要查詢的詞彙。
這些章節將說明如何設定欄位分析器,並作為設定每個可用斷詞器和篩選器類別詳細資訊的參考。它也作為指南,以便您在有內建篩選器或斷詞器無法滿足的特殊需求時,可以設定自己的分析類別。