Solr6.3 集成pinyin4j 分词插件解析
阿里
阅读:620
2021-03-31 16:54:42
评论:0
1、前期准备,需要用到pinyin4j-2.5.0.jar、pinyin4j-analyzers-4.3.1.jar这两个jar包
2、将pinyin4j-2.5.0.jar、pinyin4j-analyzers-4.3.1.jar这两个jar包复制到apache-tomcat-8.0.47-windows-x64\apache-tomcat-8.0.47\webapps\solr\WEB-INF\lib目录下。
3、在 C:\solr_config\fileInfo\conf\ managed-schema文件</schema>前增加如下配置:
<!-- ik分词 + pingying4j分词 -->
<fieldType name="text" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory" />
<filter class="com.shentong.search.analyzers.PinyinTransformTokenFilterFactory" minTermLenght="2" />
<filter class="com.shentong.search.analyzers.PinyinNGramTokenFilterFactory" minGram="1" maxGram="20" />
</analyzer>
<analyzer type="query">
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
重启tomcat查看拼音检索效果。
声明
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。