IKanalyzer的过滤停止词怎么用

kexzcle 2010-02-10
不好意思!这个就不清楚了
illu 2010-02-10
TonyLian 写道
IKAnalyzer.cfg.xml 放在 src/ 会被编译到 /classes/
ext_stopwords.dic 随意,只有在IKAnalyzer.cfg.xml中指定的目录。
例如,IKAnalyzer.cfg.xml写 /ext_stopwords.dic
那么ext_stopwords.dic就也放到src/

按照如上步骤 我试验了下 成功
=。= 不知道你咋弄不出来。。
TonyLian 2010-02-10
放到SRC/里,是为了让它被编译到 classpath可访问目录的根。
到bin/ 或 web应用程序时的 WEB-INF/classes/ 里看看,是否被弄来了。
87271833 2010-02-10
TonyLian 写道
放到SRC/里,是为了让它被编译到 classpath可访问目录的根。
到bin/ 或 web应用程序时的 WEB-INF/classes/ 里看看,是否被弄来了。

我是放在SRC里的 bin里面没有编译出来的东西
MultiArrow 2010-02-26
我也有这个问题,并且在加载的时候控制台可以看到已经加载了IKAnalyzer.cfg.xml,IKAnalyzer.cfg.xml和ext_stopwords.dic是在同一文件夹中。但是搜索的时候还是没有过滤到ext_stopwords.dic出现过的字。
补充一下:我使用的是SSH。
87271833 2010-02-28
哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !!
kexzcle 2010-03-01
87271833 写道
哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !!


你是弄错了吧?不是 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic !要像  TonyLian 大哥说的放到SRC/里,是为了让它被编译到 classpath可访问目录的根。  然后你到发布后的目录,比如我用的是TOMCAT,我就去webapps里找相应项目,去它的WEB-INF的 class目录下看是否编译出来,不可能没被编译过来啊!
87271833 2010-03-02
kexzcle 写道
87271833 写道
哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !!


你是弄错了吧?不是 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic !要像  TonyLian 大哥说的放到SRC/里,是为了让它被编译到 classpath可访问目录的根。  然后你到发布后的目录,比如我用的是TOMCAT,我就去webapps里找相应项目,去它的WEB-INF的 class目录下看是否编译出来,不可能没被编译过来啊!

你说的这是我最开始的方法 没作用 才瞎搞。。
我现在自己做个过滤词索引 搜的时候判断了 哎~~
iewxcep 2011-04-01
朋友  不知道你这个问题解决没有啊  咋解决的  我也遇到同样的问题了
linliangyi2007 2011-04-02
1.确定停止词文件在正确的目录下,并和配置吻合
2.确定你使用停止词典的是UTF-8的无BOM编码
3.如果你不知道啥叫无BOM,也不确定自己的文件是不是UTF-8无bom,那么请在第一行使用回车换行,从第二行开始添加停止词
4.请尽可能细的阅读IK的使用手册,上述问题在手册中都有说明

5.请使用IK3.2.8版本,之前的版本不对数词进行停止词判断

Global site tag (gtag.js) - Google Analytics