IKanalyzer的过滤停止词怎么用
kexzcle
2010-02-10
![]() |
|
illu
2010-02-10
TonyLian 写道 IKAnalyzer.cfg.xml 放在 src/ 会被编译到 /classes/
ext_stopwords.dic 随意,只有在IKAnalyzer.cfg.xml中指定的目录。 例如,IKAnalyzer.cfg.xml写 /ext_stopwords.dic 那么ext_stopwords.dic就也放到src/ 按照如上步骤 我试验了下 成功 =。= 不知道你咋弄不出来。。 |
|
TonyLian
2010-02-10
放到SRC/里,是为了让它被编译到 classpath可访问目录的根。
到bin/ 或 web应用程序时的 WEB-INF/classes/ 里看看,是否被弄来了。 |
|
87271833
2010-02-10
TonyLian 写道 放到SRC/里,是为了让它被编译到 classpath可访问目录的根。
到bin/ 或 web应用程序时的 WEB-INF/classes/ 里看看,是否被弄来了。 我是放在SRC里的 bin里面没有编译出来的东西 |
|
MultiArrow
2010-02-26
我也有这个问题,并且在加载的时候控制台可以看到已经加载了IKAnalyzer.cfg.xml,IKAnalyzer.cfg.xml和ext_stopwords.dic是在同一文件夹中。但是搜索的时候还是没有过滤到ext_stopwords.dic出现过的字。
补充一下:我使用的是SSH。 |
|
87271833
2010-02-28
哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !! |
|
kexzcle
2010-03-01
87271833 写道 哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !! 你是弄错了吧?不是 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic !要像 TonyLian 大哥说的放到SRC/里,是为了让它被编译到 classpath可访问目录的根。 然后你到发布后的目录,比如我用的是TOMCAT,我就去webapps里找相应项目,去它的WEB-INF的 class目录下看是否编译出来,不可能没被编译过来啊! |
|
87271833
2010-03-02
kexzcle 写道 87271833 写道 哎 这个问题就没办法解决吗 无语了
我现在做了一个Web项目 根据作者的说明 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic 结果一点用都没有 不知道怎么看它是否已经加载 !! 你是弄错了吧?不是 在WEB-INF的class目录放入IKAnalyzer.cfg.xml和ext_stopword.dic !要像 TonyLian 大哥说的放到SRC/里,是为了让它被编译到 classpath可访问目录的根。 然后你到发布后的目录,比如我用的是TOMCAT,我就去webapps里找相应项目,去它的WEB-INF的 class目录下看是否编译出来,不可能没被编译过来啊! 你说的这是我最开始的方法 没作用 才瞎搞。。 我现在自己做个过滤词索引 搜的时候判断了 哎~~ |
|
iewxcep
2011-04-01
朋友 不知道你这个问题解决没有啊 咋解决的 我也遇到同样的问题了
|
|
linliangyi2007
2011-04-02
1.确定停止词文件在正确的目录下,并和配置吻合
2.确定你使用停止词典的是UTF-8的无BOM编码 3.如果你不知道啥叫无BOM,也不确定自己的文件是不是UTF-8无bom,那么请在第一行使用回车换行,从第二行开始添加停止词 4.请尽可能细的阅读IK的使用手册,上述问题在手册中都有说明 5.请使用IK3.2.8版本,之前的版本不对数词进行停止词判断 |