[lucene] 新手,刚刚学习 lucene ,实现不了中文搜索,可以中文。现在我需要在web页面,用lucene搜索中英文

sun_jiangang 2011-08-18
新手,刚刚学习 lucene ,实现不了中文搜索,可以中文。现在我需要在web页面,用lucene搜索中英文。请各位大家帮忙,给个demo看看。网络上都没有 在 web页面下 用lucene实现 搜索中英文。 我现在能实现搜索英文,但是中文根本就不能搜索。请大家赐教,给个demo啊。


我的开发工具  tomcat 6.0,myeclipse
sun_jiangang 2011-08-18
刚才打错字了。是可以实现英文,不能实现中文。  在web下如何完成这个功能,请大家帮忙啊
JavaYog 2011-08-19
可能看下IKAnalyzer和Poading这两个中文分词
illu 2011-08-19
用IKAnalyzer吧 IKAnalyzer很方便
自己google下吧
不再發呆 2011-08-20
肯定是分词器的问题。
中文分词需要专门带词库的分词器。
网上比较流行的有极易分词器,庖丁分词器,以及IKAnalyzer
建议IKAnalyzer,因为这个支持Lucene3.0以上的版本,而且支持自定义停用词以及新的词汇的扩展
sea0108 2011-08-20
不再發呆 写道
肯定是分词器的问题。
中文分词需要专门带词库的分词器。
网上比较流行的有极易分词器,庖丁分词器,以及IKAnalyzer
建议IKAnalyzer,因为这个支持Lucene3.0以上的版本,而且支持自定义停用词以及新的词汇的扩展


+1
参考http://linliangyi2007.iteye.com/blog/941132
sun_jiangang 2011-08-22
果然是  分词问题,已经解决了 导的 庖丁解牛包,解决了。谢谢各位的指点
mindf**k 2011-08-25
solr 吧
sunxucool 2011-08-29
看看是不是没转换字符编码
2xusi 2011-08-30
诶 不会了
Global site tag (gtag.js) - Google Analytics