[lucene] 对lucene查询结果进行分组统计的扩展组件

ybzshizds 2009-12-25
    在这里看到好几篇帖子,都是是询问如何对lucene查询结果进行分组统计的,(分组统计其实是搜索中很常见的需求,大家都在网上找过工作,如51job,你输入查询关键字,如软件工程师,马上出来一些职位列表,同时在页面的左边就是分类统计的信息,职位要求本科学历的有多少,一星期内发布的有多少,公司类型为外资企业的有多少)但是都没有得到很好的回复,因为lucene本身提供的api确实没有实现这样的功能,有些高人建议修改lucene的源代码去实现,但是我不看好这样的做法,因为更改源代码,对以后的升级就造成麻烦了,而且对高并发搜索的时候,还可能会有莫名其妙的问题出现。经过一番尝试,最后还是向大家推荐一个开源的项目bobo-browse(项目地址:http://code.google.com/p/bobo-browse/ 它是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能),即使你自己要取修改lucene的源代码,参考bobo-browse,你也应该能有惊人的发现。
     我的项目中进行了测试,供大家参考。500W条索引数据,查询后进行分类统计,速度一般在150ms左右(在我办公的机器(操作系统:ubuntu 9.10,cpu:AMD Dual core 4200+, 内存:2G)上测试的,还不是在服务器上)

brian314 2009-12-26
我来支持你,这个包是你开发的吧
Global site tag (gtag.js) - Google Analytics