[lucene] lucene大数据搜索

艾丽斯顿 2013-01-04
我想了解一下,大家使用lucene 处理过多大的数据呢? 百万级?千万级? 亿级? 性能又是如何呢? 另外想问一下,大家是怎么结合到web项目里的,用的什么框架呢? 我用的是ssh+lucene+ik
lvwenwen 2013-01-04
艾丽斯顿 写道
我想了解一下,大家使用lucene 处理过多大的数据呢? 百万级?千万级? 亿级? 性能又是如何呢? 另外想问一下,大家是怎么结合到web项目里的,用的什么框架呢? 我用的是ssh+lucene+ik

关注下
hyneng 2013-01-05
补充一下,用lucene耗内存吗,我的VPS只有256的内存,如果我用lucene做搜索,能顶得住不?
我现在单独跑一个网站,一般是用150M的内存,还有差不多100M,大家觉得可行不
reinhardv 2013-01-05
你好,我曾经作过一个项目实用Lucene,现在大概处理16亿数据,一般查询都在60ms以内完成。
lvwenwen 2013-01-05
reinhardv 写道
你好,我曾经作过一个项目实用Lucene,现在大概处理16亿数据,一般查询都在60ms以内完成。

可否共享demo研究lucene
reinhardv 2013-01-06
是公司的项目,在内网里面,不能对外共享,不好意思,不过你有什么问题,我如果知道尽量帮你解答:)
znfsky 2013-01-06
reinhardv 写道
是公司的项目,在内网里面,不能对外共享,不好意思,不过你有什么问题,我如果知道尽量帮你解答:)

你好,我这边有个应用,是用solr做的。在单台机器上存储了8000w的数据,所有数据按id取模均分到20个core中(这20个core都在这一台机器上)。索引占了50个G的磁盘空间。
测试结果发现查询很快,基本上不超过10ms,但是有个很头疼的问题:有0.3%的几率查询会超过1000ms。我跟过solr的源代码,查询耗时都在lucene里,具体哪一行我忘了,明天到公司看看才知道
lelong 2013-02-02
reinhardv 写道
你好,我曾经作过一个项目实用Lucene,现在大概处理16亿数据,一般查询都在60ms以内完成。


您好,我想知道16亿数据要做分布式索引吗?还是单个索引就解决了问题?谢谢
imjl 2013-02-18
搜索首先不是找框架。而是搜索到底要达到怎么样一个目标,比如多大数据量,怎么排序,搜索速度,索引速度,搜索频率,新增索引频率等。

然后寻找分词,看开源是否能满足,如果不能是否能修改,或者写一个。

实际数据测试,看自己索引速度,索引大小,搜索速度,硬件数据,压力测试来确定方案。

最后根据方案进行生产环境部署,测试,上线。

chris开到荼縻 2013-07-25
reinhardv 写道
你好,我曾经作过一个项目实用Lucene,现在大概处理16亿数据,一般查询都在60ms以内完成。

求共享代码
Global site tag (gtag.js) - Google Analytics