请您先登录,才能继续操作
[lucene] 在大数据量下,LUCENE优化应该朝哪方面考虑
mynameisjf
2009-11-06
呵呵,我指的是总量是400G,现在采用的应该就是分布式了。主要问题是某个没响应了,WS就关闭连接了。所以就报错了。zxh116116 你指的是把索引保存数据库么?指的分布式是指什么方面?请说详细点,让我看看,谢谢
|
|
moshalanye
2009-11-19
搜索产生的负载也是很大的,如果不控制访问的峰值,内存溢出是很正常的
我之前遇到indexReader不GC,使用的内存就不回收,不知道这种情况你遇到没有 解决峰值问题,你可以考虑对搜索服务使用JCA规范(简单点就是对搜索服务做资源管理,类似于db连接池的效果),限制并发量 最好是先做压力测试,估计下峰值,如果遇到内存回收不了,考虑下在适当的时间做indexReader的GC 这些只是个人经验,不知道清楚现在lucene版本是否改进了很多。我当时用的版本2.32 |