[lucene] Lucene 大数据量的搜索

z191912a 2015-08-14
目前单机有8亿左右的数据,按天分目录索引,每个目录大概在300万的量,查询都要跑到秒级了,有没有什么方法更好的提升查询性能?目前没用到缓存。
amw_demon 2015-08-17
要是数据不常改变的话,合并一下索引,最好合并成一个。
whiletrue 2015-08-25
难以想象合并后速度能升上去。
话说速度要是能升上去,还有谁用分布式?
amw_demon 写道
要是数据不常改变的话,合并一下索引,最好合并成一个。

amw_demon 2015-08-26
多个索引搜索时,每个索引都有独立的字典文件,存储文件,搜索完之后有个合并的过程,索引太多了,肯定会影响搜索速度的,多个段也是一样,这也就是索引时有optimize操作的原因。单机的处理肯定会有瓶颈的,进一步要升级到分布式,如solr,hadoop。
comeonbabye 2015-09-04
可以考虑solr cloud
Global site tag (gtag.js) - Google Analytics