[lucene] 关于luncene从索引库拿document时间的问题

Mr小血 2011-09-24
   我现在是200万条数据 建立的索引,里边存得字段比较多,  整理后索引库文件大小是2.5G左右,用的luncene搜索耗时也很少 基本都是几十毫秒。但是根据搜索后获得document的id去索引库里拿数据却非常耗时,我用的分页取每页数据20条,但是就这20条数据从索引库里拿出完整的document总共就要耗时200毫秒左右,也就是平均每用一个id取一个完整的document就要10毫秒左右,太费时间了。

   我自己现在现出来得办法就是缓存数据,但是200万数据不可能全部缓存,内存吃不消。缓存一部分只能解决一部分关键字搜索时的速度,而且如果命中率不高的话还不如不做- -。。

   问下 你们用docid从索引库拿document耗时多少?索引文件多大?

   关于这个问题有更好的思路吗?

   请大家指教下
Global site tag (gtag.js) - Google Analytics