建索引的速度问题

ahuaxuan 2007-12-07
大家能否说说自己的经验,
我先来:
我的机器:
cpu: intel core2 duo e4400 2g
内存:2g
硬盘:7200转


两万条数据的索引,每条数据的字符串长度为40,耗时10分钟。好像速度有点慢了,
因为我的机器配置还是不错的,我想改成10线程来建索引,这样索引建完成后在做合并,但是我现在一个线程建索引我的cpu的两个核心都是100%,满载。

这个速度正常吗
fangts 2007-12-07
说实在话有点慢的啊
你多线程的啊
能不能发个类给我看看,呵呵
QQ:453086
ahuaxuan 2007-12-07
楼上,我不是多线程,不过多线程也很简单,思路是维护多个dir,然后每个线程一个dir,就是每个线程每个indexwriter,最后合并这10个dir的索引文件,就这样,不过这个好像没有毕业,因为单线程现在cpu就100%,多线程应该不会有多大的提升的
fangts 2007-12-07
CPU的话我一般维持在90%左右
你内存一般是占用多少
ahuaxuan 2007-12-07
又看了一下,没有100%,70%左右,我是双核的机器
两个核心都是70%
fangts 2007-12-07
我觉得最重要的是内存占用率问题
昨天给我们公司建索引
数据量400W条
直接把2G内存的服务器重启了
提示:内存占用不足。。。
ahuaxuan 2007-12-07
不会吧,我600w的数据都没事,大数据量我都是分段计算的
grantbb 2007-12-10
尽量多用一些内存,然后索引就快了。
ahuaxuan 2007-12-13
grantbb 写道
尽量多用一些内存,然后索引就快了。

好的,谢谢
imjl 2007-12-14
数据怎么取得,一条条取,还是一次性读到内存,然后一条条加呢?

数据全部添加完,最后做commit,optimize的吗?

也就是每次索引,无论索引多少数据,只需要最后commit,optimize一次就够了。

index 性能提升看下我发的优化的帖子。
Global site tag (gtag.js) - Google Analytics