[lucene] Lucence 搜索技术

lym6520 2009-03-16
lupingui 写道
我想知道输入信息后的那个下拉框的效果是怎么实现的。我知道数据怎么来的,但是那个层的效果一直做不出来。郁闷。

就是用一个表搜集关键字的信息咯!每次用户输入的时候到保存用户输入的搜索条件。
fys124974704 2009-03-16
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
我想问一下,是不是实时做的索引,还是有延迟在里面?

当然是实时的,修改、添加、删除都是实时跟新的

请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好!

数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段

这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确!

我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。

其实这个问题我到现在也没有办法解决,不过想到了一个解决方案,这段时间一直在写这方面的代码,对象多了肯定不能实时,但是如果少肯定没有问题!多的话就是需要排队!哈哈,这个我等写好了放上来给大家共享一下!
satanest 2009-03-16
如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引
当然,并发的问题还是有点难搞
fys124974704 2009-03-17
satanest 写道
如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引
当然,并发的问题还是有点难搞

这样子需要在数据库加上一个标识,每次都在数据库里面搜索需要建立索引的数据,这样子是我们某些网站现在的做法,行是行,只是看你设置的索引时间咯!看看能否接受等待咯!
lym6520 2009-03-17
fys124974704 写道
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
我想问一下,是不是实时做的索引,还是有延迟在里面?

当然是实时的,修改、添加、删除都是实时跟新的

请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好!

数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段

这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确!

我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。

其实这个问题我到现在也没有办法解决,不过想到了一个解决方案,这段时间一直在写这方面的代码,对象多了肯定不能实时,但是如果少肯定没有问题!多的话就是需要排队!哈哈,这个我等写好了放上来给大家共享一下!

好啊,到时候一定关注下啊
lym6520 2009-03-17
satanest 写道
如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引
当然,并发的问题还是有点难搞

这个问题先前也考虑过
littleJava 2009-03-18
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
lym6520 写道
fys124974704 写道
我想问一下,是不是实时做的索引,还是有延迟在里面?

当然是实时的,修改、添加、删除都是实时跟新的

请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好!

数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段

这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确!

我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。

肯定不能用实时的索引,即是不考虑并发的问题,如果数据量大,就会出现长久等待的问题。还是弄个定时索引才是王道!
dormant 2009-03-18
https://issues.apache.org/jira/browse/LUCENE-1313
justshare 2009-03-19
建议楼主专门写一遍这样的文章。
实时搜索: https://issues.apache.org/jira/browse/LUCENE-1313
littleJava 2009-03-20
楼主有用的中文分词工具吗?是什么分词工具,给个介绍吧
Global site tag (gtag.js) - Google Analytics