[lucene] Lucence 搜索技术
lym6520
2009-03-16
lupingui 写道 我想知道输入信息后的那个下拉框的效果是怎么实现的。我知道数据怎么来的,但是那个层的效果一直做不出来。郁闷。
就是用一个表搜集关键字的信息咯!每次用户输入的时候到保存用户输入的搜索条件。 |
|
fys124974704
2009-03-16
lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 我想问一下,是不是实时做的索引,还是有延迟在里面?
当然是实时的,修改、添加、删除都是实时跟新的 请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好! 数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段 这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确! 我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。 其实这个问题我到现在也没有办法解决,不过想到了一个解决方案,这段时间一直在写这方面的代码,对象多了肯定不能实时,但是如果少肯定没有问题!多的话就是需要排队!哈哈,这个我等写好了放上来给大家共享一下! |
|
satanest
2009-03-16
如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引 当然,并发的问题还是有点难搞 |
|
fys124974704
2009-03-17
satanest 写道 如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引 当然,并发的问题还是有点难搞 这样子需要在数据库加上一个标识,每次都在数据库里面搜索需要建立索引的数据,这样子是我们某些网站现在的做法,行是行,只是看你设置的索引时间咯!看看能否接受等待咯! |
|
lym6520
2009-03-17
fys124974704 写道 lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 我想问一下,是不是实时做的索引,还是有延迟在里面?
当然是实时的,修改、添加、删除都是实时跟新的 请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好! 数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段 这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确! 我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。 其实这个问题我到现在也没有办法解决,不过想到了一个解决方案,这段时间一直在写这方面的代码,对象多了肯定不能实时,但是如果少肯定没有问题!多的话就是需要排队!哈哈,这个我等写好了放上来给大家共享一下! 好啊,到时候一定关注下啊 |
|
lym6520
2009-03-17
satanest 写道 如果数据量一大的话,使用实时索引延迟会蛮严重的
个人觉得可以使用定时器,跟一段时间建立一次索引 当然,并发的问题还是有点难搞 这个问题先前也考虑过 |
|
littleJava
2009-03-18
lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 lym6520 写道 fys124974704 写道 我想问一下,是不是实时做的索引,还是有延迟在里面?
当然是实时的,修改、添加、删除都是实时跟新的 请问网站的数据是用户录入还是管理员录入,平均每天录入的数据是多少呢?因为我曾经也做过实时的索引操作,但是效果不怎么好! 数据是由用户录入的,大概每天100~200条的数据量吧,目前我们还处在适用阶段 这样的架构你估计能顶住多少数据量/天?假如你是在录入数据的时候同时保存到数据库和索引库,建立索引需要一定的时间,如果同时并发应该会出现排队,请求响应的时间会比较长,这只是我的猜测,不知道是否正确! 我怎么没想到这个呢,虽然添加一条索引速度很快,但是并发问题导致了等待,兄台领教了,看来不能实时索引了。。。 肯定不能用实时的索引,即是不考虑并发的问题,如果数据量大,就会出现长久等待的问题。还是弄个定时索引才是王道! |
|
dormant
2009-03-18
https://issues.apache.org/jira/browse/LUCENE-1313
|
|
justshare
2009-03-19
建议楼主专门写一遍这样的文章。
实时搜索: https://issues.apache.org/jira/browse/LUCENE-1313 |
|
littleJava
2009-03-20
楼主有用的中文分词工具吗?是什么分词工具,给个介绍吧
|