[lucene] 做了一个图书比价的网站,大家来看看

nesta13 2008-12-01
感觉不错~~~具体的数据真实性还待证实
zhzhxh 2008-12-02
nesta13 写道
感觉不错~~~具体的数据真实性还待证实

做到绝对的价格实时跟踪,我觉得,还是比较困难的。
我们现在的策略是每周更新一次

大家对这方面有什么高见?
shuo 2008-12-02
挺不错的 呵呵
yaozhan189 2008-12-02
很不错的网站 well
zhzhxh 2008-12-02
通过这个网站,大家不仅可以交流业务,也多交流下技术上的
yaozhan189 2008-12-02
现在网站数据量达到多少了?
搜索了 “青崖”出来我想要的书
不错不错
fys124974704 2008-12-02
我曾经 有一个朋友做了一个爬虫,他可以检测到指定站点的更新,如果已有更新爬虫就会知道url 并马上爬下来,至于你做索引,就要看你系统了!这样做,可以保证你的资料是最新的!
zhzhxh 2008-12-02
fys124974704 写道
我曾经 有一个朋友做了一个爬虫,他可以检测到指定站点的更新,如果已有更新爬虫就会知道url 并马上爬下来,至于你做索引,就要看你系统了!这样做,可以保证你的资料是最新的!


那假如我们有几十万的书的页面,他的爬虫能够及时监测到他们的更新吗?

fys124974704 2008-12-03
他是做职位搜索的,在各大人才网上面爬信息!所以基本上你碰到的问题和他碰到的问题应该会很相似的!
chineselio 2008-12-03
请教下,索引的更新操作的策略。
Global site tag (gtag.js) - Google Analytics