[hadoop] ucene+hadoop+HBase流程

make19830723 2010-11-12
请问高手们lucene+hadoop+HBase流程怎样的?我这里不使用蜘蛛抓取网页,是通过人为的抓取我们需要的网站,我知道抓取的内容(文字或者图片)通过hadoop分布式存储,那么我的索引文件要不要分布式存储呢。
创建和搜索的一个流程是怎么样的??
Global site tag (gtag.js) - Google Analytics