最近更新文章

搜索篇:lucene的简单实例<一>

说明一下,这一篇文章的用到的lucene,是用2.0版本的,主要在查询的时候2.0版本的lucene与以前的版本有了一些区别. 其实这一些代码都是早几个月写的,自己很懒,所以到今天才写到自己的博客上,高深的文章自己写不了,只能记录下一些简单的记录与点滴,其中的代码算是自娱自乐的,希望高手不要把重构之类的砸下来... 1、在windows系统下的的C盘,建一个名叫s的文件夹,在该文件夹里面随便建三个 ...
llv 评论 (4) 有 7402 人浏览 2012-06-29

Lucene简单介绍

使用Lucene作为搜索引擎,应用系统需要做两件事情: (1)建立索引文件。下面给一个接口SearchManager来定义一般要用到的方法。 SearchManager代码如下: java 代码 public interface SearchManager { public boolean isSearchEnabled(); public void setSearchEn ...
jefferson 评论 (0) 有 6258 人浏览 2011-05-26

lucene 入门(转)

Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文 ...
youngbean 评论 (5) 有 8531 人浏览 2011-05-26

用Lucene构造简单搜索!

Lucene是一个开源世界里最有名的搜索引擎包,关于它的介绍现在网络上也有很多了,特别是车东的文章http://www.chedong.com/tech/lucene.html,网上流传至广。现在还有一本《Lucene In Action》的电子书是详细介绍的Lucene,可以down下来看。今天先来对硬盘文件实现简单的索引和搜索功能。 用Lucene建立索引步骤: [1]指定索引源文件夹(dat ...
javaeyes 评论 (2) 有 5908 人浏览 2011-05-26

使用Lucene+Paoding构建SSH2系统的站内搜索

目标:创建一个具有高度可移植的,定时创建索引的站内搜索。 途径:dic和index都放到程序中去。 准备: 1 Lucene Lucene Java(以下简称Lucene)目前可用版本是2.4.0,关于Lucene的详细信息请查看http://lucene.apache.org/java/docs/index.html。 2 Paoding Qieqie同学的伟大作品、优秀的Lucene中文分 ...
jiyanliang 评论 (3) 有 7759 人浏览 2011-05-26

介绍一款基于字典的中文分词器Shuzhen分词器,或许大家会用得上

ShuzhenAnalyzer是一款用java写的基于字典的中文分词器,可与Lucene一起使用构建搜索引擎系统,目前最新版本是1.1.4. 1、这款分词器可说很好的结合了字典条目数量与分词速度两者,字典条目数量在趋于无穷的情况下,分词速度受的影响却很小;彻底杜绝了因为字典条目数量而导致的内存溢出问题。 2、分词采用完全匹配(自命名)方式,也就是只要是符合字典系统中条目的就全部匹配出来,比如对“ ...
iilucene 评论 (1) 有 2391 人浏览 2011-05-26

30分钟搭建一个百万全文搜索

公司重心转移,不再是搜索。所以比较有空写写博。 solr是lucene的企业级扩展,很好很强大。solr的性能 http://wiki.apache.org/solr/SolrPerformanceData, 现在使用solr的网站 http://wiki.apache.org/solr/PublicServers 我习惯使用tomcat,安装参考:http://wiki.apache ...
imjl 评论 (15) 有 10883 人浏览 2011-05-26

Lucene的评分(score)机制的简单解释

通过Searcher.explain(Query query, int doc)方法可以查看某个文档的得分的具体构成。 在Lucene中score简单说是由 tf * idf * boost * lengthNorm计算得出的。 tf:是查询的词在文档中出现的次数的平方根 idf:表示反转文档频率,观察了一下所有的文档都一样,所以那就没什么用处,不会起什么决定作用。 boost:激励因子,可以通 ...
grantbb 评论 (2) 有 8715 人浏览 2011-05-26

使用solr搭建你的全文检索

Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档:<o:p></o:p> 实战Lucene,第 1 部分: 初识 Lucene:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/<o:p></o:p> 用Lucene加速 ...
ronghao 评论 (5) 有 14380 人浏览 2011-05-26

Heritrix使用的初步总结

一、框架介绍 公司最近项目要用到全文检索,检索对象是一些网站的网页内容,要使用到网络爬虫工具。 目前技术选型对象主要有两个:Heritrix 和 Nutch。二者均为Java开源框架,Heritrix 是 SourceForge上的开源产品,Nutch为Apache的一个子项目,它们都称作网络爬虫/蜘蛛( Web Crawler),它们实现的原理基本一致:深度遍历网站的资源,将这些资源抓取 ...
jason823 评论 (2) 有 7349 人浏览 2011-05-26

Lucene Hack之通过缩小搜索结果集来提升性能 (2)

作者:caocao(网络隐士),http://www.caocao.name,http://www.caocao.mobi 转载请注明来源:http://www.iteye.com/topic/80073 书接前文(http://www.iteye.com/topic/78884),上回说了个大致的原理,这回开始上代码。 五、原则 1、不改动lucene-core的代码 肆意改动lucene-c ...
caocao 评论 (4) 有 3547 人浏览 2011-05-26

Lucene进阶:and 和or的条件查询

在用Lucene实现全站搜索的过程中,很可能会遇到这样的问题,只所有某种特定的信息资源,而不是全部.如:某综合性站点,有新闻,产品,论坛,Blog,视频等资源,而搜索的时候先选一个类型(下拉列表),再输入关键字进行搜索(当然,这种情况可以直接用sql来实现,我们这里是基于lucene的实现考虑).这种情况下,就要用到and和or的查询了.这里假设索引已经建立好了(如何建立索引请参考:http://w ...
DavyLee 评论 (0) 有 8282 人浏览 2011-05-26

Lucene(Lucence)建立索引(字段)

Lucene,这是官方称谓,也有许多人叫它Lucence,做搜索和分词用的工具包.也有人说是Java下的搜索引擎框架库,见仁见智的说法罢了.不管叫什么,确实非常有用,比如做全站的搜索,其实它的用处远大于此,但凡涉及到文本搜索的地方就能用到它.我们就以做全站搜索为例,演示一下如何应用Lucene建立索引. public void index(List<IArticle> list) { ...
DavyLee 评论 (1) 有 4875 人浏览 2011-05-26

基于lucene的对数据库&文件夹检索(ss2,appfuse,jdon,nutch杂烩)

整个工程文件和src,lib包可以用ss2下lib包。 完成了基本的对数据库表和文件夹(本来是对vss做索引,老大说没时间了,就对文件夹做就行了)的索引维护,对常用的office文件和rar,zip文件进行解析索引,中文分词用ck(这里多的是分词,可以找更好的)。 应用需要修改config/jdbc.properties lucene.properties lucene.xml 以及dataAcce ...
jusescn 评论 (0) 有 3135 人浏览 2011-05-26

Lucene应用的一点体会

Lucene应用(我用的是Lucene2.1.0,有些观点有可能也不太正确) 1.多线程索引,共享同一个IndexWriter对象 这种方式效率很慢,主要原因是因为: java 代码 public void addDocument(Document doc, Analyzer analyzer) throws IOException { SegmentInfo newSegmentI ...
ttitfly 评论 (0) 有 2745 人浏览 2011-05-26

知识库信息

最新评论

受用了
阿浊I 评论了 Lucene的评分(score)机制的简单解释
顶 很好啊
mnieguomin 评论了 Heritrix使用的初步总结
,没实质内容,鄙视
foollb 评论了 30分钟搭建一个百万全文搜索
不错不错,学到点东西了。
就叫我雷峰吧 评论了 使用Lucene+Paoding构建SSH2系统的站内搜索
http://50vip.com/?t=lucene这里也有lucene的应用~
wzwahl36 评论了 搜索篇:lucene的简单实例<一>
强烈鄙视标题党!!!
net211211 评论了 30分钟搭建一个百万全文搜索
如何实现更新频繁更新的数据进行实时搜索,求思想Email:hhfsky@126.com谢谢!!
hhfsky 评论了 用Lucene构造简单搜索!
http://blog.csdn.net/main_xtgjfge/article/details/8 ...
main_xtgjfge 评论了 搜索篇:lucene的简单实例<一>
挺好的谢谢
honsty2010 评论了 使用Lucene+Paoding构建SSH2系统的站内搜索
晕,华丽丽的编译出错~~
clsgo 评论了 搜索篇:lucene的简单实例<一>
这个是1.4的吧,Lucene版本间差别有点大
yjp0501 评论了 搜索篇:lucene的简单实例<一>
[flash=200,200][/flash]
junjun871012 评论了 Lucene的评分(score)机制的简单解释
给力
zdlhkblty 评论了 Lucene相关度排序的调整
学习了… [color=darkred][/color]
ahhsxycb 评论了 Lucene(Lucence)建立索引(字段)
哎。题目好大。。。内容很乱。
mebitten 评论了 30分钟搭建一个百万全文搜索
...
liweixw 评论了 30分钟搭建一个百万全文搜索
...
kanwangzjm 评论了 使用Lucene+Paoding构建SSH2系统的站内搜索
[img][/img][url][/url][flash=200,200][/flash]
349153273 评论了 lucene 入门(转)
什么东西?
zhameng 评论了 30分钟搭建一个百万全文搜索
...
rxopt 评论了 使用solr搭建你的全文检索
Global site tag (gtag.js) - Google Analytics