群组共享
名称 | 大小 | 描述 | 下载 |
data.zip | 5 MB | solr 支持ik分词 | 333 |
Lucene_in_Action_2nd_Edition.rar | 3.1 MB | Lucene in Action英文版 第二版,应该不错的 | 569 |
paoding-analysis-2.0.4-beta.zip | 5.8 MB | 庖丁中文分词包,有案例和介绍 | 440 |
ictclas4j.zip | 2.9 MB | 中科院的,不用说了吧 | 642 |
imdict-chinese-analyzer.zip | 3.1 MB | imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供中文分词支持。 | 357 |
analysis-data.zip | 1.9 MB | imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供中文分词支持。 | 136 |
Lucene_in_Action.rar | 5.2 MB | Lucene in Action英文版,可以和楼上的中文版一起看.可惜找不到免费的Lucene in Action, 2nd Edition | 334 |
Lucene_In_Action_PDF中文版.rar | 254.8 KB | 初学lucene的朋友用的上的,网上评价挺好的,个人感觉也不错,希望能帮到一些朋友! | 1095 |
IKAnalyzer2.0.2.rar | 853.2 KB | 来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。 1. 正向全切分算法,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP) 2. 对数量词、地名、路名的优化处理 3. 对未知词汇采用自识别结合二元切分算法,确保搜索召回率 正向全切分分词器:org.mira.lucene.analysis.IK_CAnalyzer(适合建索引时使用) 正向最大全切分分词器:org.mira.lucene. | 1045 |
nips06-mapreducemulticore.zip | 228.3 KB | 来自哈佛,,,mapreduce,不知道的google下。 | 370 |