群组共享
名称 大小 描述 下载
data.zip 5 MB solr 支持ik分词 333
Lucene_in_Action_2nd_Edition.rar 3.1 MB Lucene in Action英文版 第二版,应该不错的 569
paoding-analysis-2.0.4-beta.zip 5.8 MB 庖丁中文分词包,有案例和介绍 440
ictclas4j.zip 2.9 MB 中科院的,不用说了吧 642
imdict-chinese-analyzer.zip 3.1 MB imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供中文分词支持。 357
analysis-data.zip 1.9 MB imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供中文分词支持。 136
Lucene_in_Action.rar 5.2 MB Lucene in Action英文版,可以和楼上的中文版一起看.可惜找不到免费的Lucene in Action, 2nd Edition 334
Lucene_In_Action_PDF中文版.rar 254.8 KB 初学lucene的朋友用的上的,网上评价挺好的,个人感觉也不错,希望能帮到一些朋友! 1095
IKAnalyzer2.0.2.rar 853.2 KB 来自“猎图网 www.richmap.cn”基于IKAnalyzer分词算法的准商业化Lucene中文分词器。 1. 正向全切分算法,42万汉字字符/每秒的处理能力(IBM ThinkPad 酷睿I 1.6G 1G内存 WinXP) 2. 对数量词、地名、路名的优化处理 3. 对未知词汇采用自识别结合二元切分算法,确保搜索召回率 正向全切分分词器:org.mira.lucene.analysis.IK_CAnalyzer(适合建索引时使用) 正向最大全切分分词器:org.mira.lucene. 1045
nips06-mapreducemulticore.zip 228.3 KB 来自哈佛,,,mapreduce,不知道的google下。 370
Global site tag (gtag.js) - Google Analytics