如何对一个Document的不同Filed使用不同的分词器

TonyLian 2010-01-25

如题。
对于文章正文，希望使用中文分词器。

而用户在提交文件时让其输入的文章关键字，多个用空格分开，则希望使用WhitespaceAnalyzer进行分词并保存。

doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));

luckaway 2010-01-26

自己实现分词器！研究下lucene相关的代码，还是蛮简单的！

illu 2010-01-26

可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer field对应分词器
wrapper.addAnalyzer(fieldName, analyzer);

TonyLian 2010-01-26

illu 写道

大开眼界呀！去研究一下~

发表回复

>>返回群组首页

如何对一个Document的不同Filed使用不同的分词器

相关讨论

相关资源推荐