如何对一个Document的不同Filed使用不同的分词器

TonyLian 2010-01-25
如题。
对于文章正文,希望使用中文分词器。

而用户在提交文件时让其输入的文章关键字,多个用空格分开,则希望使用WhitespaceAnalyzer进行分词并保存。


doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));

luckaway 2010-01-26
自己实现分词器! 研究下lucene相关的代码,还是蛮简单的!
illu 2010-01-26
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer  field对应分词器
wrapper.addAnalyzer(fieldName, analyzer);
TonyLian 2010-01-26
illu 写道
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
    new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer  field对应分词器
wrapper.addAnalyzer(fieldName, analyzer);


大开眼界呀!去研究一下~
Global site tag (gtag.js) - Google Analytics