新手提问,lucene输入简体怎么查询出简体、繁体都可以?

vicbay 2010-06-23
新手提问,lucene输入简体怎么查询出简体、繁体都可以?

谢谢大家~
class317hzy 2010-06-29
有两种解决办法,第一种, 索引的时候 简体繁体各索引一份.
第二种就得用分析器解决了, 找一个分析器能把简体和繁体都分析索引的. 查询的时候再将用户输入也用此分析器处理.
shadowlin 2010-06-30
哪那么麻烦嘛。你就索引一种,比如是简体。然后查询的时候把繁体转成简体去查询不就ok了。
推荐用简体索引,查询的时候转换繁体到简体。因为繁体和简体是多对一关系。
luckaway 2010-06-30
不知道UTF-8或者GBK在编码上,繁体和简体有没有规律可循,如果有规律,先判断字符范围,再通过算法来转换。没规律,那只能通过映射表来转换!

zhaobohao 2010-07-09
在引申一下,有没有想过。输入拼音,也可以查询出来的?
wwty 2010-07-09
shadowlin 写道
哪那么麻烦嘛。你就索引一种,比如是简体。然后查询的时候把繁体转成简体去查询不就ok了。
推荐用简体索引,查询的时候转换繁体到简体。因为繁体和简体是多对一关系。


恩,这个比较靠谱,因为lucene本身也是将你的搜索条件去进行加工到一种标准模式去查询的,包括索引的建立也是将数据加工到标准模式之后才建立的,这点在英文上尤为突出;所以你在其基础上引申一步:以简体为标准,将繁体转换为简体
Global site tag (gtag.js) - Google Analytics