[solr] 请教 solr 中文分词问题

BillyChow 2011-09-01
我参考这篇文章成功配置好了 solr,并且测试结果一致,但在实际使用中却碰到一点问题。

1. 英文搜索 test,可以找到相应条目如下:
http://localhost:8983/solr/select/?q=fulltext1_en:test&version=2.2&start=0&rows=10&indent=on&analysis.fieldtype=textComplex

<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">5</int>
<lst name="params">
  <str name="indent">on</str>
  <str name="start">0</str>
  <str name="q">fulltext1_en:test</str>
  <str name="analysis.fieldtype">textComplex</str>
  <str name="version">2.2</str>
  <str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="31" start="0">
<doc>
  <str name="description_en">Our best-selling classic style jeans sits straight through the seat, thigh and leg. 昨天下雨了吗 test 测试</str>
  <str name="fulltext1_en">classic-jeans Enabled Yes Classic Jeans 今天天气不错2 Our best-selling classic style jeans sits straight through the seat, thigh and leg. 昨天下雨了吗 test 测试 Our best-selling classic style jeans sits straight through the seat, thigh and leg. 昨天下雨了吗 test 测试 99.99</str>
  <str name="id">188</str>
  <bool name="in_stock">true</bool>
  <str name="name_en">Classic Jeans 今天天气不错2</str>
</doc>

2. 若是使用中文的话,除了“测试”可以搜索到,其它的词如“今天”,“天气”等都不能搜索到。


PS: 难道提交的文档必须先自己分词好了, 再以分词后的结果存入 solr ?
tan8888 2011-10-11
得自己配置中文分词,没有配的话,就被分成单字了
BillyChow 2011-10-20
tan8888 写道
得自己配置中文分词,没有配的话,就被分成单字了

可否具体说明一下, 目前这方面的资料不是很多, 大部分都是转贴.
我是按照上面的那篇文章里配置的, 难道说还有什么要配置的?
Global site tag (gtag.js) - Google Analytics