获取pdf文件的document时出错 - lucene - lucene爱好者

[lucene] 获取pdf文件的document时出错

jssay 2010-03-12

当我用pdfbox的LucenePDFDocument来获取Document实例时:

Document document  =  LucenePDFDocument.getDocument(fileName);

报出异常:

Exception in thread "main" java.lang.NoSuchFieldError: NOT_ANALYZED
at org.apache.pdfbox.searchengine.lucene.LucenePDFDocument.addKeywordField(LucenePDFDocument.java:170)
at org.apache.pdfbox.searchengine.lucene.LucenePDFDocument.convertDocument(LucenePDFDocument.java:257)
at org.apache.pdfbox.searchengine.lucene.LucenePDFDocument.getDocument(LucenePDFDocument.java:363)

我现在用的是pdfbox1.0以及lucene-core2.1.0,之前用pdfbox0.7.3和lucene-core2.0.0时报出Null Pointer错误,都是在同一个地方出的错.

我知道这个可能跟pdf的格式有关,因为有些pdf是可以的.但不知道如何解决这个问题,希望各位Lucene大师指点一二.

pjw0221 2010-03-13

pdfbox 1.0 用的lucene版本是2.4 你版本有问题。

jssay 2010-03-15

thanks, pjw0221. the problem has been solved.

发表回复

>>返回群组首页

[lucene] 获取pdf文件的document时出错

相关讨论

相关资源推荐