`

配置paoding analysis

    博客分类:
  • java
阅读更多

在开源中文analysis,我选择了paoding analysis,link:http://code.google.com/p/paoding
配置如下:
在CLASSPATH 上面加入:E:\eclipse\paoding-analysis.properties
在用户变量加入:PAODING_DIC_HOME=》E:\dic
把dic文件,就是字词文本文件放到对应的目录。

测试代码:

Java代码 复制代码
  1. package test;   
  2.   
  3. import java.io.IOException;   
  4. import java.io.Reader;   
  5. import java.io.StringReader;   
  6.   
  7. import net.paoding.analysis.analyzer.PaodingAnalyzer;   
  8. import net.paoding.analysis.analyzer.PaodingTokenizer;   
  9.   
  10. import org.apache.lucene.analysis.Analyzer;   
  11. import org.apache.lucene.analysis.Token;   
  12.   
  13. public class Test1 {   
  14.     public static void main(String[] argv){   
  15.         Analyzer analyzer = new PaodingAnalyzer();   
  16.         String testString = "中华人民共和国";   
  17.         Reader r = new StringReader(testString);   
  18.         PaodingTokenizer ts = (PaodingTokenizer) analyzer.tokenStream("", r);   
  19.            
  20.         Token t;   
  21.         try {   
  22.             while((t = ts.next()) != null){   
  23.                 System.out.println(t);   
  24.             }   
  25.         } catch (IOException e) {   
  26.             e.printStackTrace();   
  27.         }   
  28.     }   
  29. }  
package test;

import java.io.IOException;
import java.io.Reader;
import java.io.StringReader;

import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.paoding.analysis.analyzer.PaodingTokenizer;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;

public class Test1 {
	public static void main(String[] argv){
		Analyzer analyzer = new PaodingAnalyzer();
		String testString = "中华人民共和国";
		Reader r = new StringReader(testString);
		PaodingTokenizer ts = (PaodingTokenizer) analyzer.tokenStream("", r);
		
		Token t;
		try {
			while((t = ts.next()) != null){
				System.out.println(t);
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
}



结果:

Java代码 复制代码
  1. (中华,0,2)   
  2. (华人,1,3)   
  3. (人民,2,4)   
  4. (共和,4,6)   
  5. (共和国,4,7)   
  6. log4j:WARN No appenders could be found for logger (net.paoding.analysis.knife.PaodingMaker).   
  7. log4j:WARN Please initialize the log4j system properly. 
分享到:
评论
4 楼 whlngn 2012-03-18  
输出结果我只想取汉字,而不要后面的数字,应该如何实现,求回答
3 楼 enica 2009-12-02  
文件夹路径有中文  %e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b
我换了一个目录就ok了
2 楼 rongxh7 2009-07-12  
madonglingyan 写道
你好。我在eclipse里面用的庖丁解牛。然后会报这种错误
error in handler path=file:/G:/My Documents/%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b/paoding-analysis.jar!/paoding-analysis.properties
error in handler jarPath=/G:/My Documents/%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b/paoding-analysis.jar
Exception in thread "main" net.paoding.analysis.exception.PaodingAnalysisException: java.io.FileNotFoundException: G:\My Documents\%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b\paoding-analysis.jar (系统找不到指定的路径。)
at net.paoding.analysis.knife.PaodingMaker.getProperties(PaodingMaker.java:140)
at net.paoding.analysis.analyzer.PaodingAnalyzer.init(PaodingAnalyzer.java:70)
at net.paoding.analysis.analyzer.PaodingAnalyzer.<init>(PaodingAnalyzer.java:59)
at net.paoding.analysis.analyzer.PaodingAnalyzer.<init>(PaodingAnalyzer.java:52)
at sliversearch.Lucene.index(Lucene.java:26)
at sliversearch.Lucene.main(Lucene.java:132)
Caused by: java.io.FileNotFoundException: G:\My Documents\%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b\paoding-analysis.jar (系统找不到指定的路径。)
at java.util.zip.ZipFile.open(Native Method)
at java.util.zip.ZipFile.<init>(ZipFile.java:114)
at java.util.jar.JarFile.<init>(JarFile.java:133)
at java.util.jar.JarFile.<init>(JarFile.java:97)
at net.paoding.analysis.knife.PaodingMaker.getFileLastModified(PaodingMaker.java:248)
at net.paoding.analysis.knife.PaodingMaker.loadProperties(PaodingMaker.java:210)
at net.paoding.analysis.knife.PaodingMaker.getProperties(PaodingMaker.java:130)
... 5 more


可是我明明已经把这些properties文件考进去了啊。。请求回答,谢谢。。。


我也遇到这个问题,后来解决了!
用Eclipse建Java Project,你的jar包是怎么弄进项目里去的?直接放src下还是通过BuildPath的形式?这两种我试过,都不行.Eclipse路径是临时路径,有问题的.你建一个Dynamic Web Project,把jar文件放在lib目录就下了.
1 楼 madonglingyan 2009-06-24  
你好。我在eclipse里面用的庖丁解牛。然后会报这种错误
error in handler path=file:/G:/My Documents/%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b/paoding-analysis.jar!/paoding-analysis.properties
error in handler jarPath=/G:/My Documents/%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b/paoding-analysis.jar
Exception in thread "main" net.paoding.analysis.exception.PaodingAnalysisException: java.io.FileNotFoundException: G:\My Documents\%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b\paoding-analysis.jar (系统找不到指定的路径。)
at net.paoding.analysis.knife.PaodingMaker.getProperties(PaodingMaker.java:140)
at net.paoding.analysis.analyzer.PaodingAnalyzer.init(PaodingAnalyzer.java:70)
at net.paoding.analysis.analyzer.PaodingAnalyzer.<init>(PaodingAnalyzer.java:59)
at net.paoding.analysis.analyzer.PaodingAnalyzer.<init>(PaodingAnalyzer.java:52)
at sliversearch.Lucene.index(Lucene.java:26)
at sliversearch.Lucene.main(Lucene.java:132)
Caused by: java.io.FileNotFoundException: G:\My Documents\%e5%ba%96%e4%b8%81%e8%a7%a3%e7%89%9b\paoding-analysis.jar (系统找不到指定的路径。)
at java.util.zip.ZipFile.open(Native Method)
at java.util.zip.ZipFile.<init>(ZipFile.java:114)
at java.util.jar.JarFile.<init>(JarFile.java:133)
at java.util.jar.JarFile.<init>(JarFile.java:97)
at net.paoding.analysis.knife.PaodingMaker.getFileLastModified(PaodingMaker.java:248)
at net.paoding.analysis.knife.PaodingMaker.loadProperties(PaodingMaker.java:210)
at net.paoding.analysis.knife.PaodingMaker.getProperties(PaodingMaker.java:130)
... 5 more


可是我明明已经把这些properties文件考进去了啊。。请求回答,谢谢。。。

相关推荐

    paoding-analysis.jar

    paoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jarpaoding-analysis.jar

    paoding-analysis-2.0.4.zip_ Paoding Analysis

    Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词...

    paoding-analysis-4.4.0.jar

    paoding-analysis-4.4.0.jar 庖丁分词jar,支持lucene4.4.0及solr4.4.0版本。

    paoding analysis 3.0.1 jar (庖丁解牛分词器)

    由于庖丁官方目前提供可下载尚不...先下载2.0.4的版本(h t t p : / /code.google.com/p/paoding/),配置好环境后,引用paoding analysis 3.0.1 jar 代替paoding analysis 2.0.4 jar 即可,其他配置如词典等都不变。

    paoding-analysis3.0

    solr3 配置 paoding 需要的人可以下载

    paoding-analysis6.2.1.jar

    修改了paoding-analysis6的部分源码,使之支持lucene6.2.1

    paoding-analysis-4.3.0.jar

    paoding-analysis-4.3.0.jar

    paoding-analysis-4.1.0.jar

    paoding-analysis-4.1.0.jar,自己修改了一下源码,支持lucene4.1和solr4.1版本。

    paoding-analysis3.0.jar

    从http://paoding.googlecode.com/svn/trunk/paoding-analysis下载源码并编译的paoding-analysis3.0.jar 目前(2012年5月7日)是最新源码

    paoding-analysis3.5.jar

    paoding分词jar ,支持lucence3以上的版本。本人使用的lucence是3.5的,没有问题。

    paoding-analysis4.3.0.jar

    paoding-analysis4.3.0.jar,可以配合目前最新的lucene-4.3.0,sort-4.3.0使用,本人亲自测试过,一切正常的奥!

    适合lucene3.0用的paoding-analysis的jar包

    适合lucene3.0用的paoding-analysis的jar包 并且有和spring不冲突的spring jar包

    Paoding-analysis

    Paoding中文分词参考手册.htm paoding-analysis.jar

    paoding-analysis-4.0.0.jar

    paoding4.0支持lucene4.0 是修改源码后的可以支持lucene4.0的 除了这个包 需要注意的还需要一个logger包 还需要配置 词库路径 在环境变量中可以配置也可以在 paoding里面的 配置文件中配置 具体亲门 自己研究 如有...

Global site tag (gtag.js) - Google Analytics