IKAnalyzer与solr4.0的整合方法

2019-03-27 01:18|来源: 网路

1 环境配置

Jdk1.6, tomcat6,solr4.0.0,IKAnalyzer 2012FF

2 软件下载地址

Jdk1.6:http://download.oracle.com/otn-pub/java/jdk/6u37-b06/jdk-6u37-linux-i586.bin
tomcat6:http://archive.apache.org/dist/tomcat/tomcat-6/v6.0.29/bin/apache-tomcat-6.0.29.tar.gz
solr4.0.0:http://www.eu.apache.org/dist/lucene/solr/4.0.0/apache-solr-4.0.0.tgz
IKAnalyzer 2012FF:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

3 安装步骤

3.1 安装JDK 
   JDK安装省略,你只要安装完成在环境中设置JAVA_HOME即可,比如我这边是JAVA_HOME=/usr/local/jdk1.6.37

3.2 安装Tomcat
    tomcat安装省略,你只要安装完成在环境中设置JAVA_HOME即可,比如我这边是JAVA_HOME = /usr/local/tomcat

3.3 安装solr

  //解压solr压缩文件
  #tar -zxvf  apache-solr-4.0.0.tgz    

  //建立solr的索引和配置的存放目录
  #mkdir /opt/solr 

  //拷贝solr项目war包 
  #cp  apache-solr-4.0.0/dist/apache-solr-4.0.0.war  /opt/solr/solr.war

  //拷贝solr示例的配置文件
  #cp   -R apache-solr-4.0.0/example/solr/*   /opt/solr/

  //在tomcat下新建solr.xml文件,配置tomcat下solr的环境变量
  docBase:项目路径,solr/home:solr的配置和索引文件存放路径
  #vim  /usr/local/tomcat/conf/Catalina/localhost/solr.xml,加入以下内容:

<Context docBase=" /opt/solr/solr.war" debug="0" crossContext="true" >
    <Environment name="solr/home" type="java.lang.String" value="/opt/solr/" override="true" />
</Context>

3.4 安装 IKAnalyzer 

  //解压IKAnalyzer压缩文件
  #unzip IK Analyzer 2012FF_hf1.zip

  //拷贝IKAnalyzer相关文件IKAnalyzer.cfg.xml, IKAnalyzer2012FF_u1.jar, stopword.dic到solr项目的lib下
  #cd IK Analyzer 2012FF_hf1

  #cp  IKAnalyzer.cfg.xml IKAnalyzer2012FF_u1.jar  stopword.dic  /usr/local/tomcat/webapps/solr

  //应用IKAnalyzer中文分词功能,修改/opt/solr/collection1/conf/中的schema.xml,在<type></types>中增加如下内容:
 #vim /opt/solr/collection1/conf/schema.xml

 <fieldType name="text_suiyiwen" class="solr.TextField"> 
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>

  这样shcma.xml文件中定义为text_suiyiwen类型的字段就能使用IKAnalyzer中文分词功能了。

4.启动/停止solr

只要启动/停止Tomcat即可


转自:http://blog.csdn.net/dongxldante/article/details/8288445

相关问答

更多
  • 我说到的spring data jpa 只需要定义个借口,继承JpaRepository就可以了,然后就能做crud操作,而且有方便的分页和排序功能。我现在需要把全文索引功能整合进来,用添加solrServer bean 的方法应该是可以,但是比较繁琐,理由见原帖。   
  • tomcat配置数据源solr使用数据源 1、tomcat中配置数据源(注:需要拷贝jdbc相关jar包到tomcat中。tomcat6.x/lib目录下,注意tomcat6.0以下的版本在tomcat5.x/common/lib/目录下) 在server.xml文件,找到“Engine-> Host -> Context”,在其下面
  • 我常用 IKAnalyzer 分词, 至于庖丁分词 应该大同小异,你可以借鉴下 第一步,将 IKAnalyzer jar 放到 solr lib 文件夹下 第二步, solr core 的 schema.xml 定义一个自定义 类型,使用 IKAnalyzer 来解析(index&query) 第三步,此时 字段 就可以使用这个类型了 然后,就是些 IK的精细化 配置, 比如 同义词,词典 扩充等等,
  • 1. commit 有返回值的 UpdateResponse updateResponse = solrServer.commit();int status = updateResponse.getStatus()这里的 status 可以拿到操作执行的状态 ,0表示 成功 if (status != 0) { log.error("Some horrible error has occurred, status is:" + status); } 2. try{ UpdateResponse addBea ...
  • 好的,我发现了。 如果有人感兴趣:longs似乎在Solr 4.0中使用不同类型的编码,所以我们可以像上面的代码一样将它们作为普通字符串处理,但后来我们必须使用不同的解析器将term值转换为long: FieldCache.NUMERIC_UTILS_LONG_PARSER.parseLong(term) 当没有更多元素存在时,它似乎抛出异常。 至于现在它工作正常。 Ok, i found it out. If anyone is interested: longs seem to use differ ...
  • 看起来像打包器(Bitnami)没有包含该库,即使他们让Solr配置为使用该库。 你可以要求他们解决它。 或者您可以自己部署它。 以下是在Tomcat上部署Solr的方法。 它同样易于在Windows上安装; 它从Windows服务开始。 安装后,要启用富文档支持,请将contrib/extraction/lib/的内容复制到目录,并将sharedLib中的solr.xml指向该目录。 如果您使用过该指南,您将理解这些新术语:-) Looks like the packager (Bitnami) did ...
  • 使用solr 4.0, BaseTokenFilterFactory现在是org.apache.lucene.analysis.util.TokenFilterFactory ,所以你可以检查一下 。 With solr 4.0 the BaseTokenFilterFactory is now org.apache.lucene.analysis.util.TokenFilterFactory, so you can check on this.
  • 除了新功能之外,Solr 3.6和Solr 4.0之间是否有任何重大差异? 我发现这个问题很奇怪,至少可以说。 错误修复和新功能是发布的全部内容! 您可以在此处查看 Solr版本的完整更新日志。 不要忘记Solr和Lucene是一致发布的,所以你还需要在两个项目中寻找相关的变化。 我可以安全地使用我在Solr 4.0中的现有查询(在Solr 3.6中工作的查询)吗? 查询应该没问题,但索引 - 可能不是。 引用另一篇SO帖子中的 javanna: 索引格式已更改,但Solr将负责升级索引。 一旦用旧索引启动 ...
  • 据我所知,这不能在Solr 4.0中完成,只能在Solr-ra http://solr-ra.tgels.com中完成 .Solr 4.0具有软提交功能,有助于NRT搜索要求。 它有一个新功能,通过启用记录更新但没有搜索功能,支持get操作而不提交。 As far as my understanding this can't be done in Solr 4.0 but only in Solr-ra http://solr-ra.tgels.com Solr 4.0 has the soft commi ...
  • SOLR-1967问题已有近2年的历史,您使用的罐子并不适用于Solr 4.x. 实际上, QueryResponseWriter接口已移至org.apache.solr.response包。 你有两个选择: 试图让它与Solr 3.x一起工作(不确定它是否可以开箱即用3.5) 尝试在Solr主干中集成附加到补丁的源代码,以适应和修复您找到的错误 The SOLR-1967 issue is almost 2 years old and the jar you're using is not meant t ...