在linux 下安装 solr 的IK中文分词

2019-03-27 00:48|来源: 网路

今天安装solr的中文分词,参考了网上众多资料,一波三折,搞的挺郁闷的。现在终于初步搞定了,记录一下,方便新手。

失败的例子:

一:环境

Linux(CentOS5.5),Tomcat6.0,

ik-analyzer3.2.8 (http://code.google.com/p/ik-analyzer/downloads/list)

solr-3.5.0,关于Solr的配置见 http://www.cnblogs.com/thinkCoding/archive/2012/01/10/2318578.html,这里主要谈中文分词的安装。

二:教训

一开始用的是庖丁分词,试了几个小时,终于还是没有弄出来,我找到的网上最新的也是基于1.4的,想搬到3.5里,没成功,最终放弃。

三:正题

貌似很简单,就两步

1) 把下载好的IKAnalyzer3.2.8.jar放到 /tomcat/webapps/solr/WEB-INF/lib目录

2) 修改solr/conf/scheme.xml文件。

在众多fieldType里面加一条

<fieldType name="text" class="solr.TextField"> 
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>


不知道solr文件夹指的是哪个?就是你在配置solr主目录时填的路径。

在windows下,你可能是这样的 (E:/apache-solr-3.5.0/example/solr)

<Context docBase="E:/apache-solr-3.5.0/dist/apache-solr-3.5.0.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="E:/apache-solr-3.5.0/example/solr" override="true" /></Context>

在Linux下,你可能是这样的(/usr/local/software/apache-solr-3.5.0/example/solr

<Context docBase="/usr/local/software/apache-solr-3.5.0/dist/apache-solr-3.5.0.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="/usr/local/software/apache-solr-3.5.0/example/solr" override="true" /></Context>

 

 

ok。启动你的Tomcat。输入 http://ip:8080/solr/admin/analysis.jsp

如果你看到了这样的结果,恭喜你。但是总有悲摧的人。我就是其中一个,还悲摧了好几次。如果你也悲摧了,那么继续看见意。

 

四:见意

1、去Log里看,出现了一个权限错误,报什么80端口权限问题,啥啥啥的?好吧,用root去启动你的Tomcat。可能你还有其他的方法,不过我就这样了。

2、各种内部服务器500错误?好吧,很有可能是因为你的Tomcat不够干净。用一个刚下好的Tomcat去配置,或者干掉你所有的应用吧。

五:还没成功?哥们,我也不懂了。请继续Google。

 

 

可参考链接:

IK作者首页

http://martin3000.iteye.com/blog/807503

http://wenku.baidu.com/view/5cb9932cb4daa58da0114a9b.html?from=rec&pos=0&weight=6&lastweight=4&count=5

http://hi.baidu.com/lxgbest/blog/item/2e023912e6888747f919b87b.html JAVA环境下利用solrj二次开发SOlR搜索的环境部署常见错误

如何同时启动多个Tomcat服务器



转自:http://www.cnblogs.com/thinkCoding/archive/2012/01/12/2320070

相关问答

更多
  • ik分词器简单容易控制啊,反正我个人觉得ik不错
  • 你直接把这两个文件ctrl c 然后鼠标点击项目 再ctrl v 相当于拷贝到项目根目录 反正我是这样弄的 可以用
  • 可以看下这个Solr安装部署,里边包括安装、部署、添加中文分词等等
  • Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档:   实战Lucene,第 1 部分: 初识 Lucene: http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/   用Lucene加速Web搜索应用程序的开发: http://www.ibm.com/developerworks/cn/web/wa-lucene2/   一、 solr介绍   solr是基于Lucene J ...
  • Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。 用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
  • 给出下面的发行版LZ考虑下,务必确认都到维基百科详细的看过: slackware 13.1 fedora 13 opensuse 11.3 debian 5.03 archlinux 2010.5 gentoo 这个没有版本,因为整个系统是你自己编译组装起来的 建议不要使用ubuntu,红旗,ylmf 特别是ubuntu,用的多,毛病也多。 另外多数发行版给我的感觉就是发行版在使用你,而不是你在使用电脑,像windows一样不自由。 感觉slackware,archlinux,gentoo做得很好,当然要看 ...
  • 只要你的电脑不是老的夸张,几乎所有的Linux系统都可以安装的,并且大部分的主要Linux发行版都包含对简体中文的支持,因此可以任意选择。 另外还有一点要说明,大部分的Linux发行版安装都是很容易的,唯一的难点就是在磁盘分区的规划与分区文件系统的选择上,在这方面可以先到网上了解一下Linux文件系统的特点及与Windows的区别。如果实在不愿意自己DIY,也可以在安装时遵从安装程序的建议。
  • 如果您尝试自行下载存档,则需要安装phpize。 如果您安装了phpize ,请手动执行此操作: pecl download solr-beta tar xvzf solr-2.0.0.tgz cd solr-2.0.0 phpize ./configure make sudo make install # add extension=solr.so to your php.ini / distribution extension loader ..这应该与pecl install solr-beta , ...
  • 文档是一个很好的资源。 您可以在Alfresco服务器上运行安装程序,然后在Solr服务器上再次运行它。 在Alfresco服务器上,删除solr4 WAR。 在Solr服务器上,删除除Solr4 WAR之外的所有内容。 在alf_data中,有两个服务器上需要相同的密钥库目录。 您需要在Alfresco框中编辑alfresco-global.properties以指向Solr主机。 而且,您需要编辑Solr框中的alfresco-global.properties以指向solr索引。 在文档和这些提示之间 ...
  • 首先,您是否使用提供的过程来安装Solr服务页面461 其次,您是否在solr.in.sh脚本中为环境默认值设置了适当的覆盖(参考手册第462页)。 您还需要确保solr.in.sh文件中的LOG4J_PROPS指向您的log4j.properties文件。 还要确保SOLR_LOGS_DIR指向正确的位置。 如果一切正确,请检查log4j.properties文件中的值是否设置正确(参考手册中的第468页)。 您可以在此处获取参考手册: https : //www.apache.org/dyn/close ...