知识点
相关文章
更多最近更新
更多在linux 下安装 solr 的IK中文分词
2019-03-27 00:48|来源: 网路
今天安装solr的中文分词,参考了网上众多资料,一波三折,搞的挺郁闷的。现在终于初步搞定了,记录一下,方便新手。
失败的例子:
一:环境
Linux(CentOS5.5),Tomcat6.0,
ik-analyzer3.2.8 (http://code.google.com/p/ik-analyzer/downloads/list)
solr-3.5.0,关于Solr的配置见 http://www.cnblogs.com/thinkCoding/archive/2012/01/10/2318578.html,这里主要谈中文分词的安装。
二:教训
一开始用的是庖丁分词,试了几个小时,终于还是没有弄出来,我找到的网上最新的也是基于1.4的,想搬到3.5里,没成功,最终放弃。
三:正题
貌似很简单,就两步
1) 把下载好的IKAnalyzer3.2.8.jar放到 /tomcat/webapps/solr/WEB-INF/lib目录
2) 修改solr/conf/scheme.xml文件。
在众多fieldType里面加一条
<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
不知道solr文件夹指的是哪个?就是你在配置solr主目录时填的路径。
在windows下,你可能是这样的 (E:/apache-solr-3.5.0/example/solr)
<Context docBase="E:/apache-solr-3.5.0/dist/apache-solr-3.5.0.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="E:/apache-solr-3.5.0/example/solr" override="true" /></Context>
在Linux下,你可能是这样的(/usr/local/software/apache-solr-3.5.0/example/solr)
<Context docBase="/usr/local/software/apache-solr-3.5.0/dist/apache-solr-3.5.0.war" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="/usr/local/software/apache-solr-3.5.0/example/solr" override="true" /></Context>
ok。启动你的Tomcat。输入 http://ip:8080/solr/admin/analysis.jsp
如果你看到了这样的结果,恭喜你。但是总有悲摧的人。我就是其中一个,还悲摧了好几次。如果你也悲摧了,那么继续看见意。
四:见意
1、去Log里看,出现了一个权限错误,报什么80端口权限问题,啥啥啥的?好吧,用root去启动你的Tomcat。可能你还有其他的方法,不过我就这样了。
2、各种内部服务器500错误?好吧,很有可能是因为你的Tomcat不够干净。用一个刚下好的Tomcat去配置,或者干掉你所有的应用吧。
五:还没成功?哥们,我也不懂了。请继续Google。
可参考链接:
IK作者首页
http://martin3000.iteye.com/blog/807503
http://hi.baidu.com/lxgbest/blog/item/2e023912e6888747f919b87b.html JAVA环境下利用solrj二次开发SOlR搜索的环境部署常见错误
转自:http://www.cnblogs.com/thinkCoding/archive/2012/01/12/2320070
相关问答
更多-
java 中文分词为什么用 ik[2022-05-04]
ik分词器简单容易控制啊,反正我个人觉得ik不错 -
有关于IK分词器的在eclipse安装部署的问题[2023-04-07]
你直接把这两个文件ctrl c 然后鼠标点击项目 再ctrl v 相当于拷贝到项目根目录 反正我是这样弄的 可以用 -
solr ik分词怎么能同时实现中英文数字同时分词[2023-03-30]
可以看下这个Solr安装部署,里边包括安装、部署、添加中文分词等等 -
solr用qieqie庖丁加入中文分词问题[2021-12-08]
Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档: 实战Lucene,第 1 部分: 初识 Lucene: http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ 用Lucene加速Web搜索应用程序的开发: http://www.ibm.com/developerworks/cn/web/wa-lucene2/ 一、 solr介绍 solr是基于Lucene J ... -
solr的中文是什么意思[2022-03-20]
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。 用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。 -
电脑上安装Linux系统问题![2022-05-17]
给出下面的发行版LZ考虑下,务必确认都到维基百科详细的看过: slackware 13.1 fedora 13 opensuse 11.3 debian 5.03 archlinux 2010.5 gentoo 这个没有版本,因为整个系统是你自己编译组装起来的 建议不要使用ubuntu,红旗,ylmf 特别是ubuntu,用的多,毛病也多。 另外多数发行版给我的感觉就是发行版在使用你,而不是你在使用电脑,像windows一样不自由。 感觉slackware,archlinux,gentoo做得很好,当然要看 ... -
电脑上安装Linux系统问题![2022-06-14]
只要你的电脑不是老的夸张,几乎所有的Linux系统都可以安装的,并且大部分的主要Linux发行版都包含对简体中文的支持,因此可以任意选择。 另外还有一点要说明,大部分的Linux发行版安装都是很容易的,唯一的难点就是在磁盘分区的规划与分区文件系统的选择上,在这方面可以先到网上了解一下Linux文件系统的特点及与Windows的区别。如果实在不愿意自己DIY,也可以在安装时遵从安装程序的建议。 -
如果您尝试自行下载存档,则需要安装phpize。 如果您安装了phpize ,请手动执行此操作: pecl download solr-beta tar xvzf solr-2.0.0.tgz cd solr-2.0.0 phpize ./configure make sudo make install # add extension=solr.so to your php.ini / distribution extension loader ..这应该与pecl install solr-beta , ...
-
文档是一个很好的资源。 您可以在Alfresco服务器上运行安装程序,然后在Solr服务器上再次运行它。 在Alfresco服务器上,删除solr4 WAR。 在Solr服务器上,删除除Solr4 WAR之外的所有内容。 在alf_data中,有两个服务器上需要相同的密钥库目录。 您需要在Alfresco框中编辑alfresco-global.properties以指向Solr主机。 而且,您需要编辑Solr框中的alfresco-global.properties以指向solr索引。 在文档和这些提示之间 ...
-
无法启动SOLR服务(Not able to start SOLR service)[2023-02-11]
首先,您是否使用提供的过程来安装Solr服务页面461 其次,您是否在solr.in.sh脚本中为环境默认值设置了适当的覆盖(参考手册第462页)。 您还需要确保solr.in.sh文件中的LOG4J_PROPS指向您的log4j.properties文件。 还要确保SOLR_LOGS_DIR指向正确的位置。 如果一切正确,请检查log4j.properties文件中的值是否设置正确(参考手册中的第468页)。 您可以在此处获取参考手册: https : //www.apache.org/dyn/close ...