首页 \ 教程 \ solr

知识点

Solr

开源搜索引擎solr4.0+tomcat7实现中文分词

调研：开源搜索引擎

Solr java 的开源搜索引擎

我的开源搜索引擎之路

用开源软件建垂直搜索引擎

Solr 4.5.1 搜索引擎环境搭建

搜索引擎之solr小结

使用搜索引擎solr的步骤

8 个基于 Lucene 的开源搜索引擎推荐

使用nutch和solr建立搜索引擎

constellio——基于solr的开源搜索引擎系统源码研究（四）

constellio——基于solr的开源搜索引擎系统源码研究（三）

solr搜索引擎问题

基于Solr构建企业搜索引擎

开源搜索引擎Solr环境配置、中文分词、数据库做为索引源及索引操作

2019-03-27 01:18|来源: 网路

一、配置solr环境

1、下载solr http://www.apache.org/dyn/closer.cgi/lucene/solr/

此处用的是3.5 解压到D盘D:/solr/apache-solr-3.5.0

2、修改tomcat conf/server.xml

添加编码的配置 URIEncoding="UTF-8" （如不添加，中文检索时因为乱码搜索不到）

3、配置solr

Tomcat conf/Catalina/localhost下添加solr.xml

内容：

</Context>

4、启动tomcat 输入http://localhost:8080/solr/ 出现欢迎界面表示成功

二、中文分词配置

1、下载分词器： http://code.google.com/p/mmseg4j/

2、下载词库：http://code.google.com/p/mmseg4j/downloads/detail?name=data.zip&can=2&q

3、将解压后的mmseg4j-1.8.5目录下的mmseg4j-all-1.8.5.jar拷贝到Tomcat的webapps/solr/WEB-INF/lib目录下。

4、添加词库：在D:/solr/apache-solr-3.5.0/example/solr目录下新建dic文件夹，将解压后的data目录下的words.dic拷贝到D:/solr/apache-solr-3.5.0/example/solr/dic目录下。

5、更改schema.xml(D:/solr/apache-solr-3.5.0/example/solr/conf/)文件，使分词器起到作用。

在schema.xml的<types>、<fields>和部分新增如下配置：

注：dicPath=" "是你的词库路径。

</analyzer>

</fieldType>

</analyzer>

</fieldType>

</analyzer>

</fieldType>

重启你的tomcat。

访问：http://localhost:8080/solr/admin/analysis.jsp可以看 mmseg4j 的分词效果。在 Field 的下拉菜单选择 name，然后在应用输入 complex。分词的结果，如下图：

好了，可以运行起来了，那就添加个文档试下，在解压后的D:/solr/apache-solr-3.5.0/example/exampledocs目录下创建 mmseg4j-solr-demo-doc.xml 文档，内容如下：

<add>

<doc>

<field name="text">高效、灵活的缓存功能，垂直搜索功能。</field>

</doc>

<doc>

<field name="text"> Solr是一个高性能，采用Java5开发，基于Lucene的全文搜索服务器。</field>

</doc>

<doc>

<field name="text"> 独立的企业级搜索应用服务器</field>

</doc>

</add>

注意：使用的字段name必须在solr的配置文件schem.xml增加

下(id、title)一样

然后在 cmd 下运行 post.jar，如下：

D:\solr\apache-solr-3.5.0\example\exampledocs>java -Durl=http://localhost:8080/

solr/update -Dcommit=yes -jar post.jar mmseg4j-solr-demo-doc.xml

注意：mmseg4j-solr-demo-doc.xml 要是 UTF-8 格式，不然提交后会乱码。还有在查询中文时需要把tomcat设置成URIEncoding="UTF-8";

查看是否有数据，访问：http://localhost:8080/solr/admin/ 在Query String: 中输入“高性能”

显示如下图所示：

三、Solr将数据库做成索引数据源（以mysql为例）

1、在solrconfig.xml中配置导入数据功能(D:\solr\apache-solr-3.5.0\example\solr\conf下)

<str name="config">D:\solr\apache-solr-3.5.0\example\solr\conf\db\db-data-config.xml</str>

</lst>

</requestHandler>

2、添加一个数据源db-data-config.xml (D:\solr\apache-solr-3.5.0\example\solr\conf\db下)

</entity>

</document>

</dataConfig>

CREATE TABLE t_user

(

id VARCHAR(255) PRIMARY KEY,

name VARCHAR(10) NOT NULL,

title VARCHAR(10)

);

3、放入mysql驱动包（Tomcat的webapps/solr/WEB-INF/lib目录下）

4、创建索引

http://localhost:8080/solr/dataimport?command=full-import

5、查看是否成功，访问：http://localhost:8080/solr/admin/ 在Query String: 中输入“sunshan”、“孙闪”

如下图：

注：保证与数据库连接正确

四、Solr多核（MultiCore）配置

1、拷贝multicore（D:\solr\apache-solr-3.5.0\example下）下的core0、core1、exampledocs到solr（D:\solr\apache-solr-3.5.0\example\solr下）目录下

2、更改solr.xml（D:\solr\apache-solr-3.5.0\example\solr下）配置

添加:

配置后：

</cores>

3、启动tomcat 访问：

http://localhost:8080/solr/

五、多核数据库索引：

同上配置

注：出现错误Error loading class 'org.apache.solr.handler.dataimport.DataImportHandler'

需配置（solrconfig.xml里）

dir注意路径

重启tomcat

创建索引：http://localhost:8080/solr/core1/dataimport?command=full-import

http://localhost:8080/solr/dataimport?command=full-import 这 url 告诉 solr 做全量索引，做索引中会删除所有数据。当然也可以用 clean=false 参数来告诉它不删除，但也会删除相同id的（在 scheam.xml 的uniqueKey 声明的）。http://localhost:8080/solr/dataimport?command=full-import&clean=false

批量导入command=delta-import&commit=y

重新装载配置文件command=reload-config

终止导入command=abort

转自：http://blog.csdn.net/kbeanwu/article/details/7873391

知识点

相关文章

最近更新

开源搜索引擎Solr环境配置、中文分词、数据库做为索引源及索引操作

相关问答

MYSQL 数据库中数据的订单越来越多打开后台订单列表的时候很慢[2023-07-31]

nginx环境下怎么设置对搜索引擎返回503[2023-01-11]

Mysql搜索引擎有那些？[2021-12-22]

做一个lucene搜索引擎[2023-05-05]

搜索引擎Lucene vs数据库搜索(Search engine Lucene vs Database search)[2024-03-01]

Mysql搜索引擎有那些？[2022-06-18]

关于java搜索引擎[2022-02-16]

搜索引擎的数据库(Database for a search engine)[2022-12-01]

将实体持久保存到数据库和搜索引擎(Persisting entities to both database and search engine)[2022-03-02]

基于Lucene的数据库搜索引擎(Lucene-based database search engine)[2022-01-03]

知识点

相关文章

最近更新

开源搜索引擎Solr环境配置、中文分词、数据库做为索引源及索引操作

相关问答

MYSQL 数据库中数据的订单越来越多 打开后台订单列表的时候很慢[2023-07-31]

nginx环境下 怎么设置对搜索引擎返回503[2023-01-11]

Mysql搜索引擎有那些？[2021-12-22]

做一个lucene搜索引擎[2023-05-05]

搜索引擎Lucene vs数据库搜索(Search engine Lucene vs Database search)[2024-03-01]

Mysql搜索引擎有那些？[2022-06-18]

关于java搜索引擎[2022-02-16]

搜索引擎的数据库(Database for a search engine)[2022-12-01]

将实体持久保存到数据库和搜索引擎(Persisting entities to both database and search engine)[2022-03-02]

基于Lucene的数据库搜索引擎(Lucene-based database search engine)[2022-01-03]

MYSQL 数据库中数据的订单越来越多打开后台订单列表的时候很慢[2023-07-31]

nginx环境下怎么设置对搜索引擎返回503[2023-01-11]