使用搜索引擎solr的步骤

2019-03-27 00:24|来源: 网路

最近项目中使用到了搜索引擎solr,大体的一些步骤先记录下来:

1. 首先在搜索引擎的项目中加入所需要查询的数据类 *Data对应的bean和searchClient,bean是按照data数据里面的变量及其类型来定义的,

@Field("dwdm")

private String dwdm;

这种形式,并有get和set方法;searchClient是继承了之前写过的searchClient类。

2.接下来就是在apache-solr-1.4.1服务端做对应的配置,在example文件夹下的multicore文件夹下,找到一个已有的配置好的文件夹复制一下,改个名字比如yzdwsx。

1)在conf文件夹下找到schema.xml文件,修改其name:<schema name="yzdwsx" version="1.2">,找到

<fields>

<field name="id" type="string" indexed="true" stored="true"/>。。。。

按照bean里面的变量及其类型,在这里进行配置。如果数据里面没有id,可以自己加上。因为默认id是主键。 <copyField source="dwmc" dest="text"/> 这里配置的是搜索的属性。

2)solrconfig.xml文件中找到<dataDir>${solr.data.dir:./solr/data/yzdwsx}</dataDir>改为自己命名的文件名

3)在multicore文件夹里面有solr.xml文件,在其中配置自己的yzdwsx,<core name="yzdwsx" instanceDir="yzdwsx" dataDir="/log/solr/cores_data/yzdwsx" /> 4)配置好之后,在example文件夹下有start.bat文件,配置自己文件所在位置。然后启动该文件。

如果没有报错则说明配置正确,在http://127.0.0.1:8983/solr/ 路径下可以看到自己配置的yzdwsx。

但是要想将数据正在的导入solr中,还需要编写程序,将数据库中的数据查询出来之后,通过addbean把数据加入到solr的bean中。至此才会把数据库中的数据写入到solr中。


转自:http://2694306.blog.51cto.com/2684306/1256038

相关问答

更多
  • “西林街”、“盘搜一下”这两个网盘搜索速度快,资源丰富,我所钟爱用的。
  • 全文搜索 MATCH() 函数 全文索引在 MySQL 中是一个 FULLTEXT 类型索引。FULLTEXT 索引用于 MyISAM 表,可以在 CREATE TABLE 时或之后使用 ALTER TABLE 或 CREATE INDEX 在 CHAR、VARCHAR 或 TEXT 列上创建。对于大的数据库,将数据装载到一个没有 FULLTEXT 索引的表中,然后再使用 ALTER TABLE (或 CREATE INDEX) 创建索引,这将是非常快的。将数据装载到一个已经有 FULLTEXT 索引的表中 ...
  • 首先要弄清楚是自己的站内检索,还是对网络的检索?如果仅仅检索自己本站里面的东西很简单,在apache上把lucene下载下来,里面有个很好的例子,再去找找相关资料就行了,如果想对中文分词做好点,去看看庖丁分词法.
  • 1、首先,到域名查询中心,比如万网、新网或者能查询域名所有者的地方去查询域名的注册信息,是否以前被注册过(就是我们常用的Whois查询)。如果域名曾经被注册过,我们就需要关心一下这个域名是否有过不良记录。 2、通过在Google中(site:域名),看下是否有记录,然后查看下反向链接,利用(link:域名)或者(domain:域名)可以到一些提供查询反向连接的网站去查询或者自己到搜索引擎利用命令查询。如果存在反向连接,而没有该站点被搜索引擎收录,那么这个域名很有可能被K过了,也就是存在不良记录。 3、直接输 ...
  • 在浩如烟海的Internet上,特别是其上的Web(World Wide Web万维网)上,不会搜索,就不会上网。网虫朋友们,你了解搜索引擎吗?它们是怎么工作的?你都使用哪些搜索引擎?今天我就和大家聊聊搜索引擎的话题。 一、搜索引擎的分类 获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(FullText Search Engine)和分类目录Directory)。 全文搜索引擎的数据库是依靠一个叫“网络机器人(Spi ...
  • 做好你的站内优化和你的站外优化,这两个弄好啦,搜索排名自然提升了
  • 这方面的书还是比较多的,我所看过的有《搜索引擎技术》、《个性化搜索引擎原理与技术》、《搜索引擎原理、实践与应用》。此外还有很多基于开源软件如Lucene、nutch的开发搜索引擎的书籍,其中也介绍了不少关于原理方面的东西,而且更加面向应用。
  • 全文搜索 MATCH() 函数 全文索引在 MySQL 中是一个 FULLTEXT 类型索引。FULLTEXT 索引用于 MyISAM 表,可以在 CREATE TABLE 时或之后使用 ALTER TABLE 或 CREATE INDEX 在 CHAR、VARCHAR 或 TEXT 列上创建。对于大的数据库,将数据装载到一个没有 FULLTEXT 索引的表中,然后再使用 ALTER TABLE (或 CREATE INDEX) 创建索引,这将是非常快的。将数据装载到一个已经有 FULLTEXT 索引的表中 ...
  • lucene的效率没有问题,你可以100W条记录的索引放在一台机器上,用nutch分开检索的算法,或者用hadoop存储索引,自己写一个indexsearcher,但是需要注意各个机器上的结果是本地最优不是全局最优的结果,如果想全局最优的结果还得采用全局频率计数(Nutch现在有没有我不清楚),或者放开各个机器返回结果的数量,从算法理论的角度上最大可能的获得最优解。100W记录的响应我测试过,应该可以满足要求。等你遇到什么问题,可以再联系,lucene后面的基准测试你也可以看看。 老吴
  • Lucene系列中没有任何项目可以本地处理PDF,但是您可以使用实用程序并写出关于如何推出自己的示例。 正如托尼上面所说,Lucene几乎可以做任何你需要的事情,但是你的时间会有很多开销。 数以千计的文件实际上并不是那么多,所以你或许可以用更轻的替代品逃脱。 也就是说,我仍然会建议您看看Solr--它比Lucene更容易设置,支持备份,复制等,以及一个非常适合您的用例的漂亮JSON接口: http: //wiki.apache.org/solr/SolJSON None of the projects in ...