solr和elasticsearch小结

2019-03-27 01:18|来源: 网路

前段时间在系统的学习solr和elasticsearch,前者是之前就接触过的,后者是其他部门过来一个大神带过来的技术。之前我们用solr搭建的是单核(core)全文检索,一个网站,一个solr,一个索引库,一个表,很有局限性,最近搭起了一个多核(cores)的solr,同时通过配置Scripts文件(solr_home/conf/scripts.conf)里内容搭建一个分布式搜索引擎。但是,solr的分布式搜索有个比较纠结的问题是:不会自动负载均衡。不过solr4已经提供简单的自动负载均衡,不知道效果如何,有待生产环境考验。elasticsearch是一个比较成熟的分布式搜索引擎,配置也很简单,提供一个elasticsearch大神博客的链接:http://blog.csdn.net/laigood12345/article/category/1113868。ES可以有多个索引库,indexType作为索引类型,相当于库中的表,这样就构成了一个比较完善的业务框架。详细的配置和使用可以参考上面博客链接。

下面小写一点对比:

1、solrcloud内嵌jetty和zookeeper,solrsearch使用netty实现自己的web服务器,无需zookeeper即可自动构建集群,当然使用zookeeper会更好。另外solrcloud引用第三方的jar比较多,而solrsearch一般喜欢将第三方的功能整合到自己的源码中。

2、solrcloud文档会比较多,用的比较多;elasticsearch相对文档比较少。

3、solrcloud支持xml和json,elasticsearch只支持json。

未完。。。


转自:http://blog.csdn.net/ITbasketplayer/article/details/8250386

相关问答

更多
  • 从两个方面对ElasticSearch和Solr进行对比,从 关系型数据库中的导入速度和模糊查询的速度。 单机对比 1. Solr 发布了4.0-alpha,试了一下,发现需要自己修改schema,好处是它自带一个data importer。在自己的计算机上测试了一下,导入的性能大概是:14分钟导入 3092730 条记录,约合 3682条/秒。 2. 3百万条记录的情况下,模糊查询和排序基本都在1秒内返回 3. 刚才的测试,是每个field单独存储,现在修改了一下 配置文件,增加了一个copyField, ...
  • 从两个方面对ElasticSearch和Solr进行对比,从关系型数据库中的导入速度和模糊查询的速度。 单机对比 1. Solr 发布了4.0-alpha,试了一下,发现需要自己修改schema,好处是它自带一个data importer。在自己的计算机上测试了一下,导入的性能大概是:14分钟导入 3092730 条记录,约合 3682条/秒。 2. 3百万条记录的情况下,模糊查询和排序基本都在... 从两个方面对ElasticSearch和Solr进行对比,从关系型数据库中的导入速度和模糊查询的速度。 单 ...
  • 从两个方面对ElasticSearch和Solr进行对比,从关系型数据库中的导入速度和模糊查询的速度。 单机对比 1. Solr 发布了4.0-alpha,试了一下,发现需要自己修改schema,好处是它自带一个data importer。在自己的计算机上测试了一下,导入的性能大概是:14分钟导入 3092730 条记录,约合 3682条/秒。 2. 3百万条记录的情况下,模糊查询和排序基本都在1秒内返回 3. 刚才的测试,是每个field单独存储,现在修改了一下配置文件,增加了一个copyField,所有 ...
  • 在ElasticSearch中,您可以通过索引将数据分离为单独的索引,然后将查询限制为特定的索引。 例如,如果您有两个索引,'foo'和'bar'正在运行: % curl -XGET http://localhost:9200/_search?q=*:* 将搜索整个群集,同时: % curl -XGET http://localhost:9200/foo/_search?q=*:* 将只搜索'foo'索引。 如果使用以下命令创建索引'测试',也可以按类型分隔数据: % curl -XPOST http: ...
  • 必须根据您的业务设置Solr堆大小。 设置-Xms=2G和-Xmx=12G只是对许多流行的Solr应用程序的推荐,但它不是强制性的。 您需要评估您的需求并将堆设置为适合您。 我真的建议你在堆上使用至少2G 。 Solr使用的一部分堆只是为了维护服务器而512m可能是不够的。 Solr heap size must be set according your business. Set -Xms=2G and -Xmx=12G is just a recommendation to lots of popul ...
  • 更新 现在问题范围已经得到纠正,我也可以在这方面增加一些内容: Apache Solr和ElasticSearch之间有很多比较,所以我将参考我发现自己最有用的内容,即涵盖最重要的方面: Bob Yoplait已经将kimchy的答案与ElasticSearch,Sphinx,Lucene,Solr,Xapian联系在一起。 哪种适合哪种用途? ,总结了他为什么进行创建ElasticSearch的原因,在他看来,与Solr相比,它提供了更优越的分布式模型和易用性 。 Ryan Sonnek的实时搜索:Sol ...
  • 可以使用pysolr API中的offset和size参数以499的方式访问文档,我在详细检查了Pysolr api后发现了这一点。 示例代码如下: limit = 499 offset = 0 while True: kwargs = {'sort':'id DESC'} response = source.search(q='projectid:774 AND source:FACEBOOK', start=offset, rows=limit, **kwargs ) prin ...
  • 我是OrientDB的全文和空间索引的维护者。 首先,这里是文档的链接,只是为了概述: http://orientdb.com/docs/last/Full-Text-Index.html 我们提供什么? 我们允许在使用Lucene作为引擎的类(例如表)的一个或多个属性上定义索引。 这允许执行可以使用完整Lucene语法的查询: SELECT from Person WHERE Description LUCENE "progra* +senior -ruby" 您可以配置分析器和停用词,但我们无法提供E ...
  • Lucene是一个用Java构建的搜索库,而Solr和Elastic Search(ES)是使用Lucene的Web应用程序。 在大多数情况下,您更喜欢Solr或ES到Lucene,主要是因为开箱即用的机制:多个节点上的分布式搜索,复制,分片和索引管理。 因为使用自定义Java应用程序和Lucene很难实现和维护这样的机制。 你会选择Lucene: 要有更多的控制权,因为它只是一个没有严格依赖关系的jar; 你不希望被任何特定的服务器约束; 您不希望构建自动化以在生产中部署Solr或ES(使用他们的服务器, ...
  • 该产品是开源的,您可以自己查看代码。 这是需要独立的包。 据我所知,现在有很多依赖于Solr的东西,但也许你可以给它一个镜头并贡献它。 最后,这是开源的力量。 由于我不知道该产品以及它对数据的作用,我无法确切地知道将会有多少工作。 需要将solr模式转换为相关的elasticsearch映射,然后需要转换索引器以将数据推送到elasticsearch(否则,如果技术上可行,您可以编写一条从框架本身在elasticsearch中导入数据的河流)。 最后一步是将搜索代码与构面,突出显示等一起转换。 也许你(或者 ...