SOLR Performance Benchmarks – Single vs. Multi-core Index Shards

2019-03-27 01:08|来源: 网路

http://www.derivante.com/2009/05/05/solr-performance-benchmarks-single-vs-multi-core-index-shards/





转自:http://www.cnblogs.com/lexus/archive/2010/07/23/1783452

相关问答

更多
  • 参见jafingerhut / clojure-benchmarkmarks iirc目前的clojure实现并没有集中在性能上,但是下一个版本可能会。 See jafingerhut / clojure-benchmarks iirc the current clojure implementation has not been focussed on performance, but the next version supposedly will.
  • 您需要多核,因为您无法在多语言数据库中执行词干和停用词。 英语中的常用停用词是“by”和“is”,但这些词在许多北欧语言中意为“城镇”和“冰”。 如果你做多核,每种语言都可以在自己的核心上使用自定义的schema.xml来选择正确的词干分析器,停用词和受保护的单词。 但是同一个JVM在同一台服务器上运行它,所以你不会为一种特定语言的服务器花费任何额外的钱。 然后,如果一个服务器的负载太大,则复制多核设置,所有索引都从副本中受益。 You need multicore because you cannot d ...
  • 在SolrCloud中添加更多副本可以提高并发性并添加更多分片可以缩短查询响应时间。 换句话说,如果原始查询在1秒内返回,则添加更多副本可能不会改善响应时间,但会在每个时间段内为您提供更多结果。 但是,将索引拆分为更多分片将极大地缩短响应时间。 因此,如果将索引从1个分片拆分为4个分片,则查询速度将提高近4倍。 但是如果你选择有1个具有4个副本的分片,那么查询响应时间可能只会略有改善。 In SolrCloud adding more replicas improves concurrency and ad ...
  • 而且似乎最快的解决方案仍然是使用运行测试的4核心机器的单个内核的C / C ++。 不,这不适用于所有的代码。 事实上,我看过的代码中,都使用了多个并行线程,因此使用了多个内核。 事实上,有些(如k-核苷酸 )使用像OpenMP这样的花式架构(或者也有趣的SSE并行化 )来帮助并行化。 编辑事实上,对于每个问题最快的C ++解决方案使用并行线程,但有三个例外: fasta基准 ,由于随机生成器的使用而难以并行(但完全可能)。 pidigits使用GMP库。 n体 ,可以并行化。 ...和其他大多数解决方案也 ...
  • 你可以试试lucene-c-boost。在C ++(通过JNI)中优化的某些Apache Lucene查询的实现,适用于从0到7.8X加速的任何地方。 请参阅https://github.com/mikemccand/lucene-c-boost 。 you may try lucene-c-boost.Optimized implementations of certain Apache Lucene queries in C++ (via JNI) for anywhere from 0 to 7.8X ...
  • 我最终使用了Lucene Merge Index工具。 SOLR方法对我不起作用(钝误)。 I ended up using the Lucene Merge Index tool. The SOLR approaches did not work for me (obtuse errors).
  • 你问题的核心是: NodeJS将不得不像其他多线程架构师那样面对传统的并发问题,例如,写入不受写保护的同一对象? 答案是这种情况通常是不可能的,因为node.js进程不共享内存。 进程A中的ObjectA,ObjectB和ObjectC与进程B中的ObjectA,ObjectB和ObjectC不同。并且由于每个进程都是单线程争用不可能发生。 这是您发现node.js中没有信号量或互斥模块的主要原因。 此外,node.js没有附带的线程模块 这也解释了为什么“没人关心”。 因为他们认为不可能发生。 node. ...
  • 尝试这个 http://localhost:8887/solr/souro_core2/select?q=name:souro&indent=true&shards=shard1,shard2 这应该工作如果你有收藏名称souro_core2有两个分片。 Finally i got my answer. In both shards there was an "id" field and both were containing value 1. But after doing bit research ...
  • 我会添加一些参数供您考虑(主要是劝阻每个实体的一个核心方法,但不仅仅是出于您特别要求的性能原因) 更多核心意味着更多端点。 您的申请需要知道这些。 您可能会发现跨核心运行查询很困难。 例如,如果您使用公共属性(例如名称)进行搜索,则必须对每个核心运行多个查询并聚合结果。 这将错过您在查询单个核心时开箱即用的相关性方面。 考虑向数据库发出最少的请求。 N + 1个jdbc连接大大减慢了索引速度。 相反,尝试在视图中聚合结果,如果可以触发单个查询,则索引速度会快得多。 跨核心不可能对公共属性进行范围查询。 例如 ...
  • 我们在Solr 4.10中遇到了这个问题(很少见,5.1)。 在我们的例子中,我们经常编制索引,并且提交开始变得太紧密了。 有时我们的优化命令会比预期的运行时间长一些。 我们通过确保在优化操作开始后至少十分钟没有发生索引或提交来解决它。 我们还自动为我们的缓存增加了更少的查询。 如果您还没有找到它们,以下链接可能对您有用: 重叠onDeckSearchers - Solr邮件列表 Solr Wiki We had this problem with Solr 4.10 (and, very rarely, ...