Solr缓存

2019-03-27 01:03|来源: 网路

我们都知道Solr配置文件有三种缓存分别是 filterCache,queryResultCache,documentCache 但Solr是在什么时候,什么情况下会用到这些缓存呢,通过看Solr的源码,下面对Solr三种缓存做说明

filterCache 缓存

filterCache:当搜索请求参数中带有参数"ids"时,Solr会去filterCache里查,filterCache里Key是query,值是DocSet,,也就是无序的Document id,如果有多个ids里包含多个id,则用分隔符“,”分开。如果filterCache中没有对应的值,则通过reader都查找
对应的DocSet,并添加到filterCache缓存中。

queryResultCache 缓存

如果搜索请求参数没有ids参数时,则会不去filterCache缓存里找,而且没有Filter时,才是去queryResultCache里查找,queryResultCache
里保存的是有序的DocList。在查到docList后,回去取docSet,即会在filterCache中查,没有的话会加到filterCache中,
如果queryResultCache缓存中没有值,也先去取docSet,即通过filterCache,没有对应的值的话,则重新构建,添加到缓存中,
则通过一般的查找方式找到。然后添加到queryResultCache缓存中。

documentCache 缓存

documentCache 是在通过doc(int i) 方法取document时,用到的。
documentCache 不存在的话,这通过reader去取,取到document后,添加到documentCache 缓存。

fieldValueCache 缓存

fieldValueCache 缓存是在solr组件FacetComponent组件里发货作用的。条件是如果要统计的Field是multiValued,也就是有
多个值的情况,solr 会根据field创建一个field反正类UnInvertedField,通过注解大概了解是节约内存和加速facet统计。

httpCache 缓存
可以看我的博客:http://ronxin999.blog.163.com/blog/static/42217920201191293032232/?suggestedreading


转自http://ronxin999.blog.163.com/blog/static/42217920201161194837450/

转自:http://www.cnblogs.com/ukouryou/articles/2826780

相关问答

更多
  • 推荐学习夜行侠老师的《solrcloud5.2.1+zookeeper一部精通》这套课程
  • 推荐学习夜行侠老师的《solrcloud5.2.1+zookeeper一部精通》这套课程
  • Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。 用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
  • 唯一可以肯定的就是尝试一下。 但是,我期望在索引中节省很少,因为索引每次只包含一次实际字符串,其余的是该文本中字符串位置的数据。 它们不是指数的很大一部分。 过滤器缓存只缓存过滤器查询。 它可能对您的确切用例没有用处,但许多确实有用。 例如,根据国家,语言,产品类型等缩小结果。如果经常使用它们,Solr可以避免重新计算这类事情的查询结果。 实际上,你只需要尝试一下并用探查器进行测量。 如果没有深入了解所使用的数据结构,其他任何内容都是纯粹的SWAG。 你的计算和没有分析的人一样好。 文档缓存仅在计算查询之后 ...
  • 除了其他原因,为什么否是一个答案,也是变化的粒度。 Lucene(底层库)以只读形式存储数据。 Solr在其上添加了可更新的文档,但是使它们可见仍然是一个繁重的操作。 Solr的最新版本通过软提交使其变得更容易和更快,但是使可见变化的代价仍然是非常重要的。 因此,它实际上没有针对更新/缓存单个值进行优化。 数据结构针对多文档更新进行了优化,然后通过缓存超过该临时只读状态进行快速搜索。 In additions to other reasons why No would be an answer, is al ...
  • 只需使用Solr缓存wiki中提到的{!cache=false} localParam标志 Just use {!cache=false} localParam flag as mentioned in the Solr caching wiki
  • 而问题是? 只需将'fl'参数定义为要返回的字段列表,在这种情况下为'id'。 如果你从未真正返回其他字段,请不要费心存储它们,只将它们定义为索引。 如果您确实需要存储但很少需要它们,请使用solrconfig.xml中的 enableLazyFieldLoading设置进行测试 And the problem is? Just define the 'fl' parameter to be the list of fields you want to return, in which case 'id'. ...
  • 我能够确定我的返回函数出了什么问题:我没有在结果中正确循环。 最好的方法是使用map函数迭代它们。 $("#Keyword").autocomplete({ minLength: 3, source: function(request, response) { $query = "http://127.0.0.1:8080/solr/terms/?jsoncallback=?&terms=true&terms.prefix=" + $("#Keyword").val(); ...
  • 这些DB服务器的用途不同,它在很大程度上取决于您的应用程序(以及您存储的数据类型)是否应该仅使用Solr或MySQL。 MySQL可以很好地存储具有大量关系和表格的数据(彼此相关的表格)。 Solr很适合文本搜索(正如你所说:快速索引),如果你没有很多“相关数据”,你确实可以将这些数据存储在相同的文档中。 有些人确实只使用Solr来存储他们的数据库...但我仍然认为RDBM可以很好地用于某些类型的数据。 例如:如果您想允许快速搜索系统用户并存储他们的完整个人资料,以及一些信息详细信息......最好使用So ...
  • 已经很晚了,但是我遇到了同样的问题,所以我会在这里发布答案。 这里 :“您应该记住,只有在未缓存过滤器查询时,成本属性才有效。” 和这里 因此,“成本”仅适用于非缓存过滤器。 It's late, but I've faced with the same question, so I'll post answer here. Here : "You should remember that cost attribute work only when the filter query is not cache ...