solr 术语

2019-03-27 01:02|来源: 网路

Solr 涉及的术语,简单介绍下:
  • Auto-warming(自动预热) 当打开一个新的缓存时,它把在旧缓存里命中较高的键/值添加到新的缓存里。
  • Constraint(限制) 限制对象集的方法。
  • Facet(层面) 对象集的一个方面或特定的一部分,这可以用来资源分类。
  • Filter(过虑器) 它由上下方决定,可能是:
    1. Constraint(限制)的那称呼。
    2. 限制查询结果的"fq"参数。
    3. 涉及特定的Lucene的"Filter"类。
  • Solr Home Dir(Solr主目录) 又叫Solr Home Directory或Solr Home,它是Solr查找配置文件、数据、插件的主要目录,默认是./solr目录,可以JNDI配置solr/home属性,也可配置系统的 solr.solr.home属性。
  • Static warming(静态预热) 当newSearcher 和 firstSearcher 的事件监听器强逼预热事件时,Solr会根据solrconfig.xml配置里的"static"查询来填充缓存。

转自:http://www.cnblogs.com/wycg1984/archive/2009/09/16/1567627

相关问答

更多
  • 此值为百分比编码 。 您可以使用URL Decoder来获取实际查询。 在你的情况下,它是*:* 。 This value is Percent encoded. You may use URL Decoder to get the actual query. In your case, it's *:*.
  • 不要认为Solr中有一种方法可以检索显示的同义词(突出显示之外),因为它们只是为索引而扩展。 也就是说,构建查找索引/表以满足您的需求并不困难(在Solr或您的数据库中)。 Don't think there is a way within Solr to retrieve synonyms for display (outside of highlighting), as they are only expanded for indexing. That said, it wouldn't be hard ...
  • 我不确定我是否正确理解您的用例,但TermsComponent可能符合您的需求。 它“提供对字段中索引术语的访问以及与每个术语匹配的文档数”(来自文档)。 在solrconfig.xml中配置组件后,查询应如下所示: terms=true&terms.fl=name&terms.regex=.*b.* Finally I modify the facet search implementation based on this patch https://issues.apache.org/jira/bro ...
  • 您可以在请求中使用Facets来获得“字段Y的前X个” 例如 q=*&facet=true&facet.field=Firm&facet.limit=50&facet.minCount=1 当您使用facet.limit时,您将获得前X个结果。 你在schema.xml中的字段固定不应该使用Tokenizer,因为你会得到“mustermann”和“gmbh”而不是“mustermann gmbh”(我认为“字符串”是标准的没有Tokenizer的字段) 如果必须更改字段值,请不要忘记重新索引。 You ...
  • 如何在包含第一个单词的模式中创建一个字段? 然后,当您构建文档时,您可以获取第一个单词并将其与文本的其余部分分开存储。 What about making a field in the schema that contains the first word? Then when when you build the document you can grab the first word and store it separately from the rest of the text.
  • 简短的回答是NO,你需要在这样的架构更改后重新索引。 启用术语向量将加速从原始输入文档中找到有趣术语的过程(如果此文档在索引中)。 第二阶段计时(当更多像这个查询发生时)将保持不变。 有关MLT如何工作的更多信息[1]。 通常,在对架构应用此类更改时,需要重新索引文档以使Solr构建相关的数据结构(术语向量是每个文档的迷你索引,并且需要将特定文件存储在磁盘上[2]注意这会增加你的磁盘利用率) [1] https://www.slideshare.net/AlessandroBenedetti/advance ...
  • 您可以使用edismax解析器和以下提升查询bq参数来将您想要的结果提升到顶部... http://localhost:8983/solr/select/?q=sick&defType=edismax&bq=type:active^5.0 在此示例中,您要添加提升查询以增加类型处于活动状态的文档的相关性。 以下是Solr Wiki DisMaxQParserPlugin页面上的更多示例。 You can use the edismax parser and the following boost que ...
  • 我已经尝试使用示例内核从Solr端进行此操作,并在索引时使用NGram过滤器返回匹配。 您可能希望检查服务器端日志,以确定您实际上是重新编制索引,至少。 字段定义如下:
    好的,我发现termfreq对MultiValues字段不起作用。 所以我使用了一个复制字段并添加了termVectors =“true”termPositions =“true”termOffsets =“true”。 现在它有效 Ok, I found out that termfreq doesn't work for MultiValues fields. So I used a copy field and added termVectors="true" termPositions="true" ...
  • 遗憾的是,您无法通过TermsComponent访问字段中的索引术语时进行TermsComponent 。 例如,当您提出自动建议时,这是您面临的限制之一。 如果您正在进行自动建议,支持过滤的方法之一是基于facet和前缀参数,如此处所述。 Unfortunately you can't filter while accessing the indexed terms within a field through the TermsComponent. That's one of the limitatio ...