solr 优化索引成 2段或N段

2019-03-27 01:02|来源: 网路

默认 solr 优化索引的时候,只一个段,比起 N段(N不是很大)来说,可能有点耗时。索引为N段也不会一个文件太大。

可以有两种方式:

url:

  1. curl "http://localhost:8080/solr/update?maxSegments=2&optimize=true"  

xml:

  1. curl http://localhost:8080/solr/update --data-binary "<optimize maxSegments=\"2\" />" -H "Content-type:text/xml; charset=utf-8"  

但有一个奇怪的问题,第一次会多一个段,再触发一下就只有2个段了。难道真的要调用两次。

后来发现这个奇怪的问题与平台有关
转自:http://www.cnblogs.com/wycg1984/archive/2009/09/16/1567649

相关问答

更多
  • 只要uniqueKey相同,solr自动会覆盖的,举个例子uniqueKey为id 1.旧索引: id:document name:wyc content:hello 2.新索引: id:document name:wyc content:world 提交新索引,就会把旧索引覆盖掉
  • solr查询使用日期字段,结果中返回N个文档 localhost:8080/solr/select/?q=greekbailout&wt=json&sort=date asc&rows=N solr的默认模式有一个名为timestamp的字段,它存储创建或修改特定文档的时间,因此如果您的日期字段不能完全存储这个并且这是您的要求,则可以使用时间戳。只需将日期替换为时间戳 solr query using date field with N documents returned in results loca ...
  • 你也可以检查下面: - SolrPerformanceFactors ImproveSearchingSpeed ImproveIndexingSpeed SolrCaching 在-七致命-罪-OF-的Solr You can also check below :- SolrPerformanceFactors ImproveSearchingSpeed ImproveIndexingSpeed SolrCaching the-seven-deadly-sins-of-solr
  • 感谢Lewis John Mcgibbney,我意识到应该使用索引工具,如下所示: bin / nutch索引-D solr.server.url =“https://gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/CLUSTER-ID/solr/admin/collections -D solr.auth = true -D solr.auth.username =“USERNAME”-D solr.auth.passwo ...
  • 这些DB服务器的用途不同,它在很大程度上取决于您的应用程序(以及您存储的数据类型)是否应该仅使用Solr或MySQL。 MySQL可以很好地存储具有大量关系和表格的数据(彼此相关的表格)。 Solr很适合文本搜索(正如你所说:快速索引),如果你没有很多“相关数据”,你确实可以将这些数据存储在相同的文档中。 有些人确实只使用Solr来存储他们的数据库...但我仍然认为RDBM可以很好地用于某些类型的数据。 例如:如果您想允许快速搜索系统用户并存储他们的完整个人资料,以及一些信息详细信息......最好使用So ...
  • 我想,麻烦在这里: if (val instanceof DocList) { 让我们看看QueryComponent.process最后QueryComponent.process行: ResultContext ctx = new ResultContext(); ctx.docs = rb.getResults().docList; ctx.query = rb.getQuery(); rsp.add("response", ctx); 所以DocList位于rsp.getValues().get ...
  • 特定 Schema (3个字段,所有类型字符串(solr.StrField)): ID 标题 类别 输入数据 : 4类别 - 产品,页面,发布,其他 4个标题 - 早餐,午餐,晚餐,晚餐 指数 : 1000个随机标题/类别的文件 请求 我们可以使用分面来计算特定结果: 搜索查询(搜索所有文档): Q = *:* 过滤查询(过滤特定输入请求并使用标记对其进行标记): &FQ = {标题标签= DT!}:早餐 刻面: 打开刻面 &小=真 如果只需要类别信息,请关闭结果 &行= 0 获得匹配计数 &facet.f ...
  • 你基本上想把Solr变成一个关系数据库。 也就是说,你想在你的文件上强制执行一些结构,而不是让它们成为一堆文字。 如果你需要关系,那么你需要关系。 我能想到的唯一办法就是将教育对象分开索引,然后从简历中获得“外键”。 或者,你的“n”可能很小。 所以你可以在索引中多次包括每个简历,每个教育列表一次。 这可能会打分得分,但ymmv。 You essentially want to turn Solr into a relational database. I.e. you want to enforce so ...
  • 所以我终于找到了问题所在。 模式文件正在过滤掉停用词。 问题是PorterstemFilterfactory阻止关键字如“一”到“开”和“使用”到“我们”并索引它们使它看起来像停用词没有被过滤掉。 我不知道这是Porterstem中的错误还是假设是这样的。 So I finally figured out the problem. The schema file is correctly filtering out the stopwords. The problem is the PorterstemFi ...
  • Solr 4.1以压缩方式维护存储的字段,这可以解释索引大小的减少。 也, Documentation @ http://wiki.apache.org/solr/SchemaXml#Copy_Fields 副本在流源级别完成,没有副本提供到另一个副本。 将copyfield作为copyfield标记的源不起作用。 复制域源必须是实际字段,它具有一些值并且不会级联。 你也可以查看http://lucene.472 ...