solr relevent project

2019-03-27 01:08|来源: 网路


solr 周边的一些开发与扩展

http://code.google.com/p/solr-side/

http://code.google.com/p/solrmarc/


solr python client

http://code.google.com/p/solrpy/


gui查看工具,类似memcached的查看请求次数的图形化工具

http://code.google.com/p/solrmeter/

http://www.solrclient.com/


sudo apt-get install adobeair





转自:http://www.cnblogs.com/lexus/archive/2010/07/20/1781028

相关问答

更多
  • @darkheir:Lucene和Solr是两个不同的Apache项目,一起工作,我不明白每个项目的目的是什么。 1)Solr在底漆下使用Lucene。 Lucene没有关于Solr API的线索。 2)Lucene是一个功能强大的搜索引擎框架,可以让我们为我们的应用程序添加搜索功能。 它暴露了一个易于使用的API,同时隐藏所有与搜索相关的复杂操作。 任何应用程序都可以使用这个库,而不仅仅是Solr。 3)Solr是围绕Lucene建造的。 Lucene不仅仅是一个http包装,而且已经知道可以向Lucen ...
  • 是的,Solr(在Lucene上运行)确实使用余弦相似性。 从Lucene文档: 文档d对于查询q的VSM得分是加权查询向量V(q)和V(d)的余弦相似度, 余弦相似性(q,d)= V(q)·V(d)/ | V(q)| | V(d)| https://lucene.apache.org/core/4_0_0/core/org/apache/lucene/search/similarities/TFIDFSimilarity.html Yes, Solr (which runs on top of Lucen ...
  • 仅仅考虑到尺度上的差异:这似乎相对简单。 根据图像的特征,根据伪像的形状/像素密度/排列来设置分类器。 这些方面与规模无关。 您可能还希望将旋转和剪切不变能力引入到svm中。 In regard solely to the difference in scales: this seems relatively straightforward. Set up classifier(s) based on the characteristics of the images in terms of the sha ...
  • 有几件事你可以做,以交换性能的索引大小。 例如,整数(int)字段使用的空间少于trie整数(tint),但使用int时范围查询会更慢。 要大幅减少您的指数,您几乎肯定需要更仔细地查看您正在使用的字段。 你使用了很多存储的字段吗? 如果是这样,请尝试从索引中删除存储的字段,并在从Solr获得结果后,查询数据库以获取必要的数据。 将omitNorms =“true”添加到不需要长度标准化的文本字段 将omitPositions =“true”添加到不需要词组匹配的文本字段 NGrams等特殊领域可占用大量空间 ...
  • 尝试bin / solr start -e techproducts 。 然后使用techproducts而不是开始。 再也没有开始收集, 技术产品是最近的一个。 你所做的就是启动一个服务器,但根本没有收藏。 所以你也可以在那里创建一个集合,但是你需要正确的配置来引导它。 所以,现在第一种方法可能会更容易一些。 Try bin/solr start -e techproducts. And then use techproducts instead of gettingstarted. There is n ...
  • 您在每个查询中都给出了参数rows=2147483647 。 该参数的含义是(取自参考文献) 您可以使用rows参数对查询中的结果进行分页。 该参数指定Solr应一次返回客户端的完整结果集中的最大文档数。 默认值为10.也就是说,默认情况下,Solr一次返回10个文档以响应查询。 因此,您告诉Solr生效,在单个响应中发送查询的所有匹配。 这是你糟糕表现的原因。 当查询“java”时 ,谷歌是否会向您发送所有500.000.000次匹配,不会。 为什么不,性能。 我知道的每一个IR应用程序都会为您提供一个带 ...
  • 我发现的最好方法是在项目结构的顶层创建一个solr-conf目录,其中包含您的所有Solr配置: - project - solr-conf solr.xml - collection1 - conf 然后使用solr-conf目录以SOLR_HOME运行Solr。 您需要将Solr dataDir属性设置为目录树之外的属性,或者将collection1 / data添加到svn:ignore列表中。 要更改数据目录,您应该能够将-Dsolr.data.dir=/data/path到Solr命令行(使用的实 ...
  • git忽略: */data/* */dataimport.properties 例如: solr/development/data/* solr/development/conf/dataimport.properties dataimport.proporties包含最后一个索引时间和其他动态变量 #Thu Nov 17 16:21:03 GMT 2016 last_index_time=2016-11-17 16\:21\:03 development.last_index_time=2016- ...
  • 这对我有用: hadoop jar solr-hadoop-job-2.2.5.jar com.lucidworks.hadoop.ingest.IngestJob -Dlww.commit.on.close=true -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.regex="\\w+" -Dcom.lucidworks.hadoop.ingest.RegexIngestMapper.groups_to_fields=0=m ...
  • Category.ransack方法有什么作用? 我假设您正在使用太阳黑子宝石将Solr集成到您的项目中。 如果是这样,请使用Category.search搜索索引。 然后用 @search.results 不 @search.result 所以你的代码应该是这样的: @search = Category.search do fulltext params[:category] end @category = @search.results.first 你也可以写得更短: @categor ...