不和企鹅聊天(547317812) 2013/7/1 11:21:40
请教个问题，有谁用过solr的自动聚类吗？
何达(25073021) 11:47:33
自动聚类carrot2这种效果很一般，还不如facet，想效果好得自己做
不和企鹅聊天(547317812) 11:48:12
自己做？复杂吗？
何达(25073021) 11:48:36
复杂，标签聚合是难点
不和企鹅聊天(547317812) 11:49:35
自己做，对于我们团队现在来说，有点困难
不和企鹅聊天(547317812) 11:50:02
由第三方已经做好的，效果比较好的吗？
何达(25073021) 11:50:03
不自己做，效果没法看
何达(25073021) 11:50:37
第三方做好的都自己用，没见到开源的
不和企鹅聊天(547317812) 11:51:03
这就麻烦了
何达(25073021) 11:51:19
看你的应用场景了，要是需求简单也好搞
何达(25073021) 11:51:43
在建索引之前先聚类，然后用facet搞定
不和企鹅聊天(547317812) 11:52:02
就是根据文本内容，分类
何达(25073021) 11:52:25
建完索引再通过solr来搞定是死路
何达(25073021) 11:53:01
那你先分吧，你用什么方式分啊，手工的，自动的，还是有什么规律能用程序搞定？
不和企鹅聊天(547317812) 11:53:12
有没有像autonomy的 IDOL，这种的解决方案
何达(25073021) 11:55:21
开源的不知道有没有，没见过
不和企鹅聊天(547317812) 11:56:54
就是想做一个，基于语义理解的，自动聚类处理
何达(25073021) 11:57:40
那就复杂了，估计你们团队短时间搞不定，可以考虑花钱买技术
极品健健(76920835) 11:58:34
做个简单的，有现成算法
不和企鹅聊天(547317812) 11:58:54
这个。。。。领导说了算啊
何达(25073021) 11:59:10
@极品健健他是基于语义理解的，这就大发了
极品健健(76920835) 11:59:12
不能拔苗助长呐
极品健健(76920835) 11:59:42
居于分词的，类似文档相似度的就好了，简单搞点算了
何达(25073021) 11:59:51
都没基础的，只能找规律简单搞搞
不和企鹅聊天(547317812) 12:00:06
基于语义理解的，自动聚类，索引，同时支持全文检索等等
何达(25073021) 12:00:31
让你们领导自己做吧，这百万年薪的才能搞定啊
极品健健(76920835) 12:00:35
语义理解。。。。。。。。
[☆]雪罗漫天<phpcms@msn.com> 12:00:58

[☆]雪罗漫天<phpcms@msn.com> 12:01:19

[☆]雪罗漫天<phpcms@msn.com> 12:01:44
这个算语义理解么
极品健健(76920835) 12:02:35
必须不是
[☆]雪罗漫天<phpcms@msn.com> 12:02:52
.....
[☆]雪罗漫天<phpcms@msn.com> 12:03:13
应该是了吧，它都能理解我说的电扇了...
简单(9730722) 12:03:20

极品健健(76920835) 12:03:26

[☆]雪罗漫天<phpcms@msn.com> 12:03:31
哈哈你还真搜啊
简单(9730722) 12:04:11
我想看看现在科技的进步程度
简单(9730722) 12:04:15

不和企鹅聊天(547317812) 12:04:29
唉。。。。愁啊。。
不和企鹅聊天(547317812) 12:09:26
我们想做的是，比如：赵红霞，系统能够理解，“反腐倡廉”，“贪欲受贿”，等等这些，系统能自动理解语意，理解文章上下文环境，自动把同一类的文本聚成一个专题
极品健健(76920835) 12:10:36
系统为什么能理解？我们人为什么能知道赵红霞和反腐倡廉有关系
极品健健(76920835) 12:10:46
因为我们人事先接触到新闻
极品健健(76920835) 12:10:58
你脑子里已经有这个联系了
不和企鹅聊天(547317812) 12:12:12
这个写信息，能不能随着系统接触的信息越来越多，系统就能理解这些？
极品健健(76920835) 12:12:47
你系统的关键就是这个
极品健健(76920835) 12:12:51
我不懂这个
刹那永恒(393681695) 12:14:04
不会是给广电做的吧？

不和企鹅聊天(547317812) 12:15:17
我是想，能不能有一种方法，最后让系统既能搜出东西，又能理解搜出来的东西，并且根据语义，上下文环境，自动把信息分类
Lee(125801105) 12:15:36
这涉及到一个学科... 机器学习.
♨HelloWorld<huangduanfeng6.29@qq.com> 12:15:46
这个是属于人工智能范畴了
♨HelloWorld<huangduanfeng6.29@qq.com> 12:15:50
我们之前做过
♨HelloWorld<huangduanfeng6.29@qq.com> 12:16:01
不过我们做的比较低级就是了
不和企鹅聊天(547317812) 12:16:11
最终实现，和人工阅读文本，人工根据内容分类，一样的效果
杭州-湖畔<redsdh@gmail.com> 12:16:17
。。。难
杭州-湖畔<redsdh@gmail.com> 12:16:40
简单点的，运营手动加标签，
不和企鹅聊天(547317812) 12:17:18
运营手动加标签？
不和企鹅聊天(547317812) 12:17:27
能解释一下吗？
杭州-湖畔<redsdh@gmail.com> 12:18:39
我该怎么解释。。
杭州-湖畔<redsdh@gmail.com> 12:19:09
比如大众点评，也做分类的
杭州-湖畔<redsdh@gmail.com> 12:19:21
运营实现知道分类的
杭州-湖畔<redsdh@gmail.com> 12:19:29
调查过业务，有精确的分类存在
☜依米艳☞(316849113) 13:45:59
我每次和seri说话，他都说，我不知道你在说什么~
啊剑(494913703) 13:47:33

☜依米艳☞(316849113) 14:03:33
弱弱的问一句@[☆]雪罗漫天为什么我的百度搜索来的和你的不一样~
壮志雄虎(342315465) 14:24:59
楼上的好天真。。。。。
liuxun(33611720) 14:25:16
我不是做java开发的，现在需要把solr 代码重新打包，怎么办？
☜依米艳☞(316849113) 14:25:52
@liuxun 变异好的？
☜依米艳☞(316849113) 14:25:55
编译
liuxun(33611720) 14:27:38
公司不能上网，好像ant打包要安装一堆东西。
.................(284242157) 15:34:12
请问solr中怎么更新IK词典呢
.................(284242157) 15:34:29
扩展词典
一休摸鱼(429200247) 15:34:49
有说明吧
.................(284242157) 15:35:23
ik倒是有个文档，但是用了下dic.addWords(words);//批量加载新词条不起作用
[砖]梁山伯(19335353) 15:35:49
@................. 没用我给的源码？
.................(284242157) 15:36:21
在哪儿？
[砖]梁山伯(19335353) 15:36:38
https://github.com/lgnlgn/ik4solr4.3
.................(284242157) 15:37:08
哈，谢谢先看看去

转自：http://blog.csdn.net/earth3008/article/details/9214733

知识点

相关文章

最近更新

【杂谈】Solr的自动聚类carrot2和facet关系和比较

相关问答

要聚类的文档的最大限制(maximum limit of documents to be clustered)[2022-04-07]

使用Apache Solr和Carrot2进行聚类(Clustering with Apache Solr and Carrot2)[2023-12-12]

Carrot2 dcs webapp设置(Carrot2 dcs webapp setup)[2023-05-11]

在carrot2 xml文件中指定为URL的内容是什么？(What to be specified as URL in carrot2 xml file?)[2023-04-28]

使用carrot2在同一数据集上不一致获得的簇数(Number of clusters obtained using carrot2 inconsistent on the same data set)[2023-10-02]

使用Carrot2 DCS实现增量聚类(Implementing incremental clustering using Carrot2 DCS)[2022-04-05]

Solr ClusteringComponent Carrot2：ClassNotFoundException(Solr ClusteringComponent Carrot2 : ClassNotFoundException)[2022-05-06]

基于solr字段的solr聚类，包括地理空间位置字段(solr clustering based on solr fields including geo-spacial location fields)[2024-01-11]

决定Carrot2中的簇大小设置(Deciding on cluster size setting in Carrot2)[2022-03-01]

使用Carrot2进行连续聚类？(Sequential clustering with Carrot2?)[2022-11-18]