经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)

2019-03-27 01:09|来源: 网路

今天给大家介绍一下经典的开源机器学习软件:

编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.

1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源软件)

http://mloss.org

2 偶尔找到的机器学习资源网:(也非常全,1和2基本收录了所有ML的经典开源软件了)

http://www.dmoz.org/Computers/Artificial_Intelligence/Machine_Learning/Software/

3 libsvm (支持向量机界最牛的,不用多说了,台湾大学的林教授的杰作)

http://www.csie.ntu.edu.tw/~cjlin/libsvm/

4 WEKA (基于java的机器学习算法最全面最易用的开源软件)

http://www.cs.waikato.ac.nz/ml/weka/

5 scikit (本人最喜欢的一个基于python的机器学习软件,代码写得非常好,而且官方的文档非常全,所有都有例子,算法也齐全,开发也活跃
,强烈推荐给大家用)

http://scikit-learn.org/stable/

6 OpenCv(最牛的开源计算机视觉库了,前途无可限量,做图像处理与模式识别的一定要用,总不能整天抱着matlab做实验和工业界脱节吧,但是有一定难度)

http://opencv.willowgarage.com/wiki/

7 Orange (基于c++和python接口的机器学习软件,界面漂亮,调用方便,可以同时学习C++和python,还有可视化的功能,)

http://orange.biolab.si/

8 Mallet (基于JAVA实现的机器学习库,主要用于自然语言处理方面,特色是马尔可夫模型和随机域做得好,可和WEKA互补)

http://mallet.cs.umass.edu/

9 NLTK(PYTHON的自然处理开源库,非常易用,也强大,还有几本orelly的经典教程)

http://nltk.org/

10 lucene(基于java的包括nutch,solr,hadoop,mahout等全套,是做信息检索和搜索引擎的同志们必学的开源软件了,学JAVA的必学)

http://lucene.apache.org/

当然还有很多很好的开源软件了,以后陆续添加,待续,困了。。。。。


转自:http://www.cnblogs.com/kshenf/archive/2012/06/14/2548708

相关问答

更多
  • 不知道你说的好是什么意思,如果问的是学什么好我只能告诉你---都好!关键看你掌握的深度.如果想找工作学点数控好了,比较好找工作,而且容易学
  • 电脑视觉,首先需要扫描仪的知识。 扫描仪是文字和图片输入的主要设备,相当于电脑的眼睛,能够通过光电器件把光信号转换为电信号,把电信号通过模数转换器转化为数字信号传输到电脑中,把大量的文字、图片信息输入到电脑中。 扫描仪的关键器件是电荷耦合器,采用三棱镜分色光学系统,以三棱镜来分离自然光为红、绿、蓝三原色来扫描图形。 用平板式扫描仪把文件扫描到电脑上的时候,要把文字和图片固定在一个玻璃窗口中,扫描头在文字或图片下移动,接受来自文字或图片的反射光,这些反射线由一个镜面系统进行反射,通过凸透镜把光聚焦到光敏二极管 ...
  • 机器学习(Machine Learning)一般被定义为一个系统自我改进的过程,但仅仅从这个定义来理解和实现机器学习是困难的。从最初的基于神经元模型以及函数逼近论的方法研究,到以符号演算为基础的规则学习和决策树学习的产生,和之后的认知心理学中归纳、解释、类比等概念的引入,至最新的计算学习理论和统计学习的兴起?当然还包括基于马尔可夫过程的增强学习?,机器学习一直都在相关学科的实践应用中起着主导作用。研究人员们借鉴了各个学科的思想来发展机器学习,但关于机器学习问题的实质究竟是什么尚无定论。不同的机器学习方法也各 ...
  • 联系是很紧密的,模式识别说白了就是分类,而分类可以认为是数据挖掘的一部分,数据挖掘主要工作有分类、聚类、关联分析、离群点检测等;机器学习的范围更广,算法更多!但三者都要求有坚实的统计学基础,学的越扎实越好!
  • 推荐bishop的pattern recognition and machine learning,然后直接去网易公开课搜斯坦福的机器学习课程,吴恩达主讲。然后你就一步一步迈入AI的殿堂了。相信我。
  • 信息检索是一门学科,所有与信息搜索有关的都可以归为信息检索,比如你到图书馆找你想要的书也是信息检索的一个方向;WEB数据挖掘一般现在分为两大类,一类关系知识挖掘,就是发现网络连接的内在模式,一类是内容知识挖掘,内容知识挖掘可以划分为结构型、半结构型以及非结构型挖掘,文本挖掘属于非结构型挖掘。
  • 问题描述:才能更容易的进入国家电网内部,比如电科院一类的单 位?是信息检索还是数据挖掘 答案1:: 信息检索是一门学科,所有与信息搜索有关的都可以归为 信息检索,比如你到图书馆找你想要的书也是信息检索的一个方向; WEB数据挖掘一般现在分为两大类,一类关系知识挖掘,就是发现网络 连接的内在模式,一类是内容知识挖掘,内容知识挖掘可以划分为结 构型、半结构型以及非结构型挖掘,文本挖掘属于非结构型挖掘。 :::::::::::::::::::请参考以下相关问题:::::::::::::::::::: :::::: ...
  • 隐马尔可夫模型是一个伟大的地方,以及人造神经网络 。 编辑:你可以看看NeuronDotNet ,它是开放源代码,你可以瞧瞧代码。 编辑2:你也可以看看ITK ,它也是开源的,并且实现了很多这些类型的算法。 编辑3:这是一个很好的介绍神经网络 。 它涵盖了很多基础知识,包括源代码(尽管在C ++中)。 他实施了无监督的学习算法,我想您可能正在寻找一种监督的反向传播算法来训练您的网络。 编辑4:另一个好的介绍 ,避免了很重的数学,但是如果你想挖掘它,可以在底部提供许多细节的参考。 包括伪代码,良好的图表和反向 ...
  • 如果你的兴趣是机器学习,数据挖掘和计算机视觉,那么我会说乐高头脑风暴并不是你的最佳选择。 除非您对机器人/电子产品感兴趣。 做有趣的机器学习你只需要一台电脑和一个问题来解决。 想想ai-contest或mlcomp或类似的东西。 做有趣的数据挖掘,你需要一台计算机,大量的数据和一个问题来回答。 如果您有互联网连接,您可以获得的数据量仅受带宽限制。 想想netflix奖 ,试着从任何地方收集和解释数据。 如果你正在学习, 这是一个很好的起点 。 至于计算机视觉:你需要的只是一台电脑和图像。 根据您发现有趣的问 ...