机器学习必备:前20名Python人工智能和机器学习开源项目

摘要: 机器学习之旅必了解:前20名Python人工智能和机器学习开源项目!

如今机器学习和人工智能已经变得家喻户晓,有很多爱好者进入了该领域。但是,什么才是能够进入该领域的正确路径呢?如何保持自己跟上该领域的发展步伐呢?

为了解决以上两个问题,可以通过利用高级专业人员每天使用的众多开源项目和工具,与社区进行接触。

如今,Tensorflow的贡献者人数增长最快,居首位。Scikit-learn下降到第二位,但仍有非常大的贡献者群体。

与2016年相比,贡献者人数增长最快的项目是:

  1. TensorFlow提高了169%,从493个增加到1324个贡献者。

  2. Deap,提高了86%,从21个增加到39个贡献者。

  3. Chainer,提高了83%,从84个增加到154个贡献者。

  4. Gensim,提高了81%,从145个增加到262个贡献者。

  5. Neon,提高了66%,从47个增加到78个贡献者。

  6. Nilearn提高了50%,从46个增加到69个贡献者。

2018年新晋的两个项目的贡献者人数:

  1. Keras,626名贡献者。

  2. Pytorch,399名贡献者。

图片描述

图1:Github上的前20名Python人工智能和机器学习项目

上图:雪花大小与贡献者的数量成正比,颜色代表贡献者数量的变化-红色越高,蓝色越低。雪花形状适用于深度学习项目,适用于其他项目。

下面的列表根据Github上贡献者的数量将项目从高到低进行排列。贡献者人数的变化与2016年KDnuggets发布的前20名Python机器学习开源项目相对。

1.TensorFlow最初是由谷歌机器智能研究机构的Goole Brain Team的研究人员和工程师开发的。该系统旨在促进机器学习方面的研究,并使其快速、容易的从研究原型过渡到生产系统。

贡献者:1324(上升168%),提交:28476,Stars:92359.Github网址:Tensorflow。

2.Scikit-learn是用于数据挖掘和数据分析的简单而高效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用-BSD许可证,可供所有人访问,并且可在各种环境中重复使用。

贡献者:1019(上升39%),提交:22575,Github网址:Scikit-learn。

3.Keras是一种高级神经网络的API,用Python编写,能够在TensorFlow,CNTK或Theano上运行。

贡献者:629(新),提交:4371,Github网址:Keras。

4.PyTorch、张量(Tensor)和动态神经网络(Dynamic neyral networks)在Python中具有强大的GPU加速。

贡献者:399(新),提交:6458,Github 网址:pytorch。

5.Theano允许你定义、优化和评估涉及多维数数组的数学表达式。

贡献者:327(上升24%),提交:27931,Github网址:Theano。

6.Gensim是一个免费的Python库,具有可扩展的统计语义,用于分析语义结构的纯文本文档,检索语义相似的文档。

贡献者:262(上升81%),提交:3549,Github网址:Gensim

7.Caffe是一个深度学习框架,它的表达、速度和模块化都是在头脑中形成的。它由伯克利视觉和学习中心(BVLC)和社区贡献者开发。

贡献者:260(上升21%),提交:4099,Github网址:Caffe。

8.Chainer是一个基于Python的深度学习模型的独立开源框架。Chainer提供灵活、直观和高性能的手段来实施全方位的深度学习模型,包括最新的模型,如递归神经网络和变分自动编码器。

贡献者:154(上升84%),提交:12613,Github网址:Chainer。

9.Statsmodels是一个Python模块,允许用户探索数据,估计统计模型并执行统计测试。描述统计、统计测试、绘图功能和结果统计的广泛列表适用于不同类型的数据和任意一个估算器。

贡献者:144(上升33%),提交:9729,Github网址:Statsmodels。

10.Shogun是机器学习工具箱,它提供了广泛的统一和高效的机器学习(ML)方法。该工具箱可以无缝地组合多个数据表示、算法类和通用工具。

贡献者:139(上升32%),提交:16362,Github网址:Shogun。

11.Pylearn2是一个机器学习库。其大部分功能都建立在Theano之上。这意味着你可以使用数学表达式编写Pylearn2插件(新模型、算法等),Theano将为你优化和稳定这些表达式,并将它们编译为你选择的后端(CPU或GPU)。

贡献者:119(上升3.5%),提交:7119,Github网址:Pylearn2。

12.NuPIC是一个开源项目,它基于被称为分层时间存储器(HTM)的新大脑皮层理论。部分HTM理论已经在应用中实施、测试和使用,而HTM理论的其他部分仍在开发中。

贡献者:85(上升12%),提交:6588,Github网址:NuPIC。

13.Neon是Nervana基于Python的深度学习库。它提供易用性,同时提供最高的性能。

贡献者:78%(上升66%),提交:1112,Github网址:Neon。

14.Nilearn是一个Python模块,用于快速简单的统计学习神经成像数据。它利用scikit-learn Python工具箱进行多变量统计,并提供预测建模,分类,解码或连接分析等应用。

贡献者:69(上升50%),提交:6198,Github网址:Nilearn。

15.Orange3是新手和专家的开源机器学习和可视化数据。使用大型工具箱交互式数据分析工作流程。

贡献者:53(上升33%),提交:8915,Github网址:Orange3。

16.Pymc是一个python模块,实现贝叶斯统计模型和拟合算法,包括马尔可夫链蒙特卡罗(Markov chain Monte Carlo)。其灵活性和可扩展性使其适用大量问题。

贡献者:39(上升5.4%),提交:2721,Github网址:Pymc。

17.Deap是用于快速原型设计和测试思想的新型演化计算框架,它试图使算法明确,数据结构透明。它与多处理(Multiprocessing)和SCOOP等并行机制完美协调。

贡献者:39(上升86%),提交:1960年,Github网址:Deap。

18.Annoy(Approximate Nearest Neighbor Oh Yeah)是一个C++库,它使用Python绑定来搜索接近给定查询点的空间点。它还创建了大量的基于只读文件的数据结构,这些数据结构被映射到内存中,以便许多进程可以共享相同的数据。

贡献者:35(上升46%),提交:527,Github网址:Annoy。

19.PyBrain是Python的模块化机器学习库。其目标是为机器学习任务提供灵活,易于使用但仍然强大的算法,以及各种预定义环境来测试和比较你的算法。

贡献者:32(上升3%),提交:992,Github网址:PyBrain。

20.Fuel是一个数据管道框架,它为你的机器学习模型提供所需数据。它将被用于Blocks和Pylearn2神经网络库。

贡献者:32(上升10%),提交:1116,Github 网址:Fuel。

贡献者和提交数在2018年2月录得。

原文链接
干货好文,请关注扫描以下二维码:

图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/522133.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

索非亚机器人的采访_还记得曾经扬言要“毁灭人类”的机器人索菲亚吗?如今过成这样...

如今人类电子信息技术的不断发展,人工智能大量出现在我们的生活之中,比如手机、电脑等,他们让我们的生活更加便捷和高效,人工智能作为一项服务人类的技术,在带给我们生活的便利的同时,却也让很多人表示担忧…

华为5G设备全球分布图曝光:欧洲占总量近6成;地平线发布首款车规级AI芯片,名叫征程2.0;奥迪与比亚迪达成电池供货协议……...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 首个金融教育主题微信小游戏…

阿里云全球首次互联网8K直播背后的技术解读

摘要: 3月28日,云栖大会深圳峰会现场,阿里云发布并现场演示了阿里视频云最新8K互联网直播解决方案。这是全球发布的首个8K视频云解决方案,也是全球首次8K互联网视频直播。 视频地址:https://v.qq.com/x/page/v0618atp7…

python画海绵宝宝_《1,2,3到动物园》数数书,适合幼儿园小班宝宝亲子共读,从游戏中了解数字的概念...

大家好,我是神桐妈妈,最近开始陆续给几个幼儿园做了有关绘本方面的师资培训,然后又有新的幼儿园要有了嵌入式幼儿园绘本馆,有了绘本,有了书香氛围,又有孩子们开始接触绘本,每天拿着一本绘本带回…

ESS控制台发布新功能:创建多实例规格的伸缩配置

摘要: 背景 原弹性伸缩ESS服务限定,生效的伸缩配置中只能对应一种实例规格,这样就会存在如果生效的配置中的实例规格的库存不足(高配实例规格通常更容易出现库存不足的情况)时, 用户配置好的伸缩规则以及伸…

在列表前方插入一个数据_通俗易懂的Redis数据结构基础教程

Redis有5个基本数据结构,string、list、hash、set和zset。它们是日常开发中使用频率非常高应用最为广泛的数据结构,把这5个数据结构都吃透了,你就掌握了Redis应用知识的一半了。string首先我们从string谈起。string表示的是一个可变的字节数组…

OpenStack精华问答 | NOVA计算服务

自诞生以来,OpenStack 似乎一直被质疑,其背后最重要的两大推手 NASA 和 Rackspace 都弃它而去,惠普、思科接连宣布关闭基于 OpenStack 的公有云服务,但是,OpenStack 依旧坚挺。1Q:NOVA计算服务A:1 实例生命…

java泛型_Java核心知识 基础五 JAVA 泛型

泛型提供了编译时类型安全检测机制,该机制允许程序员在编译时检测到非法的类型。泛型的本 质是参数化类型,也就是说所操作的数据类型被指定为一个参数。比如我们要写一个排序方法, 能够对整型数组、字符串数组甚至其他任何类型的数组进行排序…

省钱小贴士(ECS):教你如何每年省出8w+ 块

摘要: 随着用户越来越多地使用阿里云的ECS服务,如何用最小的成本来保有ECS,成为用户越来越重要的关注点。为了更好的服务客户,ECS团队调整了系统盘的最小容量限制。 随着用户越来越多地使用阿里云的ECS服务,如何用最小…

相对熵与交叉熵_详解机器学习中的熵、条件熵、相对熵、交叉熵

目录信息熵条件熵相对熵交叉熵总结一 信息熵 (information entropy)熵 (entropy) 这一词最初来源于热力学。1948年,克劳德爱尔伍德香农将热力学中的熵引入信息论,所以也被称为香农熵 (Shannon entropy),信息熵 (information entropy)。本文只…

《CDN 之我见》原理篇——CDN的由来与调度

CDN是将源站内容分发至全国所有的节点,从而缩短用户查看对象的延迟,提高用户访问网站的响应速度与网站的可用性的技术。它能够有效解决网络带宽小、用户访问量大、网点分布不均等问题。 为了让大家更全面的了解CDN的原理、调度、缓存和安全等关键技术点&…

java实现apriori算法_各种排序算法的分析及java实现(一)

阅读本文约需要7分钟大家好,我是你们的导师,我每天都会在这里给大家分享一些干货内容(当然了,周末也要允许老师休息一下哈)。上次老师跟大家分享了下用Navicat for Mysql导入.sql文件的相关知识,今天跟大家分享在 各种排序算法的分…

超越杭州、北京居首、广州晋级第一梯队……国内城市算力大起底!

戳蓝字“CSDN云计算”关注我们哦!近日,在2019中国人工智能计算大会(AICC2019)上,IDC与浪潮联合发布了《2019-2020中国人工智能计算力发展评估报告》。报告指出,计算力是承载和推动人工智能走向实际应用的基…

在阿里,我们如何管理代码分支?

摘要: 阿里有很多的研发团队,不同事业部使用的发布流程、分支策略并非整齐划一,但总体上看是比较规整的。其中有一种主流的发布模式以及对应的分支使用方式,称为“AoneFlow”。这套工作模式思路独特,在阿里以外的地方并…

linux杀掉80端口线程命令

80端口被其他程序占用, fuser -k -n tcp 80 查看端口是否启用 telnet ip地址 端口没有启动,显示拒绝: 端口启动,显示微笑:

.ne中的控制器循环出来的数据如何显示在视图上_【asp.net core 系列】3 视图以及视图与控制器...

0.前言 在之前的几篇中,我们大概介绍了如何创建一个http://asp.net core mvc项目以及http请求如何被路由转交给对应的执行单元。这一篇我们将介绍一下控制器与视图直接的关系。 1. 视图 这里的视图不是数据库里的视图,是一种展示技术。在http://asp.net …

为了让开发者写MaxCompute SQL更爽,DataWorks 增强SQL 编辑器功能

摘要: 众所周知,数据开发和分析的同学每天都要花大量时间写MaxCompute SQL;Dataworks作为数据开发的IDE直接影响着大家的开发效率,这次新上线的Dataworks我们在编辑体验上做了很多工作,在前端实现MaxCompute SQL和编辑…

看懂“大数据”,这一篇就够了!

戳蓝字“CSDN云计算”关注我们哦!来源 | 鲜枣课堂作者 | 小枣君近年来,大数据这个词的热度很高,受到公众的广泛关注。对于很多人来说,当他第一次听到“大数据”这个词,会自然而然从字面上去理解——认为大数据就是大量…

服务器漏洞处理_wildfly禁用https和8443端口

文章目录一、https和84431. 问题分析1.1. https1.2. 8443端口2. 思路预测3. 解决方案一、https和8443 1. 问题分析 1.1. https 从以上2个漏洞分析,都和8443端口有关,而8443是https的端口,由此分析,和https有关。 1.2. 8443端口…