知道这些用于数据科学和机器学习的GitHub存储库和Reddit主题吗?

摘要: 5月最热门的GitHub存储库和顶级Reddit讨论,戳进来~

GitHub和Reddit都是比较有趣的平台,在这里,我不仅学习了数据科学的一些最佳应用,而且还了解数据科学家们是如何编程的。

一直以来,GitHub都是开发人员之间进行协作的终极平台,并且,我们也看到了据科学和机器学习社区以同样的热情来改善它。

而Reddit仍然是一个很好的数据科学领域知识和见解的来源。人们在这个平台上共享代码、数据科学新闻、寻求帮助和意见、发表研究论文等。

这篇文章总结了Reddit平台上5月份一些关于数据科学的讨论,其中包括数据科学家在未来3年的作用以及有史以来最好的机器学习论文集。在GitHub社区中,英特尔开放了其NLP架构库,微软推出ML.NET以支持Dot Net开发者进行机器学习等。

让我们来看看GitHub上的顶级存储库以及Reddit上个月发生的有趣讨论吧。下面是之前四个月较为流行的GitHub存储库和顶级Reddit讨论(从四月起):

一月

二月

三月

四月

ML.NET

 

ML.NET是一个开源机器学习框架。不需要任何构建机器学习模型的经验,机器学习和.NET开发人员就可以轻松使用.NET开发自己的模型。这是预发行版本,包含了基本的分类和回归算法。

ML.NET最初由Microsoft创建的,并且已用于各种产品如WindowsExcelAccessBing等。此版本还捆绑了用于各种模型训练任务的.NET API。

NLP Architect

 

NLP Architect是一个开源Python库,由英特尔实验室的研究人员开发和开源,旨在帮助数据科学家够探索自然语言处理(NLP)和自然语言理解(NLU)领域最先进的深度学习技术。

这个库中我最喜欢的组件之一是可视化组件,可视化组件很整洁的显示模型的注释。更多NLP Architect的信息请点击这里

Amazon Scraper

 

Python包可以让开发人员在亚马逊搜索和提取产品信息。需要分析哪些产品,只需使用该包即可,而不再需要编码来确定。只需输入想要搜索的关键字和最大产品数量(可选),就可以输出CSV格式,然后进行分析。

PIGO – Face Detection in Go

 

Pigo是基于基于像素强度比较的对象检测论文、用Go语言开发的人脸检测库。Pigo库的主要特点如下

1.处理速度快

2.在检测前不需要图像预处理

3.不需要计算积分图像,图像金字塔,HOG金字塔或其他类似的数据结构

4.人脸检测基于以二进制文件数据树结构编码的像素强度比较

RL-Adventure-2: Policy Gradients

这是所有强化学习(RL)爱好者所喜欢的库。深度学习推动了强化学习编写了一个人工智能机器人以人类专家级技能玩Atari游戏。 该存储库涵盖了策略梯度算法的新扩展,这是目前解决强化学习问题最受欢迎的默认选择之一。 这些扩展缩短了训练时间、优化了强化学习的整体表现。

Reddit讨论

实时手势姿态估计

 

这个视频引起了数据科学家和机器学习发烧友的广泛关注,我希望你能看完这个视频,然后你就会很好地了解这项技术是如何实施的。

你会选择哪篇研究论文来证明机器学习是完美的

如果一个机器学习菜鸟或者正在寻找一些用来阅读或参考的研究论文,这是一个很好的话题这个话题中列举了一些优秀的机器学习研究论文,每个数据科学家都将从中受益匪浅。该讨论包括从基本机器学习概念(如高斯模型)到高级概念(如神经艺术风格转换),使用简单功能的增强级联等快速对象检测等论文。这是一个必读话题。

目前,我们对泛化有什么了解? 对于泛化,我们接下来应该提什么问题?

深度学习中的泛化一直是一个争议不断的话题。正如作者所说的那样,我们仍然需要在不少场景努力实现泛化。这个话题围绕目前泛化现状进行了深入探讨,以及它为什么在深度和强化学习中很难理解。这个话题帖子很长,如果你是这个领域的菜鸟,对于你来说可能会有点复杂。不过,我建议无论如何都要阅读这个话题,因为这个话题中包含了一些经验丰富和知识渊博的数据科学家的看法。

医疗行业的机器学习状况

该话题专门研究医疗行业机器学习现状。医疗领域数据科学家分享了他们工作中的经验和观点。想要查看任何生命科学领域机器学习和深度学习的任何信息,请参阅该话题!

数据科学家3年后潜在的职业发展方向

这是大多数人在进入该领域之前非常关心的一个问题。随着自动化机器学习工具的迅速采用,公司在几年内会需要数据科学家吗?本题收集了数据科学中不同人员对未来几年内的职业发展方向的看法。想要寻求职业方向的指导,请查看这一话题!

原文链接

本文为云栖社区原创内容,未经允许不得转载。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521639.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

l2-008 最长对称子串 (25分)_小学数学关于时间认识(时、分、秒)的几点总结

本文将通过对照学习一个个知识点,延伸出各种知识点的常用题型。一、时、分、秒之间的换算:1时60分 1分60秒这类题型考的是时间单位之间的换算,一种是大单位换小单位,一种是小单位换大单位。在之前的一篇文章里有关于换算的计算方法…

如何在阿里云上构建一个合适的Kubernetes集群

摘要: 声明 本文主要介绍如何在阿里云上构建一个K8S集群的实践,只是作为参考,大家可以根据实际情况做出调整。 集群规划 在实际案例中发现,有不少同学使用了很多的小规格的ECS来构建K8S集群,这样其实即没有达到省钱的目…

360断网急救箱_万事不求人,教你自己动手修复网络断网

日常使用中,我们经常会遇到原来好好的网络忽然无法上网的问题。在排除宽带没有问题,硬件交换机、路由器、网线没有问题的情况下,我们可以充分利用第三方工具的修复功能。前几天,我就遇到一例电脑不能上网的问题,同一办…

linux 网络dma驱动,S3C2410的Linux下DMA驱动程序开发

网上介绍Linux下的一般驱动程序开发示例浩如烟海,或是因为简单,关于DMA驱动的介绍却寥寥无几;近期因工作需要,花了几日时间开发了某设备在S3C2410处理器Linux下DMA通信的驱动程序,有感于刚接手时无资料借鉴的茫然&…

Pivotal冯雷:以数字化为核心竞争力的时代 自主可控是企业的“必然选择”

戳蓝字“CSDN云计算”关注我们哦!随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发…

druid去掉广告

定位问题 产生广告的JS文件在 druid-1.1.19.jar/support/http/resources/js/common.js。 查看源码可知是buildFooter方法进行植入,由init方法调用。 解决方案: 找到对应的依赖jar包,如druid-1.1.19.jar 找到support/http/resource/js/comm…

阿里巴巴的AI算法程序媛是怎样的一种存在?

摘要: 一个专注人脸识别技术长达11年的程序媛。程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?在见到于鲲之前,我的脑子里是各种…

Hadoop 中zoo_数据分析中的Excel、R、Python、SPSS、SAS和SQL

作为一直想入门数据分析的童鞋们来说,如何选定一门面向数据分析的编程语言或工具呢?注意是数据分析,而不是大数据哦,数据分析是基础了。数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管…

linux下装sqlserver安装包,【sqlServer】CentOS7.x 上Microsoft SQL Server for Linux安装和配置...

SQL Server Documentationhttps://docs.microsoft.com/en-us/sql/sql-server/sql-server-technical-documentation?viewsql-server-2017Installation guidance for SQL Server on Linuxhttps://docs.microsoft.com/en-us/sql/linux/sql-server-linux-setup?viewsql-server-20…

2019云栖大会:逍遥看巅峰,张勇提“百新”,平头哥“再亮剑”

文 | 阿晶、丹丹、王银发于阿里云栖大会现场 出品 | CSDN云计算(ID:CSDNcloud) “今天不是马云的退休,而是制度传承的开始。”9月10日,阿里20周年的大日子,逍遥子接棒风清扬,跟唱《追梦赤子心》…

10行代码让你轻松搞定对象检测

摘要: 十行代码轻松搞定对象检测?快来看看如何使用ImageAI。计算机视觉是人工智能领域中最重要的一个分支。计算机视觉是一门能够识别和理解图像及其场景的计算机软件系统的科学。计算机视觉包括图像识别、对象检测、图像生成、图像超分辨率等多个方面。…

项目集成Flowable工作流

企业级项目集成Flowable工作流,基于(师父)的开源项目的集成,此开源项目是师傅十几年的经验和实战总结而成,直接可以用于企业开发,旨为帮助更多需要帮助的人! 说明链接项目开原地址https://gitee.com/lwj/flowable博客链接https://…

这个阿里程序员,干了件很轴的事儿

摘要: 我叫孤尽,是一名阿里程序员。 如果说,我身上有一点点和普通程序员不一样,也许是更轴一点。比如我觉得JAVA是世界上最好的语言,没有之一。 最近,我又干了一件比较轴的事情。 我因为这件事曾被大家群嘲…

360路由器v2刷第三方固件_魔百盒M301H-BYT代工MV300H芯片第三方优化刷机卡刷固件下载_移动魔百和 ROM固件...

魔百盒M301H-BYT代工MV300H芯片第三方优化刷机卡刷固件下载固件介绍:1、不带ROOT权限,适用于魔百盒M301H-BYT代工MV300H芯片。2、调出原厂固件屏蔽的wifi,开放原厂固件屏蔽的市场安装和u盘安装apk;3、无开机广告,无系统…

CVPR!你凭什么收录我3篇论文!?

摘要: 在近日举行的年度计算机视觉和模式识别盛会CVPR上,阿里云ET城市大脑的三项视觉技术论文成功入选。 别急着找原因,咱们先了解下什么是CVPR。 这个由专业技术学会IEEE(电气和电子工程师协会)主办的组织全称叫Confe…

c语言中循环结构的作用,C语言中对于循环结构优化的一些入门级方法简介

一.代码移动将在循环里面多次计算&#xff0c;但是结果不会改变的计算&#xff0c;移到循环外面去。例子&#xff1a;优化前&#xff1a;void lower1(char *s){int i;for(i0;iif(s[i]>A&&s[i]<Z)s[i]-(A-a);}优化后&#xff1a;void lower2(char *s){int i;int l…

10分钟Get拥抱无服务的正确姿势

戳蓝字“CSDN云计算”关注我们哦&#xff01;译|孔子东游文|Bob Violino来源|INSIDER PRO无服务器计算旨在实现基础设施的自动化配置以及消除服务器管理的负担&#xff0c;但是你真的准备好使用TA了吗&#xff1f;根据研究公司Markets and Markets 的2018年报告&#xff0c;无服…

深度学习最佳实践系列——权重w初始化

摘要&#xff1a; 本文是深度学习最佳实践系列博客之权重初始化&#xff0c;主要介绍权重初始化的相关问题及方法&#xff0c;文中提及的权重初始化方法均可以应用于普通的神经网络、卷积神经网络和递归神经网络之中。作为深度学习的初学者&#xff0c;我有意识到的一件事情&am…

uft自动化测试工具安装步骤_自动化功能测试和接口测试工具整理

对于自动化测试&#xff0c;原来谈这方面的内容比较少&#xff0c;但是现在我们做DevOps支撑平台的时候&#xff0c;在整个持续集成和交付的过程中&#xff0c;有一个重要的内容就是自动化测试。自动化测试的覆盖面相当大&#xff0c;其中既包括了CS&#xff0c;BS和移动APP的自…

SSM整合Druid数据库连接池

源码地址&#xff1a;https://gitee.com/gb_90/ssm_druid