看完这13张图,不得不佩服还是外国人会玩人工智能




对于程序员来说,机器学习领域无疑充满着巨大的诱惑和挑战,很多人对里面复杂的概念和算法头疼不已,那么,有没有一套对新手既友好又明了,对老手能加深印象,不断复习的学习办法呢?有,今天优达菌要送给大家一份“机器学习小抄”


如果你不太清楚机器学习小抄是什么,请继续耐心阅读;如果你比较着急获取完整版内容,请直接翻到文末查看获取小抄的方法。




这份“小抄”来自网红数据科学家Chris Albon,他有近十年的统计学习、人工智能和软件工程方面的经验。著名的IT播客 Partially Derivative,就是他和其他两位大佬一起主持的。


由于在机器学习上浸淫多年,累积了丰富的知识,Chris便将自己所识所学浓缩在一张张短小精悍的卡片中,并且在Twitter上不定期地更新卡片内容。

Chris本人


众所周知,机器学习是由计算机、科学统计学和数学共同支撑起的一个广阔领域,有数百个概念要学习,这些卡片旨在帮助你速记机器学习中的关键概念。


每一张卡片都包含一个机器学习概念,用图片搭配文字解释的方式生动地向你阐述概念背后的基础思路,范围从数学基础横跨到大热的深度学习。


这些公式由Chris先手工绘制,再数据化转换成你面前的一张张图片,比起一页页地翻教科书更轻松偷♂税。


你甚至能把图片复制进手机,哪里不会点哪里,路上通勤的时候也能随手翻看,这总比背英语单词有趣多了吧!


到底愉不愉悦?优达君花了点时间金钱集齐了这套卡片,并辛苦地做了汉化,同时对一些作者没讲到或者不全面的知识做了补充。今天先发一些给大家感受下,如果觉得好玩且有帮助,可以直接翻到文末,查看小卡片领取方法。


准确率:分类问题中的常见度量方法。当我们有极为不平衡的分类时则不能奏效。这种情况下使用F1分数更为合适。


自适应提升算法:

1、为每一个观测值Xi赋一个初始的权重值,Wi = 1/n,n是观测值总数。

2、训练一个“弱”模型。(通常是决策树)

3、对于每一个观测值:

     a)      如果预测值错误,Wi增加

     b)      如果预测值正确,Wi减少

4、训练一个新的弱模型,其中,有更高权重的观测值获得更高优先级。

5、重复第3、4步,直到观测值都能被完美预测出来或者预设数量的树都被训练完了。


调整R平方:

直观上:一旦所有正确的特征都已经加上,额外的特征应该被惩罚。

(优达菌注:调整R平方有最大值,在此最大值下有最好的特征组合,常用于特征选择。)


凝聚型聚类:所有的观测值初始自成一个聚类。根据一些标准,聚类间相互合并。不断重复这一过程,直到到达某一终点。


AIC(Akaike information criterion):在特征选择时用于比较哪个模型更好。AIC越小越好。


几乎处处:根据度量理论,一个几乎处处成立的性质对所有事物都是正确的,但是一些先锋案例就会自然地忽略掉。


岭回归中的Alpha,不懂看图。


安斯库姆四重奏:安斯库姆四重奏用4组完全不同的数据,得出相同的汇总统计和回归线。这是对汇总统计的警示。


神经网络架构:

           神经网络架构指单元,他们的激活函数,有几层等等。

           大多数的神经网络架构可被理解为单元堆积层。

           某一问题的最好架构应该通过使用验证集试验后找到。


AUC:ROC曲线代表二分类器中真正类比例和假正类比例的概率阈值。AUC能评判模型的整体质量。AUC越高越好。



觉得机器学习很有趣,想进一步深入学习,加入 AI 热潮,成为拥有 Google 技术认证高薪、抢手又能改变世界的机器学习工程师吗?


Udacity 与 Google、Kaggle、滴滴打车等行业领先企业,共同设计打造“机器学习工程师”纳米学位项目,带你从0开始进入人工智能领域,达到行业认可的硅谷水平。


扫描下方二维码,加入微信群,获取全套机器学习小卡片,还有更多课程资讯等你了解!


加入课程,你可以获得:

  • 硅谷独家课程内容,Google、Kaggle、滴滴出行开发课程并颁发认证

  • 全中文的学习辅导

  • 每周一次直播辅导,答疑没烦恼

  • 加入同步学习小组,在导师监督下加速成长


本期课程将于 12月14日(明天)10:00 正式开放报名,仅限 300 席位点击阅读原文,立即预定抢席位!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/304687.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python通过封装可以实现代码复用_Python学习笔记(五)函数和代码复用

函数能提高应用的模块性,和代码的重复利用率。在很多高级语言中,都可以使用函数实现多种功能。在之前的学习中,相信你已经知道Python提供了许多内建函数,比如print()。同样,你也可以自己创建函数,这被叫做用…

实用的网络命令汇总

通过ping检测网络故障的典型次序 正常情况下,当你使用ping命令来查找问题所在或检验网络运行情况时,你需要使用许多ping命令,如果所有都运行正确,你就可以相信基本的连通性和配置参数没有问题;如果某些ping命令出现运行…

EFCore查缺补漏(二):查询

相关文章: EFCore查缺补漏第 20 轮 TechEmpower 评测结果出炉了,ASP.NET Core 的 Plaintext 成绩名列前茅,带着 EFCore 的测试却在 Single query / Multiple queries / Fortunes 中落了下风,成绩远不如 dapper,更不如直…

如何在mysql中打开mongodb_图解:如何从MySQL移植到MongoDB

【IT168 技术】下图是使用 SQL 和 MongoDB 的对应信息图表,点击图片查看大图:MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似…

仿真模拟,需要注意这几点!

周日晚上的直播甚是精彩先是潘同学分享了获奖论文和解题技巧接着是董同学分享了论文的写作小技巧po几张截图让大家感受下此时此刻可能会有不少童鞋正在为错过直播而懊悔不用担心超模君还准备了一份豪华大礼本周超模君特意邀请到今年美赛D题特等奖获奖者谢挺同学(获奖…

mfc从mysql中读取数据类型_在MFC中使用SQlite数据库读取数据

本人在数据库里面用回调函数来处理读取函数的返回值,回调函数必须使用static类型才可以,这样处理起返回的数据变得非常的麻烦,很难处理结果集。后来从网上找了一个预编译的例子,放在网上和网友分享。例子成功的调试通过了sqlite3 *db 0;sqli…

php 结构体_php基础知识集合

微信公众号:PHP在线源码PHP 独特的语法混合了 C、Java、Perl 以及 PHP 自创新的语法编译器编译器就是将“一种语言(通常为高级语言)”翻译为“另一种语言(通常为低级语言)”的程序一个现代编译器的主要工作流程:源代码 (source code) → 预处理器 (prepr…

Kubernetes 凭什么成了云原生应用底座?

微软开源的 云原生应用开发的框架 Dapr 发布了1.0 版本《Dapr 正式发布 1.0》,云原生应用开发更加简单容易,Dapr 的容器编排环境也是用的Kubernetes。过去几年,以 Docker、Kubernetes 为代表的容器技术已发展为一项通用技术,BAT、…

【汇总推荐】深度学习、自然语言处理干货笔记汇总

今天这篇文章对十一月份推送的干货笔记,做一个总结,大家可以进行分类查找,希望对大家有所帮助。人工智能实战技巧与学习方法系列免费公开课【重磅福利】人工智能实战技能与学习方法系列公开课免费分享深度学习干货文章【直观理解】一文搞懂RN…

计算机网络四级考试

计算机网络四级考试         第一章网络系统结构与设计的基本原则7月15日  8月6日          第二章中小型网络系统总体规划与设计方法7月17日  8月8日          第三章IP地址规划和设计方法7月19日  8月10日          第四章路由…

mongodb时间范围查询少8个小时_为何要对开源mongodb数据库内核做二次开发

关于作者前滴滴出行技术专家,现任OPPO文档数据库mongodb负责人,负责oppo千万级峰值TPS/十万亿级数据量文档数据库mongodb内核研发及运维工作,一直专注于分布式缓存、高性能服务端、数据库、中间件等相关研发。后续持续分享《MongoDB内核源码设…

谷歌微软高通反对英伟达收购ARM 值得国人深思

日前,外媒报道全球一些顶尖科技公司正在向美国反垄断监管机构表达反对英伟达公司收购ARM,认为该交易将损害对其业务至关重要的行业领域的竞争。谷歌、微软和高通公司等公司都对这笔价值400亿美元的交易感到担忧,并要求反垄断官员进行干预。谷…

爬虫 404 try_和我一起学爬虫

前几天就想写一个爬虫系列的文章,因为比较忙所以没有写(还不是因为懒),趁着现在屋里比较的凉爽,心也比较的静,总结下目前遇到的一些爬虫知识,本系列将从简单的爬虫开始说起,以后会逐…

女神一秒变路人!腾讯研究AI卸妆效果算法出品“一键卸妆”功能

综合自:快科技、腾讯国际计算机视觉大会(ICCV)于 10 月 22 日到 29 日在意大利威尼斯举办,会上,腾讯优图团队带来了一个让所有女生恨得牙痒痒的功能——“一键卸妆”。所谓道高一尺魔高一丈,美图秀秀造福了…

perl对文件和目录进行操作

对文件和目录进行操作opendir 目录句柄,“目录”;for $a(readdir 目录句柄){printer $a}areaddir HOME;打印目录,没有排序。查找递归目录用File::Find删除文件:(只是删掉连接,数据应该还没有删掉。我是这样…

二进制序列化

在计算机世界,万物皆01二进制,包括各种各样的文件格式和网络协议,二进制格式最为常见!NewLife.Core 内置了完整的二进制序列化框架 Binary,经过十多年洗礼,发展到了第三代支持Handler处理器扩展。Binary的同…

python搭建项目结构_Django搭建项目实战与避坑细节详解

Django 开发项目是很快的,有多快?看完本篇文章,你就知道了。安装 Django前提条件:已安装 Python。Django 使用 pip 命令直接就可以安装:pip install django如果安装失败,很可能是因为网络连接超时了&#x…

matlab基于ssd的角点匹配_基于关键点的目标检测

0 1前言:基于锚点的目标检测方法在基于关键点(key points)的目标检测方法出现之前,主流目标检测方法一般先设置一些预先定义好的 锚点 (anchor boxes)。 作为预测物体框的参考,神经网络只需要预测实际的物体框相对于这些锚点的偏移。 这样模型…

python中summary_python summary_study.py

#!/usr/bin/env python#-*- coding:utf-8 -*-import os,sys,time,shutil,refrom _ast import Numfrom django.db.models.sql.datastructures import Join---------------------------此脚本用于之前学习内容的回顾装饰器还需要多看,目前还是不是很清楚类的继承prope…

NLog整合Exceptionless

前言在实际的.Net Core相关项目开发中,很多人都会把NLog作为日志框架的首选,主要是源于它的强大和它的扩展性。同时很多时候我们需要集中式的采集日志,这时候仅仅使用NLog是不够的,NLog主要是负责代码中日志的落地,也就…