史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(一)

喵喵喵~大家元宵节快乐噢。有没有要陪小夕出去看烟花的吖...

小夕借此给热爱学习的喵喵们献上这篇拙文,希望不要嫌弃哦~

还有,小夕画的封面图是不是很棒呀( ̄∇ ̄)

小夕发现现在想进军人工智能领域的程序yuan甚至少年少女喵好多呀,但是有几只向我吐槽过网上的资料很多很杂,入门指导基本是杂而不实,很容易让人满腔热情的开始,却又一脸懵逼的放弃。于是小夕来拯救世界啦!~

小夕的车辙

小夕从大二开始做人脸识别,后来发现很快遇到了瓶颈。于是开始学机器学习理论,又很快遇到了瓶颈,于是又开始补数学。补完数学又钻模式识别,又被虐了,但还是辛苦的啃完了《模式分类》。后来学深度学习。再后来不停的论文论文论文、代码代码代码...

 

由于小夕是从工程出发然后到理论,再回工程的道路,小夕觉得这样走的弯路挺大的。而且前期做工程的时候真的很懵逼,各种看不懂然后跳过。

所以小夕这里分享给大家的道路是从理论到工程的平坦上升的道路。当然啦,理论中肯定会穿插代码实践。小夕希望这是一条靠谱的、没有知识断层的深度学习/机器学习的入门之路,希望能在真正意义上帮到大家。

前言

本指导适合于真正有志于钻研机器学习(含深度学习)、模式识别及其相关应用领域的人。对于那种“1个月入门机器学习”的大忽悠学习模式,小夕这里没有噢~

 

理论上说,完全小夕的整个入门指导后,应对整个机器学习大框架、理论细节、工程能力都有了比较好的积累。

 

在此之后可以偏向工程,轻松玩TensorFlow、Caffe等DL框架,转CV、NLP等应用性更强的方向;也可以偏向理论,比较轻松的看看最新的paper,跟上学术界的最前沿。但是工程与理论不是绝对割裂的哦,偏工程也要看论文、补数学,偏理论也要敲代码、了解优秀框架哦。

 

首先,在开始之前,要确保有以下的理论基础:

  • 语文能力最少达到初中水平。

  • 英语能力最少要达到高中优秀水平,尽量在大学四级水平之上。

  • 数学最少达到高中水平,微积分一定得学过。

 

尽量有以下的工程基础(这样可以边学边练,体会更深的喵,但是不会也没有关系的)

  • 面向过程编程范式

  • 常见数据结构

  • 常见算法思想及算法分析能力

 

然后小夕为了避免文章过长,将计划截成了四五个阶段。本文为第一阶段。

阶段一


线性代数

  • 前置课程

    • 中学代数

  • 主参考资料

    • 《线性代数应该这样学》(英文叫《Linear Algebra done right》)

  • 辅助参考资料(有先后顺序)

  1. 《Deep Learning》Bengio等,第二章(中译本勉强能看,链接https://github.com/exacity/deeplearningbook-chinese 呜呜好想赶紧开通原创功能插超链接);

  2. Wiki百科(翻墙不用教吧...);

  3. 《矩阵分析与应用》张贤达

  • 重点内容(无先后顺序):

    • 向量及向量空间

    • 内积与范数

    • 线性映射

    • 矩阵    

    • 张成、线性相关、线性无关

    • 特征值与特征向量

    • 特征分解

  • 高级内容(最起码要了解):

    • 谱定理

    • 奇异值分解(SVD)

    • 矩阵的迹

    • 行列式

  • 学习方法

    1. 适当参考小夕总结的重点内容,细细的品味《线性代数应该这样学》(这本书真的棒呆了)。

    2. 对于书中依然理解不了的部分,参考其他辅助资料哦。另外如果大家有哪方面难以理解,可以告诉小夕,小夕会尽量解答,若有必要的话直接写一篇小文章帮助大家理解哦。

  • 主要意义

    线性代数是机器学习的不能更基础的数学基础。不仅仅是因为矩阵是机器学习中运算的基本单位,而且一些线性代数中的高级理论也被借鉴吸收到了机器学习算法中,比如用SVD(奇异值分解)来对特征降维,迹运算可以加深对PCA及某些聚类算法本质的理解等。


  • Matlab

    • 前置课程

      • 线性代数

      • 面向过程编程范式

    • 主参考资料:

      • Coursera平台斯坦福大学Andrew Ng的“机器学习”课程的Matlab章节的视频及补充资料

      • Matlab内嵌帮助文档

    • 辅助参考资料

    1. Google

    2. CSDN

    3. StackOverFlow

  • 重点内容:

    • Matlab基本语法

    • 矩阵运算常用的内置API(即用户编程接口/函数接口)

  • 学习方法

    1. 参考Coursera平台“机器学习”课程的Matlab教学视频及阅读材料来掌握Matlab基础知识。

    2. 养成使用Matlab内嵌帮助文档来学习新API的方法的习惯。例如在解释器中可以用“help +命令”或“doc +命令”快速掌握某API的用法等。

    3. 多多总结积累常用的矩阵运算API。

  • 主要意义

    利用Matlab入门和理解机器学习算法,可以很大限度的忽略编程语言语法特性对算法实现的影响,也就是说语法对数学表示的还原度很高~这样可以很轻松的打通数学到计算机算法的桥梁,对于以后深入学习机器学习的理论和代码实现都大有裨益。


  • 机器学习-上

    • 前置课程

      • 线性代数

      • 微积分

      • Matlab

    • 主参考资料:

      • Coursera平台斯坦福大学Andrew Ng的“机器学习”课程

      • 《数据挖掘导论》

    • 重点内容:

      • 机器学习基本概念及应用领域

      • 回归与分类的概念

      • 线性回归模型(Linear regression model)

      • 逻辑回归模型(Logistic regression model)

      • 浅层神经网络(Neural Network)

      • 支持向量机(Support Vector Machine)

      • 交叉验证思想及用途(Cross Validation)

      • 聚类的概念

      • K-Means模型

    • 学习方法

    1. 乖乖的跟着Coursera课程计划来就好,要认真完成课后习题和编程题哦。若课程中的有些内容实在没有理解透,强烈建议参考《数据挖掘导论》中的相关章节呐(这本书对于机器学习部分的讲解很好喵)。
      小夕注: Matlab代码实现中多多体会和建立“用矩阵运算”解决问题的思想,努力摆脱“循环套循环”的low做法。

    2. Coursera结束后,仔细阅读《数据挖掘导论》中的第4、5章。先跳过其中的决策树和贝叶斯分类器那一节(以后的计划中会安排的哦),另外第五章的组合方法能看懂就看,看不懂也没关系,放在以后还会深入学。

  • 主要意义

    Coursera上的“机器学习”课程中几乎没有涉及到概率统计的知识,自然也没有贝叶斯分类器这个经典统计模型。同时也没有深入讲解最优化的知识。
    不过这样极大的降低了课程的难度,非常适合拿来快速接触机器学习又不会受很大打击。对于提升兴趣,以及后续理论深入的学习真的很有帮助呀,小夕当年就是看了这个视频然后爱上了可爱的Andrew Ng,然后爱上了这一领域\(//∇//)\。
    而《数据挖掘导论》也非常适合新手入门,讲解的十分浅显易懂,在Coursera课程结束后再根据这个复习一遍,效果会非常好的。

  • 下阶段预告

    1. 概率论与数理统计

    2. 最优化算法-上

    3. 机器学习-下

    本文重点

     

    记得推荐给身边有需要的人哦,ta与小夕都会很感激您的~

     

    ...要哭哭了,最近都快没人打赏了...对小夕的文章不够满意,记得在订阅号主页给小夕提意见哦~小夕真的很用心哦(。 ́︿ ̀。)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481314.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI ChatGPT走红,DeepMind不甘示弱,推出剧本写作AI,一句话生成一个剧本

来源:机器学习研究组订阅Dramatron似乎在一定程度上克服了AI大模型写长剧本前后不连贯的问题。你是否有过这种体验:某一天逛街的时候,脑子里突然冒出来一个好玩的故事,但你一时想不到更多的细节,也没有一块完整的时间去…

[完结]以C++与Java为例,详解数据结构的动态增长策略

前言 本文改编自小夕的订阅号文章《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(上)》、《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(中)》、《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(…

量子计算机创造了虫洞吗?不完全是,但揭示了量子模拟的未来

来源:光子盒研究院最近,科学家们因据称产生了一个虫洞而成为头条新闻。发表在《自然》杂志上的这项研究使用量子计算机在简化的物理模型中模拟虫洞。消息传出后不久,物理学家和量子计算专家对虫洞是否真的存在表示怀疑。这是怎么回事&#xf…

复旦大学邱锡鹏教授:语言模型即服务,走向大模型的未来

来源:智源社区作者:智源社区整理:周致毅人类一直期待AI能在处理自然语言方面大放异彩,语言大模型在近些年已逐渐成为NLP领域的标配。随着模型的扩张,当前大模型的调用已变成上游厂商开放API供下游使用的模式。这一模式…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(二)

谢谢你们。小夕昨晚又熬夜被发现了,谢谢对小夕的关心...有你们陪着,小夕很幸运。路人乙:“小夕,别人都说上完coursera上的那门机器学习课就已经入门机器学习了,可你又不这样认为。那你认为上完那门课,或者说…

计算机史上首篇教你从算法问题提炼算法思想的文章

路人丙:“小夕,你说学算法有什么用呢?”小夕:“好玩呀。”路人丙:“算法问题那么多,现查现用不就好了?”小夕:“好咯,既然你诚心诚意的问了~小夕就大发慈悲的震惊你(&…

美国能源部正式宣布核聚变里程碑式突破,专家点评商业化还需数10年

来源:澎拜责任编辑:郑洁图片编辑:张同泽校对:施鋆耗资35亿美元的美国国家点火装置用了10多年时间不断冲击点火目标,过程一波三折。成功点火后有两条路可走。一是冲刺更高的能量增益,未来或将再建更大能量的…

Science:找到杀死癌细胞的“单词”

来源:生物通利用新的机器学习技术,加州大学旧金山分校(UCSF)的研究人员与IBM研究院的一个团队合作,开发了一个包含数千个细胞“命令句”的虚拟分子库,基于引导工程免疫细胞寻找并不知疲倦地杀死癌细胞的“单词”组合。预测模型允许…

拼写校正与动态规划的小故事

喵喵喵,细心的你有没有发现小夕已经将卧室和书房精装修了呢~可以输入口令【ho】,或者点击主页的“旧的故事”标签进入哦。一个小现象小夕今天给大家讲一个自然语言处理/信息检索领域的小现象~细心的同学可能发现啦,每当你在使用某度进行搜索时…

《物理世界》公布2022年度十大突破

来源:科技日报近日,英国《物理世界》杂志公布了2022年度十大突破,涵盖从量子、医学物理学、天文学到凝聚态物质等各个方面。这十项突破是由《物理世界》编辑小组从今年在该杂志网站上发布的涵盖物理学所有领域的数百项研究中精选出来的。开创…

飞行器真的是计算机!

小夕在一边默默的玩弄心爱的小四轴(飞行器)。路人丁:“小夕,你不是学计算机的吗?怎么玩起飞机来了?”小夕:“对呀,小四轴也是计算机呀”。路人丁:诶?会不会有…

谷歌员工担心自家 AI 敌不过 ChatGPT,高管回应:其过快发展可能损害公司

来源:AI前线整理:冬梅、核子可乐谷歌的 Jeff Dean 表示,一旦提供错误信息、大企业所面临的“声誉风险”要比小公司更严重,所以谷歌自然“比小型初创公司更加保守”。自 11 月底以来,AI 聊天机器人 ChatGPT 正式向公众发…

深入浅出不可思议的中文分词技术

亲爱的喵喵们,明天小夕就正式开学啦。开学后每周有几天的课比较多,小夕为了保证每篇文章的质量,可能做不到每天一更啦。但是小夕也会尽量挤出时间来写文章,尽量保证两三天更一篇。希望不要责怪小夕哦...分词,也叫切词&…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(三)

能够坚持走到阶段三的喵一定是很有毅力的喵!也是很合格的机器学习/人工智能研究者啦~但是走到这里,也意味着您不满足于使用看似孤立的机器学习模型来生硬的完成一些任务,那么,大一统的理论体系就在这一阶段建立吧~前言完成这一阶段…

专访中国工程院院士杜祥琬,可控核聚变美国成了吗?

凤凰网科技 出品作者|蒋浇微信编辑|李金洋12月13日,美国能源部宣布,在加利福尼亚州的劳伦斯利弗莫尔国家实验室(LLNL),研究人员首次在核聚变反应中产生“净能量增益”,即聚变反应产生…

一个问题就可以辨别真假NLP(自然语言处理)研究者

╮(╯▽╰)╭哎,自从人工智能火了以后,最近自称NLP研究者的人越来越多了,然而这其中的大忽悠有多少小夕就不想多说了。如果连自己在哪个领域、哪个学科搞研究都不懂的话,你相信他真的是这个领域的研究者喵?反正小夕不信…

2023年十大数字科技前沿应用趋势

来源:腾讯研究院编辑:蒲蒲继21年的“变量”、22年的“融合”,2023年数字科技的发展呈现出明显的“升维”特征。近日,腾讯研究院联合百位内部科学家、技术专家和外部院士专家,发布《升维 - 2023年十大数字科技前沿应用趋…

绕开数学,讲讲信息论

看到文章的标题,肯定有人想说“诶?小夕你不是做人工智能吗?怎么又捣鼓起通信里面的信息论了?”小夕肯定会很开心的揪住你,然后说“哈哈哈~发现一只外行!”学过机器学习的喵喵肯定知道很多决策树的核心就是计…

大数据时代的机器学习有什么不同?

小夕昨晚没有发文章&#xff0c;却收到了一个大红包和好多晚安&#xff0c;好受之有愧..>_<...谢谢你们喵。路人戊&#xff1a;小夕&#xff0c;我们身处大数据时代了&#xff0c;好厉害呢。小夕&#xff1a;嗯嗯&#xff0c;哪里厉害了呢&#xff1f;路人戊&#xff1a;…

Science Bulletin | 阿尔茨海默病的现状与未来

目前全球人口老龄化进展严重&#xff0c;中国已成为世界上老龄化最快的国家之一。随着人口老龄化&#xff0c;痴呆患者的数目急剧增加&#xff0c;阿尔茨海默病&#xff08;Alzheimers disease, AD&#xff09;作为痴呆的主要原因&#xff0c;已成为当今社会最为热点的话题之一…