史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(二)

谢谢你们。小夕昨晚又熬夜被发现了,谢谢对小夕的关心...

有你们陪着,小夕很幸运。

路人乙:“小夕,别人都说上完coursera上的那门机器学习课就已经入门机器学习了,可你又不这样认为。那你认为上完那门课,或者说学完上一篇的阶段一,处于什么水平呢?”

小夕:“大忽悠水平。”

前言

 2333,小夕没有开玩笑哦,coursera那门课是为了帮助大家从整体上了解一下机器学习大框架,并培养兴趣。而仅仅完成阶段一的话,其实对企业而言几乎是毫无价值的,啃论文也会寸步难行的呢。

 

那么完成阶段二以后是处于什么水平呢?当然是真正的机器学习入门水平啦~

只要您认真学、认真总结了,相信此时配合您的编程能力,就可以尝试自己实现机器学习模型啦。调用别人写好的API,也会胸有成竹啦,而不是将其看作黑匣子了。

对于应用场景来说,完成该阶段就可以转行去做数据挖掘(DM)了,但要做计算机视觉(CV)、自然语言处理(NLP)中的模式识别问题的话,还不够哦~

所以说,小夕将东西放在这里咯,剩下的就靠各聪明的你们用探索欲去完成啦~

 

还有哦,在正式开始阶段二之前,小夕强烈建议您将阶段一中的matlab代码实现的机器学习算法再重新看一遍呐。不要光看你写的!更重要的是看老师给写好的大框架!甚至可以打开某个matlab内置的库函数感受一下!

 

阶段二


 概率与统计

  • 前置课程

    • 微积分

  • 主参考资料

    • 《概率论与数理统计》陈希孺(注意不是浙大的那本!)

  • 重点内容:

    • 整本书!

  • 学习方法
    这本书写的超棒!虽然学校的概率统计用的浙大那本教材,但是学完也有好多地方似懂非懂。直到在图书馆无意间遇到了这本书。。。所以认真读咯,是不是一想到小夕也读过这本书,就迫不及待想开始了呢【捂脸】

  • 主要意义
    这门课程不需要谈意义了吧╮(╯▽╰)╭这门课都没有掌握,那只能处于计划一的大忽悠水平咯~


最优化算法-上

  • 前置课程

    • 微积分(高等数学)

    • 线性代数

  • 主参考资料

    • 《Deep Learning》第四章(中文版链接见手册(一))

    • 《Numerical Optimization》Jorge Nocedal等

  • 辅助参考资料
    《最优化理论与方法》袁亚湘,孙文瑜(这本书已绝版,但某宝有卖复刻版;在学校的同学可去图书馆借,没收藏这本书的大学应该可以取消数学和计算机专业了吧)

  • 重点内容:

    • 一阶无约束优化算法

      • 梯度下降法(简单了解步长的确定方法)

    • 二阶无约束优化算法

      • 牛顿法

    • 约束优化算法

      • 线性规划概念与应用

      • 二次规划概念与应用

      • 拉格朗日乘子法的简单认识

  • 高级内容(依照自身数学基础,尽可能深的理解)

    • 一阶无约束优化算法

      • 梯度下降法(仅掌握线搜索法,学嗨了可以看信赖域法)

    • 二阶无约束优化算法

      • 共轭梯度法

      • 拟牛顿法

    • 约束优化算法

      • 线性规划(仅掌握单纯形法,学嗨了可以看内点法)

      • 二次规划(仅掌握对偶法,学嗨了可以看积极集法)

  • 学习方法

  1. 小夕考虑到最优化算法对机器学习而言虽然至关重要,但是对数学基础要求很高。因此在本计划中采用个性化定制的方式:

    1. 如果您的数学基础很好,强烈建议您尽可能的完成高级内容,这对后面机器学习算法的透彻理解极其重要。

    2. 如果您的数学基础不够,只需完成重点内容即可。但是希望在业余再加深一下对微积分、线性代数等知识的理解哦~方便以后突破瓶颈呐。

  2. 对于重点内容,只需要认真研究理解《Deep Learning》中的4.3节和4.4节,这两节信息量很大,请务必认真阅读每一句话。如果这两节都感到寸步难行的话,请补习最优化的前置课程哦。

  3. 对于高级内容,《Numerical Optimazation》是极其合适的,这本书很偏工程实践,讲了很多practical的问题。也是我们学校最优化课的教材。这本书貌似没有中文版,不过相信您的数学基础都那么好啦,看英文资料也没有问题哒~

  • 主要意义
        小夕在指导(一)中提到的机器学习瓶颈就是指的这门课!
        小夕第一次学机器学习时,以为各个机器学习模型是孤立的,有的用梯度下降,有的二次规划的,当时也不知道,结果学完之后机器学习体系特别散。
        直到上了这门课,才恍然大悟,竟然有这么一个数学体系将机器学习中的“寻最优参数”(即最优化)问题全都聚拢到一起了!
        所以,这门课之于机器学习的重要性,小夕只能说重中之重呀。


  •  

    机器学习-下

    • 前置课程

      • 线性代数

      • 概率与统计

      • 最优化算法

    • 主要参考资料

      • 《统计学习方法》李航

      • 《数据挖掘导论》Pang-Ning Tan等

    • 重点内容:

      • 感知机模型

      • K近邻模型

      • 朴素贝叶斯模型

      • 决策树模型

      • 支持向量机模型

      • 集成分类器

        • Bagging

        • Boosting

        • Random Forest

    • 学习方法

    1. 在确信自己的前置课程已经完成的前提下,针对重点内容的前5项,抱起《统计学习方法》怒啃吧!不要有心理障碍,当你像接受python一样接受数学语言时,你会发现这本书读起来很轻松~

      1. 对于Logistic模型,也就是书上的第六章可以不用看。完成阶段一后应对Logistic模型有足够的了解了(只要你别偷懒!),更深入的了解会在下一阶段展开。小夕总觉得这一章讲的半浅不深的。建议跳过。

      2. 对于决策树模型,也就是书上的第五章,需要预先学习信息论中的一点知识,起码弄懂熵、条件熵、自信息、互信息的概念。如果感觉书上的讲解不易理解,可以求助《数据挖掘导论》或者Google。

      3. 对于SVM模型,记得初学时在98、99页的位置遇到过一个问题,感觉书上的解释不够详细,导致没理解SVM。但是小夕实在想不起来了QAQ。懂了之后再找这个点好难。所以如果你们读到这里后遇到跟小夕一样的问题,请及时求助Google或者纸质资料哦(小夕当时是看《信息检索导论》理解的这个点,这本书的第15章讲的SVM挺棒,不过你们没有文本方面的前置知识小夕不清楚会不会影响理解QAQ)

      4. 如果依然感到某个模型的数学描述太难理解,则拿起《数据挖掘导论》找到对应的模型学习一遍,再返回来看。(你想说《数据挖掘导论》上也看不懂怎么办?咳咳,请返回计划1。)

      5. 如果你感觉某个模型的数学描述看懂了,但是总感觉意犹未尽,好像还缺点什么,甚至会有一种小茫然,那么恭喜你,你的大脑试图在模型之间建立联系,它已经迫不及待的要开启下一轮计划了~暂时没有这种感觉也没关系,毕竟不同人的学习模式不一定一样嘛。

    2. 重点内容的前五项完成后,第六项在《数据挖掘导论》中解决(第五章第六节)。

  • 主要意义
        在阶段一我们已经浅浅的尝了一下整个机器学习大框架。除了了解了机器学习的基本概念、常用模型外,也对正则化技术、交叉验证思想等有了初步的认识,完成了科普阶段的积累。
        但是小夕讲了,我们不做大忽悠哦~因此经过本课程勤恳的钻研,您就可以揭开机器学习的大部分面纱啦!你会发现看似神奇的学习算法,人工智能中看似神奇的学习能力,原来不过是几个数学公式+工业界的小trick嘛~~ 
        至此,您可以称得上机器学习的从业者了。动手欲强的人估计此时已经将书上的数学语言翻译成您喜欢的编程语言了吧( ̄∇ ̄)

  •  

    下阶段预告

    1. python

    2. 机器学习任务实践

    3. 模式识别与深度学习-上

     

    文末,还是想再说一声“谢谢你们(⁎⁍̴̛ᴗ⁍̴̛⁎)”。小夕会将你们带给小夕的感动延续下去,再转交到你们手里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机史上首篇教你从算法问题提炼算法思想的文章

路人丙:“小夕,你说学算法有什么用呢?”小夕:“好玩呀。”路人丙:“算法问题那么多,现查现用不就好了?”小夕:“好咯,既然你诚心诚意的问了~小夕就大发慈悲的震惊你(&…

美国能源部正式宣布核聚变里程碑式突破,专家点评商业化还需数10年

来源:澎拜责任编辑:郑洁图片编辑:张同泽校对:施鋆耗资35亿美元的美国国家点火装置用了10多年时间不断冲击点火目标,过程一波三折。成功点火后有两条路可走。一是冲刺更高的能量增益,未来或将再建更大能量的…

Science:找到杀死癌细胞的“单词”

来源:生物通利用新的机器学习技术,加州大学旧金山分校(UCSF)的研究人员与IBM研究院的一个团队合作,开发了一个包含数千个细胞“命令句”的虚拟分子库,基于引导工程免疫细胞寻找并不知疲倦地杀死癌细胞的“单词”组合。预测模型允许…

拼写校正与动态规划的小故事

喵喵喵,细心的你有没有发现小夕已经将卧室和书房精装修了呢~可以输入口令【ho】,或者点击主页的“旧的故事”标签进入哦。一个小现象小夕今天给大家讲一个自然语言处理/信息检索领域的小现象~细心的同学可能发现啦,每当你在使用某度进行搜索时…

《物理世界》公布2022年度十大突破

来源:科技日报近日,英国《物理世界》杂志公布了2022年度十大突破,涵盖从量子、医学物理学、天文学到凝聚态物质等各个方面。这十项突破是由《物理世界》编辑小组从今年在该杂志网站上发布的涵盖物理学所有领域的数百项研究中精选出来的。开创…

飞行器真的是计算机!

小夕在一边默默的玩弄心爱的小四轴(飞行器)。路人丁:“小夕,你不是学计算机的吗?怎么玩起飞机来了?”小夕:“对呀,小四轴也是计算机呀”。路人丁:诶?会不会有…

谷歌员工担心自家 AI 敌不过 ChatGPT,高管回应:其过快发展可能损害公司

来源:AI前线整理:冬梅、核子可乐谷歌的 Jeff Dean 表示,一旦提供错误信息、大企业所面临的“声誉风险”要比小公司更严重,所以谷歌自然“比小型初创公司更加保守”。自 11 月底以来,AI 聊天机器人 ChatGPT 正式向公众发…

深入浅出不可思议的中文分词技术

亲爱的喵喵们,明天小夕就正式开学啦。开学后每周有几天的课比较多,小夕为了保证每篇文章的质量,可能做不到每天一更啦。但是小夕也会尽量挤出时间来写文章,尽量保证两三天更一篇。希望不要责怪小夕哦...分词,也叫切词&…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(三)

能够坚持走到阶段三的喵一定是很有毅力的喵!也是很合格的机器学习/人工智能研究者啦~但是走到这里,也意味着您不满足于使用看似孤立的机器学习模型来生硬的完成一些任务,那么,大一统的理论体系就在这一阶段建立吧~前言完成这一阶段…

专访中国工程院院士杜祥琬,可控核聚变美国成了吗?

凤凰网科技 出品作者|蒋浇微信编辑|李金洋12月13日,美国能源部宣布,在加利福尼亚州的劳伦斯利弗莫尔国家实验室(LLNL),研究人员首次在核聚变反应中产生“净能量增益”,即聚变反应产生…

一个问题就可以辨别真假NLP(自然语言处理)研究者

╮(╯▽╰)╭哎,自从人工智能火了以后,最近自称NLP研究者的人越来越多了,然而这其中的大忽悠有多少小夕就不想多说了。如果连自己在哪个领域、哪个学科搞研究都不懂的话,你相信他真的是这个领域的研究者喵?反正小夕不信…

2023年十大数字科技前沿应用趋势

来源:腾讯研究院编辑:蒲蒲继21年的“变量”、22年的“融合”,2023年数字科技的发展呈现出明显的“升维”特征。近日,腾讯研究院联合百位内部科学家、技术专家和外部院士专家,发布《升维 - 2023年十大数字科技前沿应用趋…

绕开数学,讲讲信息论

看到文章的标题,肯定有人想说“诶?小夕你不是做人工智能吗?怎么又捣鼓起通信里面的信息论了?”小夕肯定会很开心的揪住你,然后说“哈哈哈~发现一只外行!”学过机器学习的喵喵肯定知道很多决策树的核心就是计…

大数据时代的机器学习有什么不同?

小夕昨晚没有发文章&#xff0c;却收到了一个大红包和好多晚安&#xff0c;好受之有愧..>_<...谢谢你们喵。路人戊&#xff1a;小夕&#xff0c;我们身处大数据时代了&#xff0c;好厉害呢。小夕&#xff1a;嗯嗯&#xff0c;哪里厉害了呢&#xff1f;路人戊&#xff1a;…

Science Bulletin | 阿尔茨海默病的现状与未来

目前全球人口老龄化进展严重&#xff0c;中国已成为世界上老龄化最快的国家之一。随着人口老龄化&#xff0c;痴呆患者的数目急剧增加&#xff0c;阿尔茨海默病&#xff08;Alzheimers disease, AD&#xff09;作为痴呆的主要原因&#xff0c;已成为当今社会最为热点的话题之一…

Science年度十大科学突破出炉:韦伯望远镜高居榜首,AIGC、NASA主动撞击小行星紧随其后...

来源&#xff1a;FUTURE远见选编&#xff1a;FUTURE | 远见 闵青云 文&#xff1a;量子位 前脚韦伯望远镜运维科学家刚获得Nature年度十大人物&#xff1b;紧接着&#xff0c;Science也将韦伯望远镜评为年度最大科学突破&#xff01;今天&#xff0c;Science重磅发布2022年度科…

词袋、独热与词向量

亲爱的读者喵喵&#xff0c;由于一些事情&#xff0c;小夕最近情绪欠佳&#xff0c;导致昨天又失约没有更新文章...而且文章中萌气散失...小夕会尽快调整好哦&#xff0c;小夕依然萌萌嗒我们知道&#xff0c;传统的数据挖掘任务面向的是结构化数据。结构化数据很好理解&#xf…

人工智能会“偷走”潜艇的隐身能力吗?

更好的探测技术 不仅能使海洋变得透明&#xff0c;也许还会削弱核威慑力。潜艇的价值主要在于其隐蔽性。有一种名为“相互确保摧毁”的威慑战略&#xff0c;其关键在于尽量确保潜艇在核战争的第一次导弹打击中幸存下来&#xff0c;从而在第二次打击时发射导弹回击。因此&#x…

人工智能大地图之分布式人工智能篇

前言人工智能大地图系列文章更新啦&#xff01;大地图系列的文章是为了帮助即将入门和初步入门人工智能相关领域的喵喵从上帝视角看清整个人工智能学科的全貌&#xff08;好长的句子&#xff09;&#xff0c;小夕可不希望小夕的粉丝在研究了一年的人工智能某方向后&#xff0c;…

符合人类创作过程的AIGC:自动生成长故事的模型出现了

来源&#xff1a;机器之心报道编辑&#xff1a;小舟、蛋酱AI写文章还是得模仿人类的创作方法。在今天的人工智能领域&#xff0c;AI 写作神器层出不穷&#xff0c;技术和产品可谓日新月异。如果说 OpenAI 两年前发布的 GPT-3 在文笔上还稍欠火候&#xff0c;那么前段时间的 Cha…