强化学习是一种比较传统的人工智能手段,在近年来随着深度学习的发展,强化学习和深度学习逐渐结合在了一起。
这种结合使得很多原来无法想象的工作有了可能,最令我们瞩目的莫过于 AlphaGo 战胜李世石,以及 OpenAI 团队的机器人可以在团战中战胜人类。这些技术都是非常尖端的技术,而这背后的原理其实有着非常朴实的一面。
为了对近年来逐渐升温的强化学习 A3C 技术以及强化学习整个的实现原理进行说明,我们邀请到了珠海金山软件 AI 工程组技术负责人高扬老师,他将在1月10日的公开课中深入浅出地讲解 A3C 强化学习。
课程信息
主题:深入浅出理解A3C强化学习
时间:1 月 10 日 20:00-21:00
地点:免费线上直播
扫码报名,免费听课
分享嘉宾
高扬,珠海金山软件AI工程组技术负责人,前重庆工商大学研究生导师。曾任欢聚时代、金山软件西山居游戏工作室人工智能、大数据相关部门技术负责人,技术畅销书《白话大数据与机器学习》、《白话深度学习与Tensorflow》、《数据科学家养成手册》著书人。专注于人工智能产品的落地与实现。
适合对象
1. 对强化学习感兴趣的工程师
2. 有基本的机器学习算法理解的工程师
课程大纲
1. 贯序决策(穷举搜索、蒙特卡罗方法)
2. DQN原理(时间差分法和Q-Learning、Deep Q-Learning Network)
3. A3C原理(异步方法的好处)
4. 小恐龙网页游戏的训练方法
5. 进阶资源推荐
课程安排
19:45—20:00 学员提前入场
20:00—20:50 讲师课程分享
20:50—21:00 讲师答疑环节
温馨提醒
1. 开课前会有短信提醒或者邮件提醒,请报名的时候填写正确的手机号码及邮箱地址。
2. 开课后 2-3 个工作日内会上传本节课的视频回放,报名后回放视频不限时观看。