读人工智能全传10深度思维

1. 深度思维

1.1. DeepMind

1.1.1. 深度思维

1.1.2. 2014年的员工不足25人

1.1.3. 深度思维公司公开宣称其任务是解决智能问题

1.1.4. 2014年谷歌收购DeepMind,人工智能突然成了新闻热点,以及商业热点

1.1.4.1. 收购报价高达4亿英镑
1.1.4.2. 深度思维是人工智能领域最引人注目的收购

1.2. 科技公司都争先恐后投入这个领域,生怕被历史车轮甩落

1.2.1. 2015年,优步公司从卡内基-梅隆大学机器学习实验室揽获了至少40名研究人员

1.3. 雅达利游戏系统

1.3.1. 基于早期的雅达利2600系列游戏机

1.3.2. 1980年前后的产品

1.3.3. 最早获得成功的视频电子游戏平台之一

1.3.4. 它支持210×160像素网格的大分辨率视频,支持128位颜色

1.3.5. 用户通过一个带单独按钮的操作杆进行操作,游戏机使用插卡式游戏卡带

1.3.6. 深度思维用的游戏卡带一共有49个游戏

1.4. 深度思维的程序根本没有任何关于游戏的知识,程序得到的唯一信息是出现在游戏机屏幕上的图像(以210×160彩色像素网格的形式)和游戏的当前分数

1.4.1. 程序没有得到诸如“对象A在位置(x, y)上”之类的信息

1.4.2. 任何类似的信息都需要程序从原始的视频数据中自己提取

1.4.3. 程序通过强化学习自学玩游戏:反复玩同一个游戏,在每个游戏中进行实验并获得反馈,并学习哪些行为会得到奖励,而哪些不会

1.4.4. 雅达利游戏程序学会了游戏卡带中的29个游戏,表现出高于人类玩家平均水准的能力

1.4.4.1. 在某些游戏里面,它甚至达到了超人的水准

1.5. 他们所做的是写一个程序,让它学习如何比人类更会玩全部49个雅达利游戏中的29个

1.5.1. 程序接收到的唯一输入就是屏上显示的东西,以及分数

1.6. 玩打砖块游戏

1.6.1. 程序了解到,最有效率得高分的方式是在砖墙的一侧“钻”一个洞,让球打进去,这样球就会在砖墙和顶部屏障之间快速反弹,迅速消灭砖块,而玩家可以不用额外操作什么

1.6.1.1. 它是由程序自主学习的

1.7. 蒙特祖玛的复仇

1.7.1. 程序玩得特别糟糕的游戏

1.7.2. 它的难点在于奖励非常稀少

1.7.3. 玩家在获得奖励之前必须执行一系列复杂的任务

1.7.3.1. 这一点与打砖块这种游戏不同,在打砖块游戏中奖励反馈或多或少都是即时的
1.7.3.2. 如果奖励反馈在相关行动执行后很长时间才出现,就会给强化学习带来困难
1.7.3.2.1. 你可能不清楚是哪些行为导致了奖励的发生

1.8. 如果雅达利游戏程序是深度思维团队唯一完成的东西,那也足够让他们在人工智能的历史上留下令人尊重、浓墨重彩的一笔,但是,该团队随后又取得了一系列惊人的成就

1.8.1. 深度思维的工作,从他们的雅达利游戏机到AlphaZero,代表了人工智能领域一系列非凡的突破性成就

2. AlphaGo

2.1. 可能仍然是迄今为止最著名的人工智能系统

2.2. 使用了两个神经网络

2.2.1. 价值网络只负责评估给定的棋盘位置的优劣程度

2.2.2. 策略网络则根据当前棋盘的状况评估下一步棋该放在何处

2.3. 策略网络包含13层,首先使用监督式学习进行训练,训练的数据则是人类的专业棋手下棋的棋谱

2.4. 然后进行自我对战的强化学习

2.5. 最后,这两个网络被嵌入一个复杂的蒙特卡罗树这一搜索技术中

2.6. 撇开表象深入挖掘,你会发现AlphaGo中最能体现智慧的工程都源自经典的人工智能搜索

2.6.1. 于20世纪50年代开发了跳棋学习程序的亚瑟·塞缪尔,他在理解AlphaGo使用的搜索技术时不会有任何困难

2.6.2. 从他的跳棋程序,到现代最引人注目的人工智能系统,都遵循着同一条发展路径

2.7. AlphaGo尽管在围棋方面表现优秀,但它只能下围棋,还必须事先学习许多人类专业棋手的棋谱

3. AlphaGo Zero

3.1. 它的非凡之处在于它是从零开始学习下围棋的,没有学习任何人类棋手的棋谱

3.2. 在没有人工数据干预的情况下,它达到了超越人类棋手的水平,而这一切,只是通过它自己和自己下围棋来实现的

3.3. 在结束9个小时的自我学习以后,AlphaZero能够在和鳕鱼系统对战中连续击败对方,最少也能保持平局

3.3.1. 鳕鱼系统是世界领先的国际象棋程序之一

3.4. AlphaZero似乎可以自学成才,并且适用于多种不同类型的棋类游戏

3.5. 结论

3.5.1. 尽管AlphaZero体现了令人印象深刻的通用性(它在棋类游戏专业的通用性方面超过了此前任何一个人工智能系统),但它本身并不代表迈向通用人工智能的重大进步

3.5.2. 棋类游戏是相当抽象的,它们与现实世界相去甚远

4. 图像标注

4.1. 你对这幅图的理解是基于你在这个世界上作为一个人类存在的经历

4.2. 这样的理解对于标注机器人而言是不可能实现的,因为它没有这个基础

5. 自动翻译

5.1. 将一种语言自动翻译成另一种语言,是过去十年中因为深度学习技术而快速进步的另一个领域

5.2. 自动翻译工具能做到什么,又不能做到什么,有助于我们理解深度学习的局限性

5.3. 谷歌翻译可能算是最著名的自动翻译系统了

5.4. 关键就在于,你仅仅是懂得法语并不代表就能做好普鲁斯特小说的翻译

5.4.1. 关于20世纪初期法国社会和法国人生活的知识

5.4.1.1. 你得知道他们使用蜡烛照明

5.4.2. 法国历史的知识

5.4.2.1. 你得知道弗朗索瓦一世和查理五世之间的斗争史

5.4.3. 20世纪早期法国文学常识

5.4.3.1. 当时的写作风格,还有作者可能引用的典故

5.4.4. 对普鲁斯特本人的了解

5.4.4.1. 他最想表达的是什么

5.4.5. 需要你有大量的背景知识,谷歌翻译所使用的神经网络里可没有这些知识

5.5. 我们必须消除明确表示知识的世界和深度学习以及神经网络的世界之间的隔阂

6. 学界

6.1. 机器学习领域的两件学界大事是神经信息处理系统(NeurIPS)会议和国际机器学习会议(ICML)

6.2. 机器学习研究领域的许多人根本就不把自己视为“人工智能”的一部分

6.3. 不管分裂的起源是什么,事实就是,在某种程度上,机器学习研究领域的许多人脱离了主流人工智能,沿着自己的轨迹发展

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/870696.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

头歌资源库(26)方格填数

一、 问题描述 二、算法思想 这是一个排列组合问题。我们可以使用动态规划的思想来求解。 假设dp[i]表示填入前i个位置的数字的方案数。考虑第i个位置,它有9种填法(0~9减去前一个位置上的数字),则有dp[i] 9 * dp[i-1]。由于第…

240711_昇思学习打卡-Day23-LSTM+CRF序列标注(2)

240711_昇思学习打卡-Day23-LSTMCRF序列标注(2) 今天记录LSTMCRF序列标注的第二部分。仅作简单记录 Score计算 首先计算正确标签序列所对应的得分,这里需要注意,除了转移概率矩阵𝐏外,还需要维护两个大小…

html5——CSS基础选择器

目录 标签选择器 类选择器 id选择器 三种选择器优先级 标签指定式选择器 包含选择器 群组选择器 通配符选择器 Emmet语法&#xff08;扩展补充&#xff09; 标签选择器 HTML标签作为标签选择器的名称&#xff1a; <h1>…<h6>、<p>、<img/> 语…

如何做好漏洞扫描工作提高网络安全

在数字化浪潮席卷全球的今天&#xff0c;企业数字化转型已成为提升竞争力、实现可持续发展的关键路径。然而&#xff0c;这一转型过程并非坦途&#xff0c;其中网络安全问题如同暗礁般潜伏&#xff0c;稍有不慎便可能引发数据泄露、服务中断乃至品牌信誉受损等严重后果。因此&a…

edge 学习工具包 math solver

简介 推荐微软推出的学习工具中的两项工具&#xff1a;数学求解器和 pdf 阅读器。 打开 edge 学习工具包的方法 &#xff1a;右上角三点-更多工具-学习工具包。 math solver 除了基础的计算求解外&#xff0c;还用图标展示公式&#xff0c;清晰直观。 地址&#xff1a;求解…

CentOS7使用yum命令报错

目录结构 前言使用yum命令&#xff0c;报错信息问题排查解决方案参考文章 前言 安装CentOS 7 虚拟机&#xff0c;使用yum命令报错&#xff0c;调查整理如下&#xff1a; 使用yum命令&#xff0c;报错信息 [rootlocalhost ~]# sudo yum install net-tools 已加载插件&#xff…

每天五分钟深度学习:向量化技术在神经网络中的应用

本文重点 向量化技术,简而言之,就是利用矩阵运算(而非传统的for循环)来执行大规模的计算任务。这种技术依赖于单指令多数据(SIMD)架构,允许一个指令同时对多个数据元素执行相同的操作。例如,在向量化加法中,不再需要逐个元素进行加法操作,而是可以一次性对整个向量执…

【电子通识】无源元件与有源元件的定义和区别是什么?

当提到构成电路的电子器件时,许多人可能会想到晶体管、电容器、电感器和电阻器等器件。一般情况下,我们使用的电子器件分为两大类,即“有源元件”和“无源元件”。 有源元件是主动影响(如放大、整流、转换等)所供给电能的元件。 无源元件是对所供给的电能执行被动…

流程图编辑框架LogicFlow-vue-ts和js

LogicFlow官网https://site.logic-flow.cn/LogicFlow 是一款流程图编辑框架&#xff0c;提供了一系列流程图交互、编辑所必需的功能和灵活的节点自定义、插件等拓展机制。LogicFlow支持前端研发自定义开发各种逻辑编排场景&#xff0c;如流程图、ER图、BPMN流程等。在工作审批配…

【zabbix7】开启HTTP authentication实现单点登录

开启HTTP authentication实现单点登录 一、新建http验证用户 htpasswd -c /etc/nginx/.htpasswd another_username # 在提示中输入密码二、新建Nginx配置文件 把zabbix.conf拷贝一份&#xff0c;然后修改listen监听的端口。 cp zabbx.conf zabbix_http.conf 每个location中新…

【Dison夏令营 Day 16】如何使用 Python 中的 PyGame 制作俄罗斯方块游戏

俄罗斯方块(Tetris)是一款经典的益智游戏&#xff0c;游戏的目的是将落下的几何图形片&#xff08;称为 “俄罗斯方块”&#xff09;排列起来&#xff0c;填满水平线&#xff0c;不留空隙。当一条线被完全填满时&#xff0c;它就被清除了&#xff0c;玩家就能获得分数。随着四角…

操作系统——内存管理(面试准备)

虚拟内存 单片机没有操作系统&#xff0c;每次写完代码&#xff0c;都需要借助工具把程序烧录进去&#xff0c;这样程序才能跑起来。 另外&#xff0c;单片机的CPU是直接操作内存的物理地址。 在这种情况下&#xff0c;想在内存中同时运行两个程序是不可能的&#xff0c;如果第…

(CVPR-2024)SwiftBrush:具有变分分数蒸馏的单步文本到图像扩散模型

SwiftBrush&#xff1a;具有变分分数蒸馏的单步文本到图像扩散模型 Paper Title&#xff1a;SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation Paper 是 VinAI Research 发表在 CVPR 24 的工作 Paper地址 Code:地址 Abstract 尽管文本…

Flutter-实现物理小球碰撞效果

效果 引言 在Flutter应用中实现物理动画效果&#xff0c;可以大大提升用户体验。本文将详细介绍如何在Flutter中创建一个模拟物理碰撞的动画小球界面&#xff0c;主要代码实现基于集成sensors_plus插件来获取设备的加速度传感器数据。 准备工作 在开始之前&#xff0c;请确保…

一文详解DDL同步及其应用场景

目录 一、什么是DDL&#xff1f; 二、什么是DDL同步&#xff1f; 三、DDL同步的痛点 1、缺少自动DDL同步机制 2、缺少DDL变更监测预警 四、解决方案 五、应用场景及案例 案例一 案例二 案例三 在现代数据管理中&#xff0c;数据库的结构变更频繁且不可避免&#xff0c;特别是在…

Kubelet 认证

当我们执行kubectl exec -it pod [podName] sh命令时&#xff0c;apiserver会向kubelet发起API请求。也就是说&#xff0c;kubelet会提供HTTP服务&#xff0c;而为了安全&#xff0c;kubelet必须提供HTTPS服务&#xff0c;且还要提供一定的认证与授权机制&#xff0c;防止任何知…

C语言 | Leecode C语言题解之第229题多数元素II

题目&#xff1a; 题解&#xff1a; /*** Note: The returned array must be malloced, assume caller calls free().*//*假定 num1&#xff0c;num2 为出现次数大于 nums.length / 3 的两个数。&#xff08;最多出现两个&#xff09;遍历 nums&#xff0c; 若出现 num1、num2…

《C语言程序设计 第4版》笔记和代码 第十一章 指针和数组

第十一章 指针和数组 11.1 指针和一维数组间的关系 1 由于数组名代表数组元素的连续存储空间的首地址&#xff0c;因此&#xff0c;数组元素既可以用下标法也可以用指针来引用。 例11.1见文末 2 p1与p在本质上是两个不同的操作&#xff0c;前者不改变当前指针的指向&#xf…

无人机之遥控器保养

一、使用存放 1、避免让遥控器受到强烈的震动或从高处跌落&#xff0c;以免影响内部结构的精度&#xff1b; 2、遥控器在使用完后&#xff0c;需要将天线收拢&#xff0c;避免折断&#xff0c;养成定期检查天线的习惯&#xff1b; 3、定期检查遥控器按键有无裂纹、畸变、松旷…

ISO/OIS的七层模型②

OSI模型是一个分层的模型&#xff0c;每一个部分称为一层&#xff0c;每一层扮演固定的角色&#xff0c;互不干扰。OSI有7层&#xff0c;从上到下分别是&#xff1a; 一&#xff0c;每层功能 7.应用层&#xff08;Application layer &#xff09;&#xff1a;应用层功能&#x…