读AI未来进行式笔记01深度学习

1.       AI

1.1.         AI已经发展成一门涵盖许多子领域的重要学科

1.2.         机器学习是迄今为止AI应用最成功的子领域

1.2.1.           在这个领域中,最大的技术突破就是深度学习

1.3.         “人工智能”“机器学习”和“深度学习”的时候,可能不会把它们的概念区分得那么清楚,有时候,这几个词会被混用

1.4.         2016年,基于深度学习技术开发的围棋棋手AlphaGo击败了韩国棋手李世石,令世界为之震惊,而深度学习也借此彻底点燃了人们对AI的热情

2.       深度学习

2.1.         第一篇阐述深度学习的学术论文发表于1967年

2.1.1.           这项技术却花了近50年的时间才得以蓬勃发展,之所以经历了这么长的时间,是因为深度学习需要海量的数据和强大的算力,才能训练多达几千层的神经网络

2.2.         如果把算力比作AI的引擎,那么数据就是AI的燃料,直到最近10年,算力才变得足够高效,数据才变得足够丰富

2.2.1.           如今,智能手机所拥有的算力,相当于1969年美国国家航空航天局(NASA)把尼尔·阿姆斯特朗送上月球时所用电脑算力的数百万倍

2.2.2.           2020年的互联网数据量几乎是1995年时的1万亿倍

2.3.         受人类大脑内部复杂的神经元网络的启发,深度学习模拟生物神经网络,构建出包括输入层和输出层在内的人工神经网络,当将数据输入该网络的输入层后,在输出层就会显现出相应的处理结果

2.3.1.           中间层

2.3.1.1.            又称隐藏层

2.4.         尽管深度学习的最初灵感来源于人类的大脑,但二者的运作方式截然不同

2.4.1.           深度学习所需要的数据量远比人脑所需要的多得多

2.4.2.           一旦经过大数据训练,它在相同领域的表现将远远超过人类

2.4.2.1.            尤其是在数字的量化学习
2.4.2.1.1.             挑选某人最可能购买的产品
2.4.2.1.2.             从100万张脸中挑选最匹配的一张

2.4.3.           人类在同一时间内只能把注意力放在少数几件事情上面,而深度学习算法却可以同时处理海量信息,并且发现在大量数据背后的模糊特征之间的关联,这些模糊特征不仅复杂而且微妙,人类往往无法理解,甚至可能不会注意到

2.5.         没有这些外在的人类规则,深度学习的效果其实会更好

2.6.         深度学习的训练方法是,针对特定的应用场景,给人工神经网络的输入层“投喂”大量数据样本,同时给输出层“投喂”相应的“正确答案”,通过这样的训练,不断优化人工神经网络的内部参数,使根据输入生成最接近“正确答案”的输出的概率最高

2.6.1.           在训练过程中,可以将深度学习视为解决目标函数最大化问题的一种数学运算

2.6.2.           目标函数是由每次的训练主题决定的

2.7.         人工神经网络的训练是一个数学处理过程

2.7.1.           通过不断调整网络中的数百万个参数(有时甚至是数十亿个参数),来最大限度地提高“只要输入有猫的图片,就输出‘有猫’的判定”的概率,以及“只要输入没有猫的图片,就输出‘无猫’的判定”的概率

2.8.         深度学习几乎在任何领域都能发挥识别、预测、分类、合成的作用

2.9.         在借助大量数据进行训练时,深度学习可以针对每一个用户提供定制化的服务——基于海量数据中较相似用户的数据,对每个用户做出贴切的预测,以达到千人千面的效果

3.       人脑和AI“脑”的差别和擅长

3.1.         深度学习的能力非常强大,然而它并不是“包治百病”的灵丹妙药

3.1.1.           不具备人类在面对决策时独一无二的汲取过去的经验、使用抽象概念和常识的能力

3.2.         与人类相比,深度学习想要充分发挥作用,离不开海量的相关数据、单一领域的应用场景以及明确的目标函数

3.2.1.           这三项缺一不可,如果缺少其中任何一项,深度学习将无用武之地

3.2.2.           如果数据太少,AI算法就没有足够多的样本去洞察数据背后的模糊特征之间的有意义的关联

3.2.3.           如果问题涉及多个领域,AI算法就无法周全考虑不同领域之间的关联,也无法获得足够的数据来覆盖跨领域多因素排列组合的所有可能性

3.2.4.           如果目标函数太过宽泛,AI算法就缺乏明确的方向,以至于很难进一步优化模型的性能

3.3.         图

4.       行业的应用

4.1.         互联网行业的领头企业成为AI技术的第一批受益者也就不足为奇了

4.2.         在互联网之外,深度学习触手可及的下一个行业是金融业

4.2.1.           拥有单一领域(保险业)海量的高质量数据,而且这些数据都与业务指标紧密相连

4.2.2.           通过对海量数据进行学习,实现更好的财务成果(基于用户信用评级降低违约率)、更高效的即时交易(借助AI和应用程序),以及更低的成本(无须人工)

4.3.         AI还有一个非常有趣的优势,就是数据越多越好,数据越多元化越好

4.3.1.           通过不断搜集数据(包括那些让人类专家大跌眼镜的稀奇古怪的数据),AI可以做出更精确的判断,从而创造更多的利润

4.3.2.           所有这些信息都会成为证据,说明很多关于你的情况,包括你身为投保人的相对风险,而这些数据都可以通过你的手机应用程序来获取

4.3.3.           在这些信息中,有的一看就是价值很高的,有的看起来价值一般,但是深度学习的强大之处就在于它可以在所有信息的特征中找到微妙的组合,对组合特征中丰富的有价值的信息做更深层的洞察,而这个过程是人类无法理解、无法做到的

5.       深度学习的问题

5.1.         深度学习会使AI比你更了解你自己

5.1.1.           AI也会掌握你的缺点

5.1.2.           奈飞平台2020年的高分纪录片《智能陷阱》就展现了AI个性化推荐如何让人们在无意识中被操纵,使AI应用程序背后的利益方达成目的

5.1.2.1.            如果人们对AI的个性化推荐上瘾,这类应用程序就可能缩窄人们的视野、扭曲事实的真相、加剧社会的分化,对人类的情绪、心理健康、幸福感等方面造成负面影响

5.1.3.           信息茧房

5.1.3.1.            你在手机上的每次点击都会激活价值数十亿美元的超级计算机,它会根据从20亿用户的行为中学习到和提取到的经验,对准你的大脑,企图左右你的思维

5.1.4.           AI所训练的目标函数通常针对的是单一目标,例如赚钱(或者更多的点击量、广告),因此,AI有可能过度热衷于企业的目标绩效,而不考虑用户的福祉

5.1.4.1.            一种通用的方法是让AI的目标函数变得不再单一
5.1.4.2.            设计目标函数时需要考虑人类的福祉,并让人类更大程度地参与数据标注和目标函数的设计
5.1.4.3.            不仅需要对AI的复杂目标函数展开更加深入的研究,而且需要对“所花费的有意义的时间”“维护社会公平”“幸福”等概念进行量化

5.1.5.           解决方案

5.1.5.1.            一种方法是制定法规,对某些伤害人类福祉的行为给予处罚
5.1.5.2.            另一种方法是对企业承担社会责任的行为进行评价
5.1.5.3.            一种方法是建立第三方监管机构,监督企业对技术是否有不当使用
5.1.5.4.            特别困难但又特别有效的一种方法是,确保AI技术持有者的利益与每个用户的利益达成100%的一致

5.2.         会使不公平和偏见得以延续

5.2.1.           AI完全基于数据优化和结果优化进行决策,理论上应该比大部分人更加不受偏见的影响,但是,其实AI也可能产生偏见

5.2.2.           倘若用于训练AI的数据不够充分、全面,对某些群体的覆盖率不足,那么就会产生偏见

5.2.3.           倘若训练数据全部收集自一个有偏见的环境,那么数据本身就可能带有偏见

5.2.4.           微软的Tay对话机器人和OpenAI的语言模型GPT-3,都生成过歧视少数群体的言论

5.2.5.           AI可以基于面部微表情精准地推断一个人的性取向,这种AI应用就可能导致不公平和偏见

5.2.6.           萨赫杰的“低种姓”并不是直接标注给AI系统的,而是AI系统通过历史数据和个人特征推断出来的

5.2.6.1.            萨赫杰并没有被直接贴上“达利特”的标签,但因为他的数据和特征与“达利特”高度相关

5.2.7.           如果把带有偏见的AI应用于医学诊断或者司法判定,那么其风险将无法想象

5.2.8.           解决方案

5.2.8.1.            使用AI的公司应该披露AI系统被用在哪里以及使用目的
5.2.8.2.            AI工程师应该接受一套职业道德准则的培训
5.2.8.2.1.             AI工程师应该接受一套职业道德准则的培训
5.2.8.3.            工程师使用的AI训练工具应该嵌入严格的测试机制,以对基于样本比例不公平的数据训练出来的计算模型发出警告或彻底禁止生成模型
5.2.8.4.            应该制定AI审计法
5.2.8.4.1.             这与传统的财务审计或税务审计类似,AI公司被举报后,政府需要派遣专家对其进行审计
5.2.8.4.2.             如果一家公司在AI的伦理道德或者公平性方面多次被投诉,它的AI算法就必须接受审计,以检查、确定其是否存在不公平、偏见或隐私保护方面的漏洞

5.3.         不可解释性

5.3.1.           人类总是能解释人类决策背后的原因,因为人类的决策过程本身比较简单,是基于经验积累得出的规则

5.3.2.           经过海量数据训练而得出的数学方程组,要把这个方程组精确地简化成一个人类可以听得懂的“原因”,基本上是不可能的

5.3.3.           无论是出于法律的考量,还是出于用户的期望,许多关键的AI决策都需要给出一个解释

5.3.3.1.            为了解决这一问题,人们目前正在进行许多相关的研究,这些研究试图简化、总结AI复杂的逻辑过程,或者发明具有可解释性框架的AI算法,从而使AI变得更加“透明”

5.4.         任何强大的技术都是一把双刃剑

5.4.1.           电力可以为人类社会的日常设施提供动力,但如果人直接碰触电,就可能丧失性命

5.4.2.           互联网让一切变得更加方便,但也大幅降低了人对事物的专注力

5.4.3.           所有的新技术都有缺点

5.4.3.1.            历史表明,许多技术的早期漏洞都将随着时间的推移而得到纠正或被彻底解决
5.4.3.1.1.             防止人类触电的断路器
5.4.3.1.2.             查杀电脑病毒的杀毒软件
5.4.3.2.            未来通过改进技术和完善政策法规,将会解决深度学习(乃至AI)所带来的大部分问题,比如不公平、偏见、不透明

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/21376.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pointnet学习以及对代码的实现

由于点云不是常规数据格式,通常将此类数据转换为规则的 3D 体素网格或图像集合,然后再用神经网络进行处理。数据表示转换使生成的数据过于庞大。 PointNet是第一个直接处理原始点云的方法。只有全连接层和最大池化层,PointNet网络在推理速度…

代码随想录--哈希表--两数之和

题目 给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。 示例: 给定 nums [2, 7, 11, 15], t…

李廉洋:6.3黄金原油下周一开盘行情价格涨跌趋势分析及最新操作建议多空布局

黄金消息面分析:上周黄金市场的走势受到了PCE通胀数据和美联储政策预期的显着影响。尽管市场对黄金的长期看涨情绪依然存在,但短期内金价的波动性预计将持续。4月份的PCE通胀数据显示价格压力有所降温,这一结果与分析师预期一致,但…

2024年6月2日 (周日) 叶子游戏新闻

中医百科中药: 中医百科中药是一款非常强大的中药知识科普软件,该应用提供500多味中草药的文献资料,强大的搜索功能可根据功效、特点和关键词来快速查找中药,而且每味中药的图片、功效、主治、炮制方法等百科知识,可以很好的帮助你…

Pycharm SSH远程连接时出现报错,测试 SFTP 连接,连接到 ‘connect.westb.seetacloud.com‘ 失败

问题由来 很离谱!今天本来打算租借AutoDL的显卡完成一项深度学习的任务,很离谱的是同步文件夹的时候报了标题说的错。 就很莫名奇妙,一天都在网上找解决办法,结果都不对头。 其他报错 最后摸索着,在使用pycharm远程登…

SpringBoot 定时任务+Quartz

1、分部解释2、整体代码 前言: 1、定时任务技术: JDK 的 Timer, 定义多个定时任务,其中某个任务出现异常,当时整个定时任务终止。Spring Task , 不支持 持久化与分布式部署,所有任务是单线程执行…

Prism 入门01,基础

Prism 框架是支持多平台的一种MVVM框架(Model-View-ViewModel) 除了具备一些基础的属性通知绑定,命令操作,消息聚合器等功能外。还具备一些强大的功能:例如,区域,导航,会话服务,模块注入等特性。 一.如何在WPF 项目中使用Prism 框架 1.打开Visual Studio 2022,选择创…

【排序】选择排序(含优化版)

本章我们继续讲排序算法,这里我们将学习选择排序,也是一个很普遍很常见的排序算法,逻辑和代码都比较简单,比较容易掌握,我们直接走起 选择排序 基本思想:选择排序(SelectSort)&…

Layui2.5.6树形表格TreeTable使用

1、问题概述? Layui2.5.6的树形表格-TreeTable终于用明白了,步骤详细,提供源码下载。 如果你使用的是Layui2.8+版本,那么点个赞,赶紧去官网看吧,官网更行了。 更新地址:树表组件 treeTable - Layui 文档 最近在项目中需要使用到树形表格,用来显示菜单的层级关系,当…

辩证 逻辑学 | 洞察 事物矛盾及变化规律 在形式逻辑基础上 学会辩证思维(40节课)

课程下载:辩证逻辑学洞察事物矛盾及变化规律在形式逻辑基础上学会辩证思维(40节课)-课程网盘链接提取码下载.txt资源-CSDN文库 更多资源下载:关注我。 在形式逻辑的基础上,学会 辩证思维 敏锐 洞察事物发展变化的规…

Linux命令篇(一):文件管理部分

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 文章目录 1、cat命令常用参…

童趣盎然,米香四溢 —— 蒙自源六一儿童节特别献礼

充满欢声笑语的六一儿童节马上就要来了,在这个充满童真和喜悦的时刻,蒙自源米线品牌以一颗童心,为所有大朋友和小朋友准备了一份特别的礼物。 从5月25日开始,蒙自源诚挚邀请您和孩子们一同前往蒙自源旗下各大门店,品尝…

【MySQL数据库】MySQL 高可用搭建方案——MHA实战

MHA(Master High Availability) MHA实战 MHA(Master High Availability) 一、MHA简介二、MHA搭建准备要求:mha集群搭建,4台服务器,1主2从,1台mha2.1实验思路2.2实验准备 三、搭建MyS…

HTML5常用标签表格

04-08、表格标签table 概述 表格:是一种行和列组合而成的单元格。一般应用于后台网页设计管理数据使用。 表格的架构部分: tabletable head 表格头 theadtable body - 表格体 tbodytable foot -表格的页脚 tfoot 表格的基本组成部分: t…

opencv-python(三)

马赛克 face img[162:428,297:527] # 人脸坐标区域face face[::10,::10] # 每10个中取出一个像素,马赛克face np.repeat(face, 10, axis0) # 行方向重复10次face np.repeat(face, 10, axis1) # 列方向重复10次img[162:428,297:527] face[:266,:230] # 填充&a…

计算机科学与技术和软件工程专业有什么区别?应该怎么选?

计算机科学与技术和软件工程都是就业前景较好的计算机类专业,二者密切相关但侧重点不同,同学们应该如何选择呢? 一、学习内容 1.学科定位 ● 计算机科学与技术 侧重于计算机科学的理论研究和基础技术,包括算法、数据结构、人工…

lnmp平台部署web应用,安装Discuz社区平台详细文章——更新中

Nginx网站service 详细相关介绍-特点-http状态码-配置文件、将nginx添加永久环境变量 访问网站404是什么?_nginx 稳定版-CSDN博客文章浏览阅读1.2k次,点赞33次,收藏24次。开源Web服务器软件。_nginx 稳定版https://blog.csdn.net/2301_771619…

数据结构--数组(详细分析)

目录 🍉引言 🍉数组 🍈数组的特性 🍈数组的优缺点 🍍优点: 🍍缺点: 🍈数组的声明与初始化 🍈数组的常见操作 🍍 插入操作 🍍…

Touch Camera PRO 2024 Easy Mobile Desktop Camera Controller(触控相机专业版)

一个真正易于使用的移动+台式摄像机控制器,具有视角切换功能! Touch Camera PRO 是一款非常易于使用的移动+桌面相机控制器,具有透视切换功能!它在 Home Designer、Runtime Level Editor 和 Floor Map Designer 等其他插件中使用! 在桌面和移动设备上工作! 一个干…

WIireShark使用教程

文章目录 目录 文章目录 一.入门抓包示例 一.入门抓包示例 先介绍一下如何使用wireshark抓取相应网卡的流量,让读者可以先上手操作感受一下抓包的具体过程。 1.打开wireshark的主界面如下 2.选择需要抓包的网卡,鼠标左键双击,即可抓取该网…