读人工不智能:计算机如何误解世界笔记04_数据新闻学

1. 计算化和数据化的变革

1.1. 每一个领域都在进行计算化和数据化的变革

1.1.1. 出现了计算社会科学、计算生物学、计算化学或其他数字人文学科

1.1.2. 生活已走向计算化,人们却一点也没有变

1.2. 在如今的计算化和数据化世界中,调查性新闻的实践必须依靠高科技

1.3. 视觉艺术家使用诸如Processing之类的编程语言来创建多媒体艺术作品

1.4. 3D打印技术让雕塑家能够更深入地探索艺术的物理可行性

2. 数据新闻学

2.1. 数据记者

2.1.1. 拓宽了新闻学中应用技术的边界

2.2. 数据记者首先是记者

2.2.1. 使用数据作为原始资料,使用各种数字工具和平台来讲述新闻

2.2.2. 数据记者倾向于依赖既定的学术研究方法

2.3. 好记者

2.3.1. 首先要知道何时求助于相关学科的专家

2.3.2. 其次要认清专家和骗子的区别

2.4. 美国政府的一举一动在默认情况下都是公开的

2.4.1. 公开了政府数据,不代表消灭了腐败

2.5. 佛罗里达州还有“阳光法律”,保证公众可以访问这些资料,也保证了相关磁带、照片、影片和录音都是公开的

2.5.1. 大限度地公开档案法条意味着人们可以轻易获取政府的官方数据,这也就意味着大量数据新闻都与佛罗里达州有关

2.6. 有些数据记者会从官方渠道获取数据,并对其进行分析,以找到看点

2.6.1. 在佐治亚州,每三名因与病人发生不当性行为而受处罚的医生中,就有两名被允许再次执业

2.6.1.1. 分析了1999年到2015年超过10万份针对医生的医委会调查令
2.6.1.2. 全国各地都有医生因虐待患者而获罪,却又获准恢复行医资格

2.6.2. 数据记者曾坐在高速公路边,记录警车经过的时间

2.6.2.1. 从收费站的警察应答器中获取数据,发现当地警察普遍以危及公民安全的高速行驶
2.6.2.2. 调查结束后,警察超速驾驶的比例下降了84%

2.6.3. 查看了50个州的警察对公民的截停记录数据

2.6.3.1. 在每个州,有色人种被警察截停的情况都要比白种人多得多

2.7. 学术研究是数据新闻的重要补充

2.8. 数据新闻学还包括对算法的问责报道

2.8.1. 在民主政体中,新闻自由的职能一直是问责决策者

2.8.2. 算法问责报道也承担着同样的职能,并将其应用到计算世界

2.8.3. 逆向工程算法是算法问责决策者的一部分

2.8.3.1. 论文《算法的责任——计算结构下的新闻调查》(“Algorithmic Accountability:Journalistic Investigation of Computational Power Structures”)
2.8.3.2. 2012年,C. W. 安德森发表了研究论文《关于计算与算法新闻的社会学》(“Towards a Sociology of Computational and Algorithmic Journalism”)

2.9. 算法,或计算过程,正被越来越多地用于替代我们做决策

2.9.1. 算法决定了我们在网上购物时看到的订书机的标价,也决定了我们购买医疗保险的价格

2.9.2. 当你通过线上招聘网站提交求职申请或投递简历时,就会有一个算法决定你是否符合标准,符合则交由人类做下一步评估,否则直接回绝你的申请

3. 数据驱动的调查报道

3.1. 在新闻报道中使用数据不是什么新鲜事,这件事要比大多数人想象的更早

3.2. 最早由数据驱动的调查报道出现在1967年

3.2.1. 菲利普·迈耶

3.2.2. 《底特律自由报》

3.2.3. 分析了有关底特律种族暴动的数据

3.2.3.1. 暴动的参与者来自社会各阶层

3.2.4. 获得了普利策新闻奖

3.2.5. 精确性报道

3.3. “精确性报道”也就演化成了“计算机辅助报道”

3.4. 计算机辅助报道又演化成如今的“数据新闻”

3.4.1. 视觉新闻、计算新闻、绘图、数据分析、机器人构建和算法问责报告

3.4.2. 这些故事有时是爆炸性新闻,有时是娱乐性新闻,有时是调查性新闻

3.4.3. 这些新闻的信息量通常都很大

3.5. 《华尔街日报》对价格歧视现象的调查

3.5.1. 诸如史泰博和家得宝之类的大型连锁超市在他们的网站上,会根据邮政编码判断访客可能所在的地区,并且对不同地区的访客收取不同的价格

3.5.2. 邮政编码所在地区较富裕的顾客比邮政编码所在地区较贫穷的顾客收费低

3.6. 影响力大的调查数据新闻报道的制作成本高达数十万美元

3.7. 如今做新闻还得学会阅读数据,使用工具来分析数据,并且找出其中有意思的部分

3.8. 不偏不倚地看待数据分析结果,并且按最合适的方式整合数据,把握国内现状,从而真正去帮助人们

4. 机器偏见

4.1. ProPublica的记者发现,司法量刑使用的一种算法对非裔美国人有偏见

4.2. 计算机中一个名为“替代性制裁惩教罪犯管理”(Correctional Offender Management Profiling for AlternativeSanctions,简称COMPAS)的算法,会计算出一项分数,“预测”出该疑犯在未来犯罪的可能性

4.2.1. 目的是让法官能够在量刑时做出更为“客观”且由数据驱动的决定

4.2.2. 其结果是非裔美国人获得的刑期比白种人更长

4.2.3. 技术沙文主义蒙蔽了COMPAS的设计者,他们意识不到他们的算法可能会对人们造成怎样的伤害

4.3. 计算机在发展,而人类的本性却没有进化

4.3.1. 人只有被监督,才能真正诚实

4.4. 如果你相信计算机做的决定比人类做的决定更高明,那么就代表你全然信赖那些输入系统的数据的有效性

4.4.1. 无用数据入、无用数据出

4.4.2. 如果你输入的是垃圾,那么输出的也一定是垃圾

4.5. 我们要对这些算法以及算法的制作者存疑,看算法是在让世界变得更美好还是更糟糕

4.6. 你可以质疑技术上的虚假说辞,发现当今计算系统中的不公与不平等

4.7. 质疑可能的错漏之处,能让我们远离盲目的技术乐观主义,让我们的看法变得更加合理和中立

4.8. 我们的生活才能因技术而变得更好,而不至于受到技术的牵制,或需要对技术做出让步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/704868.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jdk21本地执行flink出现不兼容问题

环境说明:换电脑尝尝鲜,jdk,flink都是最新的,千辛万苦把之前的项目编译通过,跑一下之前的flink项目发现启动失败,啥都不说了上异常 Exception in thread "main" java.lang.IllegalAccessError: …

Scrapy实战

代码: Spider import scrapy from urllib.parse import urljoin from scrapy import Requestclass JiaSpider(scrapy.Spider):name "jia"allowed_domains ["desk.zol.com.cn"]start_urls ["https://desk.zol.com.cn/dongman/"]d…

left join+group by语句性能优化

一、背景 需求:求【昨日触达】、【本周拜访】、【本月活动数】。 背景:三个维度的数据都按日统计在一张表里。 首先想到的就是left join group by。 1.1 优化前语句 selectuser_id,user_name,org_id,org_name,sum(reach_num) dayReachNum,sum(visit_n…

redis未授权与权限获取

Redis默认情况下,会绑定在0.0.0.0:6379,这样将会将Redis服务暴露到公网上,如果在 没有开启认证的情况下,可以导致任意用户在可以访问目标服务器的情况下未授权访问Redis 以及读取Redis的数据。攻击者在未授权访问Redis的情况下可…

jeesite用字典项配置二级下拉选

1、配置字典项 2、html代码&#xff1a;修改下拉选项框 <div class"col-xs-6"><div class"form-group"><label class"control-label col-sm-4" title""><span class"required">*</span> ${…

ZYNQ:串口-CAN协议转换

前言 目前已经实现zynq的PS-CAN和PL-CAN功能。串口-CAN协议转换是实现以太网-CAN功能的过渡&#xff0c;通过这个流程能够减少后期以太网工程出现问题的频率。阶段性功能目标如下&#xff1a; 实现数据在CAN调试助手和串口调试助手之间的来回转换&#xff0c;从而了解中断机制…

华为云软件开发生产线CodeArts前端DevOps实践

原文链接&#xff1a;CodeArts前端DevOps实践_软件开发生产线 CodeArts_理论实践_DevOps概览 本文主要以CodeArts产品自身为背景&#xff0c;简要介绍一些在前端性能优化方面的优秀实践方法和常见问题。 在开始本文的内容之前&#xff0c;先简单介绍一下华为云CodeArts。Code…

html中的meta 元信息

html中的meta 元信息 1. 配置字符编码 <meta charset"utf-8">2. 针对 IE 浏览器的兼容性配置。 <meta http-equiv"X-UA-Compatible" content"IEedge">3. 针对移动端的配置 <meta name"viewport" content"widt…

MySQL进阶篇2-索引的创建和使用以及SQL的性能优化

索引 mkdir mysql tar -xvf mysqlxxxxx.tar -c myql cd mysql rpm -ivh .....rpm yum install openssl-devel ​ systemctl start mysqld ​ gerp temporary password /var/log/mysqld.log ​ mysql -u root -p mysql> show variables like validate_password.% set glob…

【Flink精讲】Flink状态及Checkpoint调优

RocksDB大状态调优 RocksDB 是基于 LSM Tree 实现的&#xff08;类似 HBase&#xff09; &#xff0c;写数据都是先缓存到内存中&#xff0c; 所以 RocksDB 的写请求效率比较高。 RocksDB 使用内存结合磁盘的方式来存储数据&#xff0c;每 次获取数据时&#xff0c;先从内存中 …

睿尔曼超轻量仿人机械臂—远程文件传输工具使用说明

一、介绍 由于很多开发人员是在Linux下进行开发&#xff0c;但文件资料大多是保存在Windows下&#xff0c;进行文件传输很不方便&#xff0c;所以可通过远程文件传输的方式进行跨系统传输。此类方法有很多&#xff0c;这里讲述的是使用WinSCP工具进行文件远程传输。 WinSCP 是…

Go的CSP并发模型实现M, P, G简介

GMP概念简介 G: goroutine&#xff08;协程&#xff0c;也叫用户态线程&#xff09; M: 工作线程(内核态线程) P: 上下文(也可以认为是cpu&#xff0c;逻辑cpu数量&#xff0c;可以在程序启动的时候设置这个数量&#xff0c;gomaxprocs函数设置) GMP 模型 在 Go 中&#xff…

1504. 统计全 1 子矩形

Problem: 1504. 统计全 1 子矩形 文章目录 思路解题方法复杂度Code 思路 这个问题可以通过压缩数组和单调栈的方法来解决。我们首先遍历矩阵&#xff0c;对于每一行&#xff0c;我们计算出每一列的高度&#xff08;连续的1的数量&#xff09;。然后&#xff0c;我们使用单调栈来…

mysql锁-这条sql加了哪些锁

文章目录 1、 InnoDB的三种行锁2、常见的加锁语句2.1、常见隐式加锁语句2.1、常见显示加锁语句 3、加锁的2条规则4、案例4.1、唯一索引等值查询4.2、唯一索引范围查询4.3、非唯一索引等值查询4.4、非唯一索引范围查询 InnoDB 存储引擎中的行锁的加锁规则。 1、 InnoDB的三种行锁…

04|事务性能优化

4.1大事务的影响 ● 并发情况下&#xff0c;数据库连接池容易被撑爆 ● 锁定太多的数据&#xff0c;造成大量的阻塞和锁超时 ● 执行时间长&#xff0c;容易造成主从延迟 ● 回滚所需要的时间比较长 ● undo log膨胀 ● 容易导致死锁 4.2事务优化 ● 将查询等数据准备操作放…

二. 系统性能评价(2分)

🌟二. 系统性能评价(2分) 性能调整中的性能优化 和 性能评估方法 考试重点 文章目录 🌟二. 系统性能评价(2分)==性能调整中的性能优化 和 性能评估方法 考试重点==@[toc]2.1 性能评价指标 [包含计算]2.2 系统性能调整 [设计计算]2.3 性能优化2.4 性能评估方法2.1 性能评价…

嵌入式驱动学习第一周——vim的使用

前言 本篇博客学习使用vim&#xff0c;vim作为linux下的编辑器&#xff0c;学linux肯定是绕不开vim的&#xff0c;因为不确定对方环境中是否安装了编译器&#xff0c;但一定会有vim。 对于基本的使用只需要会打开文件&#xff0c;保存文件&#xff0c;编辑文件即可。 嵌入式驱动…

iconfont的组件化使用方法(SVG)

目录 一、需求描述二、操作步骤1.在iconfont中选择项目需要使用的图标2.在项目中创建iconfont.js3.创建svgIcon组件 一、需求描述 将iconfont图标库选择的图标以SVG的形式引入项目并通过组件化的形式在项目中引用可控制图标的大小和颜色 二、操作步骤 1.在iconfont中选择项目…

yaml文件详解

Kubernetes 支持 YAML 和 JSON 格式管理资源对象 JSON 格式&#xff1a;主要用于 api 接口之间消息的传递 YAML 格式&#xff1a;用于配置和管理&#xff0c;YAML 是一种简洁的非标记性语言&#xff0c;内容格式人性化&#xff0c;较易读 YAML 语法格式&#xff1a; ●大小写敏…

Mysql常见函数和用法(重点)

where子句中经常使用的运算符 -- 查询总分大于200分的所有同学 select * from student2 where (chineseenglishmath)>200; -- 查询math大于60 并且(and)id大于4的学生成绩 select * from student2 where math>60 and id>4; -- 查询英语成绩大于语文成绩的同学 select …