读人工不智能:计算机如何误解世界笔记04_数据新闻学

1. 计算化和数据化的变革

1.1. 每一个领域都在进行计算化和数据化的变革

1.1.1. 出现了计算社会科学、计算生物学、计算化学或其他数字人文学科

1.1.2. 生活已走向计算化,人们却一点也没有变

1.2. 在如今的计算化和数据化世界中,调查性新闻的实践必须依靠高科技

1.3. 视觉艺术家使用诸如Processing之类的编程语言来创建多媒体艺术作品

1.4. 3D打印技术让雕塑家能够更深入地探索艺术的物理可行性

2. 数据新闻学

2.1. 数据记者

2.1.1. 拓宽了新闻学中应用技术的边界

2.2. 数据记者首先是记者

2.2.1. 使用数据作为原始资料,使用各种数字工具和平台来讲述新闻

2.2.2. 数据记者倾向于依赖既定的学术研究方法

2.3. 好记者

2.3.1. 首先要知道何时求助于相关学科的专家

2.3.2. 其次要认清专家和骗子的区别

2.4. 美国政府的一举一动在默认情况下都是公开的

2.4.1. 公开了政府数据,不代表消灭了腐败

2.5. 佛罗里达州还有“阳光法律”,保证公众可以访问这些资料,也保证了相关磁带、照片、影片和录音都是公开的

2.5.1. 大限度地公开档案法条意味着人们可以轻易获取政府的官方数据,这也就意味着大量数据新闻都与佛罗里达州有关

2.6. 有些数据记者会从官方渠道获取数据,并对其进行分析,以找到看点

2.6.1. 在佐治亚州,每三名因与病人发生不当性行为而受处罚的医生中,就有两名被允许再次执业

2.6.1.1. 分析了1999年到2015年超过10万份针对医生的医委会调查令
2.6.1.2. 全国各地都有医生因虐待患者而获罪,却又获准恢复行医资格

2.6.2. 数据记者曾坐在高速公路边,记录警车经过的时间

2.6.2.1. 从收费站的警察应答器中获取数据,发现当地警察普遍以危及公民安全的高速行驶
2.6.2.2. 调查结束后,警察超速驾驶的比例下降了84%

2.6.3. 查看了50个州的警察对公民的截停记录数据

2.6.3.1. 在每个州,有色人种被警察截停的情况都要比白种人多得多

2.7. 学术研究是数据新闻的重要补充

2.8. 数据新闻学还包括对算法的问责报道

2.8.1. 在民主政体中,新闻自由的职能一直是问责决策者

2.8.2. 算法问责报道也承担着同样的职能,并将其应用到计算世界

2.8.3. 逆向工程算法是算法问责决策者的一部分

2.8.3.1. 论文《算法的责任——计算结构下的新闻调查》(“Algorithmic Accountability:Journalistic Investigation of Computational Power Structures”)
2.8.3.2. 2012年,C. W. 安德森发表了研究论文《关于计算与算法新闻的社会学》(“Towards a Sociology of Computational and Algorithmic Journalism”)

2.9. 算法,或计算过程,正被越来越多地用于替代我们做决策

2.9.1. 算法决定了我们在网上购物时看到的订书机的标价,也决定了我们购买医疗保险的价格

2.9.2. 当你通过线上招聘网站提交求职申请或投递简历时,就会有一个算法决定你是否符合标准,符合则交由人类做下一步评估,否则直接回绝你的申请

3. 数据驱动的调查报道

3.1. 在新闻报道中使用数据不是什么新鲜事,这件事要比大多数人想象的更早

3.2. 最早由数据驱动的调查报道出现在1967年

3.2.1. 菲利普·迈耶

3.2.2. 《底特律自由报》

3.2.3. 分析了有关底特律种族暴动的数据

3.2.3.1. 暴动的参与者来自社会各阶层

3.2.4. 获得了普利策新闻奖

3.2.5. 精确性报道

3.3. “精确性报道”也就演化成了“计算机辅助报道”

3.4. 计算机辅助报道又演化成如今的“数据新闻”

3.4.1. 视觉新闻、计算新闻、绘图、数据分析、机器人构建和算法问责报告

3.4.2. 这些故事有时是爆炸性新闻,有时是娱乐性新闻,有时是调查性新闻

3.4.3. 这些新闻的信息量通常都很大

3.5. 《华尔街日报》对价格歧视现象的调查

3.5.1. 诸如史泰博和家得宝之类的大型连锁超市在他们的网站上,会根据邮政编码判断访客可能所在的地区,并且对不同地区的访客收取不同的价格

3.5.2. 邮政编码所在地区较富裕的顾客比邮政编码所在地区较贫穷的顾客收费低

3.6. 影响力大的调查数据新闻报道的制作成本高达数十万美元

3.7. 如今做新闻还得学会阅读数据,使用工具来分析数据,并且找出其中有意思的部分

3.8. 不偏不倚地看待数据分析结果,并且按最合适的方式整合数据,把握国内现状,从而真正去帮助人们

4. 机器偏见

4.1. ProPublica的记者发现,司法量刑使用的一种算法对非裔美国人有偏见

4.2. 计算机中一个名为“替代性制裁惩教罪犯管理”(Correctional Offender Management Profiling for AlternativeSanctions,简称COMPAS)的算法,会计算出一项分数,“预测”出该疑犯在未来犯罪的可能性

4.2.1. 目的是让法官能够在量刑时做出更为“客观”且由数据驱动的决定

4.2.2. 其结果是非裔美国人获得的刑期比白种人更长

4.2.3. 技术沙文主义蒙蔽了COMPAS的设计者,他们意识不到他们的算法可能会对人们造成怎样的伤害

4.3. 计算机在发展,而人类的本性却没有进化

4.3.1. 人只有被监督,才能真正诚实

4.4. 如果你相信计算机做的决定比人类做的决定更高明,那么就代表你全然信赖那些输入系统的数据的有效性

4.4.1. 无用数据入、无用数据出

4.4.2. 如果你输入的是垃圾,那么输出的也一定是垃圾

4.5. 我们要对这些算法以及算法的制作者存疑,看算法是在让世界变得更美好还是更糟糕

4.6. 你可以质疑技术上的虚假说辞,发现当今计算系统中的不公与不平等

4.7. 质疑可能的错漏之处,能让我们远离盲目的技术乐观主义,让我们的看法变得更加合理和中立

4.8. 我们的生活才能因技术而变得更好,而不至于受到技术的牵制,或需要对技术做出让步

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/704868.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jdk21本地执行flink出现不兼容问题

环境说明:换电脑尝尝鲜,jdk,flink都是最新的,千辛万苦把之前的项目编译通过,跑一下之前的flink项目发现启动失败,啥都不说了上异常 Exception in thread "main" java.lang.IllegalAccessError: …

Scrapy实战

代码: Spider import scrapy from urllib.parse import urljoin from scrapy import Requestclass JiaSpider(scrapy.Spider):name "jia"allowed_domains ["desk.zol.com.cn"]start_urls ["https://desk.zol.com.cn/dongman/"]d…

jeesite用字典项配置二级下拉选

1、配置字典项 2、html代码&#xff1a;修改下拉选项框 <div class"col-xs-6"><div class"form-group"><label class"control-label col-sm-4" title""><span class"required">*</span> ${…

ZYNQ:串口-CAN协议转换

前言 目前已经实现zynq的PS-CAN和PL-CAN功能。串口-CAN协议转换是实现以太网-CAN功能的过渡&#xff0c;通过这个流程能够减少后期以太网工程出现问题的频率。阶段性功能目标如下&#xff1a; 实现数据在CAN调试助手和串口调试助手之间的来回转换&#xff0c;从而了解中断机制…

华为云软件开发生产线CodeArts前端DevOps实践

原文链接&#xff1a;CodeArts前端DevOps实践_软件开发生产线 CodeArts_理论实践_DevOps概览 本文主要以CodeArts产品自身为背景&#xff0c;简要介绍一些在前端性能优化方面的优秀实践方法和常见问题。 在开始本文的内容之前&#xff0c;先简单介绍一下华为云CodeArts。Code…

html中的meta 元信息

html中的meta 元信息 1. 配置字符编码 <meta charset"utf-8">2. 针对 IE 浏览器的兼容性配置。 <meta http-equiv"X-UA-Compatible" content"IEedge">3. 针对移动端的配置 <meta name"viewport" content"widt…

MySQL进阶篇2-索引的创建和使用以及SQL的性能优化

索引 mkdir mysql tar -xvf mysqlxxxxx.tar -c myql cd mysql rpm -ivh .....rpm yum install openssl-devel ​ systemctl start mysqld ​ gerp temporary password /var/log/mysqld.log ​ mysql -u root -p mysql> show variables like validate_password.% set glob…

【Flink精讲】Flink状态及Checkpoint调优

RocksDB大状态调优 RocksDB 是基于 LSM Tree 实现的&#xff08;类似 HBase&#xff09; &#xff0c;写数据都是先缓存到内存中&#xff0c; 所以 RocksDB 的写请求效率比较高。 RocksDB 使用内存结合磁盘的方式来存储数据&#xff0c;每 次获取数据时&#xff0c;先从内存中 …

睿尔曼超轻量仿人机械臂—远程文件传输工具使用说明

一、介绍 由于很多开发人员是在Linux下进行开发&#xff0c;但文件资料大多是保存在Windows下&#xff0c;进行文件传输很不方便&#xff0c;所以可通过远程文件传输的方式进行跨系统传输。此类方法有很多&#xff0c;这里讲述的是使用WinSCP工具进行文件远程传输。 WinSCP 是…

Go的CSP并发模型实现M, P, G简介

GMP概念简介 G: goroutine&#xff08;协程&#xff0c;也叫用户态线程&#xff09; M: 工作线程(内核态线程) P: 上下文(也可以认为是cpu&#xff0c;逻辑cpu数量&#xff0c;可以在程序启动的时候设置这个数量&#xff0c;gomaxprocs函数设置) GMP 模型 在 Go 中&#xff…

iconfont的组件化使用方法(SVG)

目录 一、需求描述二、操作步骤1.在iconfont中选择项目需要使用的图标2.在项目中创建iconfont.js3.创建svgIcon组件 一、需求描述 将iconfont图标库选择的图标以SVG的形式引入项目并通过组件化的形式在项目中引用可控制图标的大小和颜色 二、操作步骤 1.在iconfont中选择项目…

Mysql常见函数和用法(重点)

where子句中经常使用的运算符 -- 查询总分大于200分的所有同学 select * from student2 where (chineseenglishmath)>200; -- 查询math大于60 并且(and)id大于4的学生成绩 select * from student2 where math>60 and id>4; -- 查询英语成绩大于语文成绩的同学 select …

跟着cherno手搓游戏引擎【26】Profile和Profile网页可视化

封装Profile&#xff1a; Sandbox2D.h:ProfileResult结构体和ProfileResult容器&#xff0c;存储相应的信息 #pragma once #include "YOTO.h" class Sandbox2D :public YOTO::Layer {public:Sandbox2D();virtual ~Sandbox2D() default;virtual void OnAttach()ove…

【Python 数据分析 实战案例】通过用户和订单的数据分析,制定营销策略

在互联网行业中&#xff0c;电子商务领域绝对是数据分析用途最多的地方&#xff0c;各大电商平台都依赖数据分析帮助其挖掘用户订单增长机会。比如某宝的随手买一件&#xff0c;核心思路也就是根据用户的日常浏览内容及停留时间&#xff0c;以及订单的关联度来进行推荐的。 本…

AI与大数据:智慧城市安全的护航者与变革引擎

一、引言 在数字化浪潮的席卷下&#xff0c;智慧城市正成为现代城市发展的新方向。作为城市的神经系统&#xff0c;AI与大数据的融合与应用为城市的安全与应急响应带来了革命性的变革。它们如同城市的“智慧之眼”和“聪明之脑”&#xff0c;不仅为城市管理者提供了强大的决策…

VScode连接远端服务器一直输入密码解决方法

文章目录 1 关闭远程连接2打开命令面板3 输入remote-ssh: kill vs code server on host… 1 关闭远程连接 2打开命令面板 3 输入remote-ssh: kill vs code server on host… remote-ssh: kill vs code server on host… 然后一路回车(选中出问题的主机)&#xff0c;输一遍密码…

tmux的使用方法

1. tmux的定义 我&#xff1a;什么是tmux&#xff1f; GPT&#xff1a;tmux&#xff08;terminal multiplexer&#xff09;是一个强大的终端复用器&#xff0c;它允许用户在一个终端窗口中创建、访问和控制多个会话。使用tmux&#xff0c;你可以在一个窗口中打开多个终端会话&…

SpringMVC(1)

目录 SpringMVC简介入门案例启动服务器初始化过程单次请求过程bean加载控制 PostMan请求与响应设置请求映射路径请求参数五种类型参数传递JSON数据日期类型参数传递响应 RestRest 简介RESTful快速开发 SpringMVC是隶属于Spring框架的一部分&#xff0c;主要是用来进行Web开发&a…

快速搭建宠物医院服务小程序的步骤,无需编程经验

如果你是一家宠物医院或者宠物服务机构&#xff0c;想要拥有一款方便用户预约、查询信息的小程序&#xff0c;那么乔拓云网提供的轻应用小程序是你的不二选择。下面将为你详细介绍如何轻松打造宠物医院服务小程序。 1. 进入乔拓云网后台&#xff0c;点击【轻应用小程序】中的【…

FDTD算法总结

计算电磁学(Computational Electromagnetics, CEM)是通过数值计算来研究电磁场的交叉学科。 数值求解电磁学问题的方法可以分成频域(Frequency Doamin, FD)、时域(Time Domain, TD)等两类。 频域法基于时谐微分&#xff0c;通过对多个采样值的傅里叶逆变换得到所需的脉冲响应…