人工智能第六课:如何做研究

这是我学习 Data Science Research Methods  这门课程的笔记。这门课程的讲师是一名教授和数据科学家,可能因为他既有理论背景,又有实践经验,所以整个课程听下来还比较舒服,学到了一些不错的理论知识。


640?wx_fmt=png


这门课比较系统地介绍了什么是研究(Research),有哪几种类型的研究,它跟一般的数据科学有什么区别,以及如何去做研究。


640?wx_fmt=png

研究分为基础性研究和应用性研究。


研究和分析(数据科学)都是我们解决问题的一种手段,而且比较容易混淆。简单地说,他们有如下的根本区别


  1. 分析是已经有数据,而且往往问题已经提出来,你要做的是在数据中找到一些规律,来回答这个问题。

  2. 研究,从某种程度上包括了分析这个环节。但是,它是要求研究者从头到尾掌握情况,你遇到了一个现象,然后你要定义问题(这是最核心的不同),然后根据问题的需求去收集数据,然后分析等等。


严格意义上来说,做研究会有一个可以遵循的流程如下


640?wx_fmt=png


  1. 设定一个问题

  2. 形成一个理论

  3. 提出假设

  4. 设计实验和测试(包括收集调查表)

  5. 形成结论,如果必要的情况下,重复1到4

  6. 最终结论


在设定问题这个环节,其实很不容易,而且这很可能是区别好的研究人员和一般的研究人员的关键能力,从人类行为和心理分析角度来看,有如下的参考准则


  1. 问题要尽量少(1个,或者最多2个)

  2. 问题要具体,而不是抽象的

  3. 探寻问题背后的问题,即你到底为什么会有这个问题


640?wx_fmt=png


并非要取得博士学位才能做研究,实际上每个人都可以是一个研究者。例如课程中讲了一个案例:某一天你站在自家的楼下,发现天花板上面漏水。你要解决这个问题。你会怎么定义问题呢?


一旦定义了问题,你会形成一个自己的理论(通常是对问题的详细描述),然后你需要开始提出假设(有可能会有多个),接下来就是你怎么验证和测试你的假设了。这里面有一个很有意思的环节,就是我们通常会依赖于向潜在的客户或用户做调查表来得到一些数据,此时要特别注意学习受访者的心理规律,以便你能得到真正有用的数据。


  1. 尽量避免问WHY(为什么),因为人们通常并不知道,你如果非要问,那么他们就可能胡乱回答一下(真有意思的观察)

  2. 避免问过于复杂的问题。这个其实是第一个原则的延申。

  3. 避免隐含或明确的倾向。例如你拿了一个新的logo,问别人新的logo是不是比旧的好。

  4. 如果一个人感觉自己在被监控,他的行为是不一样。例如你拿着糖果给五个小朋友做调查,并说首先回答完成的前两位可以获得糖果等之类。

  5. 尽量让受访者少知道背景,让他们尽量“幼稚”,避免偏见

  6. 尽量扩大样本,样本越大,可信度越高。


640?wx_fmt=png


课程中的范例:某个公司开发了一个绿色产品,在前期小范围调研的时候反馈很好,因为大家都觉得绿色的产品对环境有保护,理应得到更多消费者的青睐。但实际上推向市场后,反应却平平。研究人员需要解决这个问题。他该怎么提出问题呢?怎么去假设和调查呢?



未完待续,敬请关注。这门课程还有很多技术性的内容,例如如何抽样等。后面消化消化一下给大家再分享。




请通过 https://aka.ms/learningAI 或者扫描下面的二维码关注本系列文章《人工智能学习笔记》


640?wx_fmt=png


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/317782.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[2020-11-30 contest]数列(矩阵加速),秘密通道(dijkstra最短路)小X游世界树(换根dp),划分(数学)

文章目录数列solutioncode秘密通道solutioncode小X游世界树solutioncode划分solutioncode数列 a[1]a[2]a[3]1 a[x]a[x-3]a[x-1] (x>3) 求 a 数列的第 n 项对 1000000007(10^97)取余的值。 输入格式 第一行一个整数 T,表示询问个数。 以下…

Docker最全教程——数据库容器化之持久保存数据(十二)

上一节我们讲述了SQL Server容器化实践(注意,SQL Server现在也支持跨平台),本节将讲述如何持久保存数据,并且接下来将逐步讲解其他数据库(MySql、Redis、Mongodb等等)的容器化实践,中…

【李超树】李超线段树维护凸包(凸壳) (例题:blue mary开公司+线段游戏+ZZH的旅行)

文章目录前言李超树引入(斜率优化)什么是李超树?李超树活着能干点什么?算法思想(使用手册?)插入查询模板判断是否覆盖(优不优)插入查询例题板题:BlueMary开公司分析code线段游戏分析code拓展——(动态开点李超树维护凸包)ZZH的旅行…

老牌开源Office操作组件NPOI现已支持.NET Core

昨天在微信群里听到老牌Excel开发利器NPOI的作者瞿总说4.6.1版本的NPOI已经支持.NET Standard 2.0了,这也就意味着你可以在.NET Core中使用NPOI了。作者:依乐祝原文地址 :https://www.cnblogs.com/yilezhu/p/10269281.html写在前面曾经的.NET…

.NET西安社区 [拥抱开源,又见 .NET] 第二次活动简报

「拥抱开源, 又见 .NET」随着 .NET Core的发布和开源,.NET又重新回到人们的视野。 .NET Core的下个3.0即将release,加入非常多的新功能,越来越拥抱变化,DevOps和Microservice的最佳实践已经在 .NET Core落地,比如 Ocel…

[dsu on tree]树上启发式合并总结(算法思想及模板附例题练习)

文章目录前言树上启发式合并引入算法思想时间复杂度模板练习例题:CF600E Lomsat gelralsolutioncodeCF208E Blood CousinssolutioncodeCF570D Tree RequestssolutioncodeCF1009F Dominant Indicessolutioncode前言 最近不是在⛏李超树嘛,然后就去玩了下…

领域驱动设计,让程序员心中有码(七)

领域驱动设计- 让程序员心中有码(七)-设计原则和设计模式,互联网开发者们共同的追求前言多年来,笔者一直从事传统软件企业的软件开发和项目管理工作。笔者发现在众多的传统软件企业中,评判优秀开发者的标准往往是技能的…

cf1504. Travelling Salesman Problem

cf1504. Travelling Salesman Problem 题意: n个城市,编号1~n,每个城市有美丽值a[i],现在要从城市1出发,其他所有城市走一遍,最后回到城市1,城市i到j的花费为max(ci,aj-ai),ci为第…

[NOIP-S 2020]游记(附考前注意事项)

呜呼起飞T1:排水系统T2:字符串匹配T3:移球游戏T4:微信步数总述考前注意事项T1:排水系统 嗯—— 怎么说呢?? 比赛开始后迅速通读三遍题 顶着第一题肯定是打卡题的心态 哪怕是恶心模拟也得上&…

程序猿修仙之路--数据结构之你是否真的懂数组?

数据结构但凡IT江湖侠士,算法与数据结构为必修之课。早有前辈已经明确指出:程序算法数据结构 。要想在之后的江湖历练中通关,数据结构必不可少。数据结构与算法相辅相成,亦是阴阳互补之法。开篇说道数组,几乎每个IT江…

Rolling The Polygon Gym - 102222B

Rolling The Polygon Gym - 102222B 题意: 给你一个多边形,给你内部一个点Q,多边形在平面上滚动一周(当有一个边第二次触地滚动停止),问Q的轨迹长度 题解: 计算几何题目 自己一直不是很擅长…

Asp.Net Core 轻松学-经常使用异步的你,可能需要看看这个文章

前言事情的起因是由于一段简单的数据库连接代码引起,这段代码从语法上看,是没有任何问题;但是就是莫名其妙的报错了,这段代码极其简单,就是打开数据库连接,读取一条记录,然后立即更新到数据库中…

try.dot.net 的正确使用姿势

来源:https://www.cnblogs.com/7tiny/p/10277600.html【简介】微软官方前不久发布了 try.dot.net 这个有趣的网址,开始只是图个新鲜看了一下,后面通过自身实践过后,发现这着实算是个“有趣”的站点!首先我们大概地列举…

A - TOYS POJ - 2318

A - TOYS POJ - 2318 题意: 一个盒子中有n个隔板,分出n1个空间(从左往右空间的编号分别是0…n),(隔板之间不会相交,且按照从左往右的顺序给出),现在给你m个坐标的物品&…

[BJOI2017]魔法咒语(AC自动机+DP+矩阵快速幂)

文章目录titlesolutioncodetitle solution 针对数据编程才是坠吊的!!! 观察数据,发现分隔数据的LLL跨度过大,没有衔接——推测很有可能是分数据做法 ①:考虑L≤100L\le100L≤100的情况 可以暴力DPDPDP转移…

[国家集训队]middle(二分+主席树[中位数思维题])

文章目录点击查看solutioncode点击查看 solution 简单口胡一下就跑 考虑二分答案ansansans 区间[x1,x2],x1∈[a,b],x2∈[c,d][x1,x2],x1∈[a,b],x2∈[c,d][x1,x2],x1∈[a,b],x2∈[c,d] 大于等于ansansans的设为111,小于ansans…

使用Roslyn脚本化C#代码,C#动态脚本实现方案

来源:https://www.cnblogs.com/7tiny/p/10279349.html【前言】Roslyn 是微软公司开源的 .NET 编译器。编译器支持 C# 和 Visual Basic 代码编译,并提供丰富的代码分析 API。Roslyn不仅仅可以直接编译输出,难能可贵的就是上述描述中的开放了编…

[构造训练]CF1227G Not Same,CF1375H Set Merging,CF1364E X-OR

文章目录T1:CF1227G Not SamesolutioncodeT2:CF1364E X-ORsolutioncodeT3:CF1375H Set Mergingsolutioncode~~脑子是个好东西,希望人人都有构造真的不是个东西,看了一天视频,没有一道题会做~~ T1&#xff…

asp.net core 环境(Development、Staging 、Production)

一.在asp.net core中使用多个环境ASP.NET Core 配置是基于运行时环境, 使用环境变量。ASP.NET Core 在应用启动时读取环境变量ASPNETCORE_ENVIRONMENT,并将该值存储在 IHostingEnvironment.EnvironmentName 中。ASPNETCORE_ENVIRONMENT 可设置为任意值,但…

ASP.NET Core 2.1 : 图解路由(2.1 or earler)

本文通过一张图来看一下路由的配置以及请求处理的机制。 一、概述路由主要有两个主要功能:将请求的URL与已定义的路由进行匹配,找到该URL对应的处理程序并传入该请求进行处理。根据已定义的路由生成URL这两个功能看起来这两个是相反的。A.路由的配置路由…