人工智能第六课:如何做研究

这是我学习 Data Science Research Methods  这门课程的笔记。这门课程的讲师是一名教授和数据科学家,可能因为他既有理论背景,又有实践经验,所以整个课程听下来还比较舒服,学到了一些不错的理论知识。


640?wx_fmt=png


这门课比较系统地介绍了什么是研究(Research),有哪几种类型的研究,它跟一般的数据科学有什么区别,以及如何去做研究。


640?wx_fmt=png

研究分为基础性研究和应用性研究。


研究和分析(数据科学)都是我们解决问题的一种手段,而且比较容易混淆。简单地说,他们有如下的根本区别


  1. 分析是已经有数据,而且往往问题已经提出来,你要做的是在数据中找到一些规律,来回答这个问题。

  2. 研究,从某种程度上包括了分析这个环节。但是,它是要求研究者从头到尾掌握情况,你遇到了一个现象,然后你要定义问题(这是最核心的不同),然后根据问题的需求去收集数据,然后分析等等。


严格意义上来说,做研究会有一个可以遵循的流程如下


640?wx_fmt=png


  1. 设定一个问题

  2. 形成一个理论

  3. 提出假设

  4. 设计实验和测试(包括收集调查表)

  5. 形成结论,如果必要的情况下,重复1到4

  6. 最终结论


在设定问题这个环节,其实很不容易,而且这很可能是区别好的研究人员和一般的研究人员的关键能力,从人类行为和心理分析角度来看,有如下的参考准则


  1. 问题要尽量少(1个,或者最多2个)

  2. 问题要具体,而不是抽象的

  3. 探寻问题背后的问题,即你到底为什么会有这个问题


640?wx_fmt=png


并非要取得博士学位才能做研究,实际上每个人都可以是一个研究者。例如课程中讲了一个案例:某一天你站在自家的楼下,发现天花板上面漏水。你要解决这个问题。你会怎么定义问题呢?


一旦定义了问题,你会形成一个自己的理论(通常是对问题的详细描述),然后你需要开始提出假设(有可能会有多个),接下来就是你怎么验证和测试你的假设了。这里面有一个很有意思的环节,就是我们通常会依赖于向潜在的客户或用户做调查表来得到一些数据,此时要特别注意学习受访者的心理规律,以便你能得到真正有用的数据。


  1. 尽量避免问WHY(为什么),因为人们通常并不知道,你如果非要问,那么他们就可能胡乱回答一下(真有意思的观察)

  2. 避免问过于复杂的问题。这个其实是第一个原则的延申。

  3. 避免隐含或明确的倾向。例如你拿了一个新的logo,问别人新的logo是不是比旧的好。

  4. 如果一个人感觉自己在被监控,他的行为是不一样。例如你拿着糖果给五个小朋友做调查,并说首先回答完成的前两位可以获得糖果等之类。

  5. 尽量让受访者少知道背景,让他们尽量“幼稚”,避免偏见

  6. 尽量扩大样本,样本越大,可信度越高。


640?wx_fmt=png


课程中的范例:某个公司开发了一个绿色产品,在前期小范围调研的时候反馈很好,因为大家都觉得绿色的产品对环境有保护,理应得到更多消费者的青睐。但实际上推向市场后,反应却平平。研究人员需要解决这个问题。他该怎么提出问题呢?怎么去假设和调查呢?



未完待续,敬请关注。这门课程还有很多技术性的内容,例如如何抽样等。后面消化消化一下给大家再分享。




请通过 https://aka.ms/learningAI 或者扫描下面的二维码关注本系列文章《人工智能学习笔记》


640?wx_fmt=png


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/317782.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CF889E-Mod Mod Mod【dp】

正题 题目链接:https://www.luogu.com.cn/problem/CF889E 题目大意 给出一个长度为nnn的序列aaa&#xff0c;定义函数f(i,x)f(i,x)f(i,x)有 f(n,x)xmodanf(n,x)x\bmod a_nf(n,x)xmodan​ f(i,x)(xmodai)f(xmodai)(i<n)f(i,x)(x\bmod a_i)f(x\bmod a_i)(i<n)f(i,x)(xmod…

[2020-11-30 contest]数列(矩阵加速),秘密通道(dijkstra最短路)小X游世界树(换根dp),划分(数学)

文章目录数列solutioncode秘密通道solutioncode小X游世界树solutioncode划分solutioncode数列 a[1]a[2]a[3]1 a[x]a[x-3]a[x-1] (x>3) 求 a 数列的第 n 项对 1000000007&#xff08;10^97&#xff09;取余的值。 输入格式 第一行一个整数 T&#xff0c;表示询问个数。 以下…

动态区间第k小:树状数组套权值线段树

所谓树状数组套权值线段树&#xff0c;就是在树状树组上套权值线段树 &#xff08;逃&#xff09; 解析 如何解决静态区间第k小&#xff1f; 使用主席树就ok啦 辣么如何解决动态区间第k小嘞… 我们想想主席树为啥不能解决动态区间第k小 因为如果改了一个点的值&#xff0c;…

Docker最全教程——数据库容器化之持久保存数据(十二)

上一节我们讲述了SQL Server容器化实践&#xff08;注意&#xff0c;SQL Server现在也支持跨平台&#xff09;&#xff0c;本节将讲述如何持久保存数据&#xff0c;并且接下来将逐步讲解其他数据库&#xff08;MySql、Redis、Mongodb等等&#xff09;的容器化实践&#xff0c;中…

AT2064-[AGC005F]Many Easy Problems【NTT】

正题 题目链接:https://www.luogu.com.cn/problem/AT2064 题目大意 给出nnn个点的一棵树&#xff0c;对于k∈[1,n]k\in[1,n]k∈[1,n]求出所有kkk个点的点集的构出的虚树大小和。 1≤n≤21051\leq n\leq 2\times 10^51≤n≤2105 解题思路 考虑每个点的贡献&#xff0c;一个点…

【李超树】李超线段树维护凸包(凸壳) (例题:blue mary开公司+线段游戏+ZZH的旅行)

文章目录前言李超树引入(斜率优化)什么是李超树&#xff1f;李超树活着能干点什么&#xff1f;算法思想(使用手册&#xff1f;)插入查询模板判断是否覆盖(优不优)插入查询例题板题&#xff1a;BlueMary开公司分析code线段游戏分析code拓展——(动态开点李超树维护凸包)ZZH的旅行…

L3-2 至多删三个字符

L3-2 至多删三个字符 题意&#xff1a; 给定一个全部由小写英文字母组成的字符串&#xff0c;允许你至多删掉其中 3 个字符&#xff0c;结果可能有多少种不同的字符串&#xff1f; 题解&#xff1a; 最不擅长dp 我们设dp[i][j]表示前i里面删除j个有多少种方法 第i个删除或者…

2021CSP:游记

前言 没做出别人做不出的题 却犯了别人不会犯的错 考场 先遍历 T1感觉似乎很水的样子 T2这甚么东西… T3似乎有的一搞 T4网络流模板可以拿40 &#xff08;然而由于某次模拟悲伤的前车之鉴并不想为这点分写又臭又长的dinic…&#xff09; 先开T1 一开始直觉想三分水过去 但分析…

老牌开源Office操作组件NPOI现已支持.NET Core

昨天在微信群里听到老牌Excel开发利器NPOI的作者瞿总说4.6.1版本的NPOI已经支持.NET Standard 2.0了&#xff0c;这也就意味着你可以在.NET Core中使用NPOI了。作者&#xff1a;依乐祝原文地址 &#xff1a;https://www.cnblogs.com/yilezhu/p/10269281.html写在前面曾经的.NET…

P5327-[ZJOI2019]语言【线段树合并,LCA】

正题 题目链接:https://www.luogu.com.cn/problem/P5327 题目大意 给出nnn个点的一棵树&#xff0c;和mmm条路径&#xff0c;求有多少个点对至少存在一条路径经过它们。 1≤n,m≤1051\leq n,m\leq 10^51≤n,m≤105 解题思路 有一个很显然的性质&#xff0c;如果点zzz在x→yx…

D. Bananas in a Microwave

D. Bananas in a Microwave 题意&#xff1a; u1s1&#xff0c;题意真难懂 有n个时间&#xff0c;每个时间给你两个操作&#xff0c;第一个是kkx&#xff0c;第二个是kk∗x&#xff0c;且可以执行[0,y]次&#xff0c;&#xff08;在第i个时间点&#xff0c;必须应用第i个操作…

.NET西安社区 [拥抱开源,又见 .NET] 第二次活动简报

「拥抱开源, 又见 .NET」随着 .NET Core的发布和开源&#xff0c;.NET又重新回到人们的视野。 .NET Core的下个3.0即将release&#xff0c;加入非常多的新功能&#xff0c;越来越拥抱变化&#xff0c;DevOps和Microservice的最佳实践已经在 .NET Core落地&#xff0c;比如 Ocel…

YBTOJ洛谷P2839:最大中位数(主席树、二分答案)

遇事不决&#xff0c;二分试试 解析 很好的一道题 真是把主席树玩明白了 一个关于中位数的常用trick&#xff1a; 二分答案mid&#xff0c;把>mid的看成1&#xff0c;<mid的看成-1&#xff0c;然后看最大子段和是否>0 然而如果对离散化后的每一个值建一棵小白逛公园那…

计数学习小记

前言 闲的无聊懒得做题不如来水点博客。 虽然一直作为一个感性做题的选手&#xff0c;但是理性层面上确实是分析题目初步做法的一个十分重要的方法。 额不会涉及具体的知识点&#xff0c;只是总结点自己做题的时候遇到的比较巧妙的方法。 混沌排版请见谅 还有我也很菜有错…

[dsu on tree]树上启发式合并总结(算法思想及模板附例题练习)

文章目录前言树上启发式合并引入算法思想时间复杂度模板练习例题&#xff1a;CF600E Lomsat gelralsolutioncodeCF208E Blood CousinssolutioncodeCF570D Tree RequestssolutioncodeCF1009F Dominant Indicessolutioncode前言 最近不是在⛏李超树嘛&#xff0c;然后就去玩了下…

F Christmas Game

F Christmas Game 题意&#xff1a; 给一棵n个节点树&#xff0c;每个点上都有权值&#xff0c;两个人轮流操作&#xff0c;每次可以将一个点的权值给他的父亲节点&#xff0c;&#xff08;父亲节点与当前点的深度差必须为k&#xff09;&#xff0c;当有一方不能操作时即为输…

领域驱动设计,让程序员心中有码(七)

领域驱动设计- 让程序员心中有码&#xff08;七&#xff09;-设计原则和设计模式&#xff0c;互联网开发者们共同的追求前言多年来&#xff0c;笔者一直从事传统软件企业的软件开发和项目管理工作。笔者发现在众多的传统软件企业中&#xff0c;评判优秀开发者的标准往往是技能的…

codeforces:CF750 复盘

总结 solve 4 rnk:833 我变成小学生(pupil)啦&#xff01; 这次看完题解感觉D和F其实都挺可做的 还是思维的问题 A 签到题 判断加起来是奇数还是偶数即可 但我做的分类讨论就很恶心qwq 因为我没看到a、b、c都至少是1&#xff01; 所以我还在辛苦的分类讨论qwq 只能说我分类讨…

UOJ#351-新年的叶子【树的直径,数学期望】

正题 题目链接:https://uoj.ac/problem/351 题目大意 给出nnn个点的一棵树&#xff0c;开始所有点都是白色&#xff0c;每次随机点黑一个叶子&#xff08;可以重复点&#xff09;&#xff0c;求期望多少次能使得白色点构成的图直径发生变化。 答案对998244353998244353998244…

cf1504. Travelling Salesman Problem

cf1504. Travelling Salesman Problem 题意&#xff1a; n个城市&#xff0c;编号1~n&#xff0c;每个城市有美丽值a[i]&#xff0c;现在要从城市1出发&#xff0c;其他所有城市走一遍&#xff0c;最后回到城市1&#xff0c;城市i到j的花费为max(ci,aj-ai)&#xff0c;ci为第…