《集体智慧编程》笔记(1 / 12):集体智慧导言

文章目录

    • 什么是集体智慧
    • 什么是机器学习
    • 机器学习的局限性
    • 真实生活中的例子
    • 学习型算法的其他用途
    • 小结

Netflix, Google都适用了先进算法,将来自不同人群的数据加以组合,进而得出新的结论,并创造新的商机。

更多类似例子:

  • 约会网站希望帮助人们更快地找到他们的最佳拍档;
  • 预测机票价格变化的公司如雨后春笋般不断涌现;
  • 为了创造更有针对性的广告。

什么是集体智慧

集体智慧通常含义:为了创造新的想法,而将一群人的行为、偏好或思想组合在一起。

集体智慧出现早于Internet,可用调查问卷或普查完成最为基础的方法。

从一大群人中收集的答案可以使我们得出关于群组的统计结论:组中的个体成员将会被忽视。从独立的数据提供者那里得出新的结论,是集体智慧所真正关注的。

例如:金融市场众多参与者的交易行为预测


Internet出现之后,集体智慧有更多体现

  • Wikipedia 在线百科全书由大量用户共同维护
  • Google是根据其他网页对当前网页的引用数多少来评价网页等级的搜索引擎。这种评价等级的方法,搜集了数以千计的人对某一页面的评价信息。

目标:利用开放的API来搜集数据,同时还会讨论到各种机器学习算法和统计方法。将二者结合起来,可借助集体智慧的相关方法,对由自己编写的应用程序搜集得到的数据进行分析;同时,也可以从其他地方搜集数据,并对数据进行试验。

什么是机器学习

机器学习是人工智能领域中与算法相关的一个子域,它允许计算机不断地进行学习。

大多数情况下,这相当于将一组数据传递给算法,并由算法推断出这些数据的属性相关的信息——借助这些信息,算法就能够推测出未来有可能会出现的其他数据。

这种预测是完全有可能的,因为几乎所有的非随机数据中,都会包含这样或那样的“模式Patterns”,这些模式的存在使机器的得以据此进行归纳。

为实现归纳,机器会利用它所认定的出现于数据中的重要特征对数据进行“训练”,并借此得到一个模型


垃圾过滤算法——从一堆垃圾邮件中归纳总结出是某单词是垃圾邮件重要依据。下次收到邮件可根据结论判别邮件是否是垃圾邮件。


各种机器学习算法各有所长,适应不同类型的问题。


许多机器学习算法都很依仗数学和统计学。

统计学不是数学一个分支

机器学习的局限性

当对新的信息进行决策时,人们能够从中识别出相似的信息来,而机器学习方法却只能凭借已经见过的数据进行归纳,而且归纳的方式受到很大的限制,

例子:

  • 将介绍到垃圾邮件过滤方法,是以单词或单词组合出现为依据,根本未给予考虑单词的含义及句子结构。这是因为后者要比前者复杂多得多。
  • 机器学习算法都有过度归纳的可能性。垃圾邮件过滤方法将友人的一封邮件视为垃圾邮件。

真实生活中的例子

  • 网页排名
  • 推荐系统
  • 市场预测
  • 交友匹配

学习型算法的其他用途

  • 生物工艺学 DNA序列,蛋白质结构,化合物筛选等海量数据,需进一步理解生物进程的模式。
  • 金融欺诈侦测
  • 机器视觉
  • 产品市场化
  • 供应链优化
  • 股票市场分析
  • 国家安全

小结

一旦掌握一些机器学习的算法,会发现他们的应用随处可见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/445676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《集体智慧编程》笔记(2 / 12):提供推荐

Making Recommendations 文章目录协作型过滤搜集偏好寻找相近的用户欧几里得距离评价皮尔逊相关度评价应该选用哪一种相似性度量方法为评分者打分推荐物品匹配相似商品构建一个基于某数据平台的链接推荐系统数据平台API构造数据集推荐近邻与链接基于物品的过滤构造物品比较数据…

LeetCode - Easy - 637. Average of Levels in Binary Tree

Topic Tree Description https://leetcode.com/problems/average-of-levels-in-binary-tree/ Given the root of a binary tree, return the average value of the nodes on each level in the form of an array. Answers within 10−510^{-5}10−5 of the actual answer w…

在CodeBlocks下配置GoogleTest单元测试框架

环境准备 Windows 10Code::Blocks 20.03Google Test 1.7.0CMake 3.11.0 编译GoogleTest 一、创建一个工作目录D:\gtest,将刚下载的Google Test 1.7.0、CMake 3.11.0的压缩包解压到刚创建的工作目录。 二、进入CMake文件夹的bin下,运行cmake-gui.exe&…

傻子都能看懂的马拉车Manacher

Manachers Algorithm 马拉车算法操作及原理 package advanced_001;public class Code_Manacher {public static char[] manacherString(String str) {char[] charArr str.toCharArray();char[] res new char[str.length() * 2 1];int index 0;for (int i 0; i ! res.len…

简单暴力到dp的优化(萌新篇)

想写一系列文章,总结一些题目,看看解决问题、优化方法的过程到底是什么样子的。 系列问题一:斐波那契数列问题 在数学上,斐波纳契数列以如下被以递归的方法定义:F(0)0,F(1)1, F(n)F(n-1)F(n-2)&#xff08…

LeetCode - Medium - 114. Flatten Binary Tree to Linked List

Topic TreeDepth-first Search Description https://leetcode.com/problems/flatten-binary-tree-to-linked-list/ Given the root of a binary tree, flatten the tree into a “linked list”: The “linked list” should use the same TreeNode class where the right…

简单暴力到dp的优化(入门篇)

上篇,我们提到,遇到问题,首先根据定义写出笨方法,找出依赖关系(有些题这一步就不太简单,要自己归纳关系),然后进行优化,下面,我们通过几道此方面的经典的&…

简单暴力到dp的优化(初级篇)

一、一维非脑残 1 一个只包含A、B和C的字符串,如果存在某一段长度为3的连续子串中恰好A、B和C各有一个,那么这个字符串就是纯净的,否则这个字符串就是暗黑的。例如:BAACAACCBAAA 连续子串"CBA"中包含了A,B,C各一个&am…

ccpc河北大学生程序设计竞赛dp小总结

近期题目来自校赛,赛前训练,省赛热身,河北ccpc正式比赛。 题目一: 题目描述: 由于第m个台阶上有好吃的薯条,所以薯片现在要爬一段m阶的楼梯. 薯片每步最多能爬k个阶梯,但是每到了第i个台阶&a…

c语言简便实现链表增删改查

注&#xff1a;单追求代码简洁&#xff0c;所以写法可能有点不标准。 //第一次拿c开始写数据结构&#xff0c;因为自己写的&#xff0c;追求代码量少&#xff0c;和学院ppt不太一样。有错请指出 #include <stdio.h> #include <stdlib.h> #include <string.h>…

第一次课 课上代码

第一次课内容 学习心态及注意事项 信心 谦虚 脚踏实地 多动手 python简介 代码量少&#xff0c;简介&#xff0c;易上手&#xff0c;语法要求不过于严格&#xff0c; Python 库。 速度慢&#xff0c; 不可加密。 输出、变量、输入 数据类型&#xff1a;整数、浮点数…

计算机考研专业课只考一科的学校汇总

下列学校专业课只考1门 &#xff08;每项科目下的学校均按照最新学科评估结果由高到低进行排名&#xff09; C语言程序设计 1. 湖南大学 计算机技术&软工专硕&#xff08;信息科学与工程学院&#xff09; 2. 中国海洋大学 计算机技术&#xff08;01计算机应用技术方向&am…

数组实现栈

学习了改进&#xff0c;利用define typedef比上次写的链表更容易改变功能&#xff0c;方便维护&#xff0c;代码更健壮。 大佬别嫌弃&#xff0c;萌新总是很笨&#xff0c;用typedef都想不到。 #include<stdio.h> #include<stdbool.h> #define maxsize 10 typede…

简单暴力到dp的优化(中级篇)

下面再放三道我比较喜欢的&#xff0c;需要好好写一下的题。 第一题比较水 1. White Cloud is exercising in the playground. White Cloud can walk 1 meters or run k meters per second. Since White Cloud is tired,it cant run for two or more continuous seconds. Whi…

第二次课 课上代码

敲一遍&#xff0c;体会每行代码想表达的意思。 第二讲 创建.py文件 数据类型&#xff1a;布尔(and\or\not) 条件判断语句(if elif else) 列表基础操作&#xff08;特点、创建、增加元素、len()、下标、py切片&#xff09; >>> 5>4 True >>> 4>5 Fa…

第一次课 优秀作业展示

18级河北师大软件编程训练 很多同学非常认真的完成了作业&#xff0c;这里选出比较优秀的作业展示出来。 注&#xff1a;展示顺序不是排名 为了尊重同学们的劳动成果&#xff0c;并没有要代码&#xff0c;只是截图展示。 范天祚 &#xff08;傻兔子&#xff09; 熊静祎&…

dp打开思路:HDU1029 HDU1087 HDU1176 HDU1257 POJ1458(水题不水)

题目&#xff1a;https://vjudge.net/contest/68966#overview HDU - 1029 题意&#xff1a;找出出现次数超过一半的数字 蠢思路&#xff1a;排序找中间 DP&#xff1a;扫一遍一个变量count记录解出现的次数&#xff0c;是当前解就&#xff0c;否则--&#xff0c;count为负就…

dp打开思路2:POJ2533 HDU1114 HDU1260 HDU1160(水题不水)

题目&#xff1a;https://vjudge.net/contest/68966#overview POJ2533 最长上升子序列&#xff0c;很平常的题&#xff0c;但是维持单调队列二分还是值得一贴的&#xff0c;O(nlogn) 关键思想&#xff1a;出现在单调队列里的数都在当前接收的数之前&#xff0c;所以找到最小…

二分查找及一般拓展总结

二分-不止是查找哦 二分过程&#xff1a;首先&#xff0c;假设表中元素是按升序排列&#xff0c;将表中间位置记录的关键字与查找关键字比较&#xff0c;如果两者相等&#xff0c;则查找成功&#xff1b;否则利用中间位置记录将表分成前、后两个子表&#xff0c;如果中间位置记…

第三次课 课上代码

这次可能比较简短&#xff0c;这样也好&#xff0c;可读性比较强。 别问我为什么&#xff0c;我不会告诉你们我把代码关了的哼哼。 简单复习、注意事项及小知识强调讲解 作业讲解 列表的遍历 For循环&#xff08;这个参考切片&#xff0c;视频有详细讲解&#xff0c;一样的…