初识博弈论(1)

博弈论与主流经济学的新发展

  • 1.经济学的研究内容
  • 2.博弈论的研究内容
  • 3.博弈论的发展简史
  • 4.经济学发展的趋势

本系列博文主要记录了学习张维迎老师的《博弈论与信息经济学》一书相关内容,如果有误之处恳请指出;或对照张老师的书籍进行学习。

1.经济学的研究内容

传统教科书:研究稀缺资源的有效配置。现代的观点:研究人的行为。

相比与其他研究人行为的其他学科,经济学的不同之处:假定人是理性的。

理性人: 有一个很好定义的偏好,在面临给定的约束下,最大化自己的偏好。

注意:理性人自私人不同,理性人可以利己也可以利他。

理性人在最大化偏好的过程中需要合作,合作中存在着冲突

为了更好的合作与解决冲突,理性人之间制定制度,规范大家的行为。其中最重要的一个制度为价格制度

新古典经济学: 以价格制度为研究对象,故又称为价格理论。新古典经济学的两个基本假定:
(1)市场参与者的数量是足够多,从而市场是竞争的;
(2)参与者之间不存在信息的不对称问题。

实际中:市场不可能完全竞争,信息不可能完全对称。

不完全竞争导致:人们之间的行为相互影响,使得一个人决策时必须要考虑对方的反应--博弈论要研究的内容
信息不完全对称导致:任何一种有效制度必须满足激励相容自选择条件–信息经济学要研究的内容

2.博弈论的研究内容

Game theory 研究决策主体的行为发生直接相互作用时的决策决策均衡问题,博弈论又称为对策论
传统经济学: 个人效用函数只依赖于个人选择;
博弈论: 个人效用函数不仅依赖于他自己的选择,而且依赖于他人的选择。

从合作与非合作的角度划分:
合作博弈: 当事人达成一个具有约束力的协定;强调团体理性
非合作博弈: 和上面相反;强调个人理性
现在的经济学家谈到博弈论,一般是指非合作博弈。纳什,泽而腾,海撒尼主要贡献也是在非合作博弈方面。

3.博弈论的发展简史

1944年:冯诺伊曼和摩根斯坦出版《博弈论与经济学行为》,博弈理论的起始点。(现在博弈论和他们讲的东西关系不大)
50年代:合作博弈发展的鼎盛时期,(纳什、夏普里、吉利斯 ’囚徒困境‘、’核‘)。非合作博弈开创。
60年代:泽尔腾–“精炼纳什均衡”、海撒尼–不完全信息引入博弈论
1982年:克瑞普斯、威尔逊–动态不完全信息博弈

一开始,博弈论并不被认为是经济学的分支,很多人认为博弈论是数学分支。70,80年代后,博弈论真正成为主流经济学的一部分。这一时期,信息时序问题 成为经济学家关注的重点,而此时的博弈论正好可以用于解决这两个方面的内容。

4.经济学发展的趋势

1.经济学研究的对象越来越转向个体;
2.经济学研究越来越转向人与人的关系研究;
3.经济学越来越重视对信息的研究。

小疑问:博弈论 与 强化学习有什么关系呢?学这个能干嘛??

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/445338.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言实现排序和查找所有算法

c语言版排序查找完成,带详细解释,一下看到爽,能直接运行看效果。 /* Note:Your choice is C IDE */ #include "stdio.h" #include"stdlib.h" #define MAX 10 void SequenceSearch(int *fp,int Length); void Search(int …

推荐算法--推荐系统架构(06)

外围架构一般来说,每个网站都有一个 UI 系统,UI 系统负责给用户展示网页并和用户交互。网站会通过日志系统将用户在 UI 上的各种各样的行为记录到用户行为日志中。 从上面的结构可以看到,除了推荐系统本身,主要还依赖两个条件--界…

树状数组维护区间和的模型及其拓广的简单总结

by wyl8899 树状数组的基本知识已经被讲到烂了,我就不多说了,下面直接给出基本操作的代码。 假定原数组为a[1..n],树状数组b[1..n],考虑灵活性的需要,代码使用int *a传数组。 #define lowbit(x) ((x)&(-(x))…

Python(6)-算数运算符

算数运算符1.算数运算符2.优先级1.算数运算符 加 减- 乘* 除/ 取商// 取余数% 幂**(能算n次方: 2**38,一直以为只能算平方) 扩展: 乘法用于字符串:字符串重复指定的次数,要拼接的次数很长时,用乘号很方便…

推荐算法--其他信息(07)

文章目录目录1.利用上下文信息1.1时间上下文1.2地点上下文2.利用网络社交数据2.1 获取网络社交数据途径2.2 社交网络数据2.3 基于社交网络的推荐2.4 推荐算法2.5 给用户推荐好友目录 1.利用上下文信息 1.1时间上下文 用户的兴趣是随着时间变化的,三天打鱼两天晒网…

动态规划的深入探讨

一、引言 动态规划是一种重要的程序设计思想,具有广泛的应用价值。使用动态规划思想来设计算法,对于不少问题往往具有高时效,因而,对于能够使用动态规划思想来解决的问题,使用动态规划是比较明智的选择。 能够用动态规…

Python(7)-程序执行的原理

程序执行的原理1.计算机中的三个核心部件2.程序执行的原理3.程序的作用1.计算机中的三个核心部件 CPU:中央处理区,超大规模的集成电路,负责处理数据、计算 内存:临时存储数据,断电数据消失,读取数据快 硬盘…

推荐系统读书笔记(推荐系统实战)

随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到很大的挑战;对于消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信…

橙白oj 2017级《算法分析与设计》-练习02

注:A题我以为给新生出的,应该贼简单,是按顺序消灭,卡了十几分钟,成了最后一个ac的题,真是菜的真实。 Problem A: Description 白细胞是人体与疾病斗争的“卫士”。当病菌侵入人体体内时,白细胞…

python(9)-变量、input函数

变量、input函数1.变量的定义(不可变对象)2.变量的类型3.变量的命名规范4. 不同类型的数据计算5.类型转换函数6.input()7.Tips程序是用来处理数据的,而变量是用来存储数据的。 关于函数,是一个提前准备好的代码;可以直接使用,不用…

推荐算法--总结(08)

一、推荐系统结构二、推荐引擎算法(Algorithm)1、协同过滤推荐算法1.1 关系矩阵与矩阵计算1.1.1 用户与用户(U-U矩阵)1.1.2 物品与物品(V-V矩阵)1.1.3 用户与物品(U-V矩阵)1.1.4 奇异…

算法总结-1算法入门

1.0 前言 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。 …

Python(10)- 格式化输出%

格式化输出1. 格式化输出浮点数2. 格式化输出整数3. 格式化输出浮点数4. 格式化输出百分号%变量的格式化输出:input函数将信息输出到控制台,实现变量和文字一起输出。 %格式化操作符,和不同的字符连用,%s 字符串,%d 十…

FM系列算法解读(FM+FFM+DeepFM)

在计算广告中,CTR是非常重要的一环。对于特征组合来说,业界通用的做法主要有两大类:FM系列和Tree系列。这里我们来介绍一下FM系列。   在传统的线性模型中,每个特征都是独立的,如果需要考虑特征与特征之间的相互作用…

二叉树层序遍历

层序遍历序列为:ABCDEFG 思路:栈是先进后出的数据结构,而队列是先进先出的数据结构。 我们层序遍历,很明显,先遇到的节点先打印,不同于前中后序遍历,我们采用队列结构。 具体执行过程如下&…

深度学习(01)-- 基础学习

文章目录目录1. 深度学习基础1.1 深度学习总览1.2 深度网络训练过程1.2.1 传统神经网络的训练方法为什么不能用在深度神经网络1.2.2 deep learning训练过程1.3 数学知识:2. 九种深度学习模型2.1 受限玻尔兹曼机RBM2.2 自编码器AE(降维)2.3 深…

MachineLearning(1)-激活函数sigmoid、损失函数MSE、CrossEntropyLoss

损失函数1.激活函数2.损失函数2.1均方误差损失函数2.2交叉熵损失函数2.3 NLLLoss()2.4 BCELoss()1.激活函数 全连接网络又叫多层感知器,多层感知器的基本单元神经元是模仿人类神经元兴奋与抑制机制,对其输入进行加权求和,若超过某一阈值则该…

Java的IO总结

非流式文件类--File类 从定义看,File类是Object的直接子类,同时它继承了Comparable接口可以进行数组的排序。 File类的操作包括文件的创建、删除、重命名、得到路径、创建时间等,以下是文件操作常用的函数。 File类是对文件系统中文件以及文…

深度学习(02)-- ANN学习

文章目录目录1.神经网络知识概览1.1深度学习顶会1.2相关比赛1.3神经网络知识概览1.4神经网络编程一般实现过程2.简单神经网络ANN2.1 数据集:2.2 网络结构:2.3 代码实现2.3.1 读取数据,并做处理2.3.2 构建网络结构2.3.3 训练网络目录 1.神经网…