模式识别作业

模式识别作业

1.说明判别分类器(如logistic回归)与上述特定类别的高斯朴素贝叶斯分类器之间的关系正是logistic回归所采用的形式。

经过第2问更加普遍的推导过程:

对应参数为:

二次项:
v=[σ112−σ1022σ112σ102,...,σD12−σD022σD12σD02]v=[\frac{\sigma_{11}^2-\sigma_{10}^2}{2\sigma_{11}^2\sigma_{10}^2},...,\frac{\sigma_{D1}^2-\sigma_{D0}^2}{2\sigma_{D1}^2\sigma_{D0}^2}]v=[2σ112σ102σ112σ102,...,2σD12σD02σD12σD02]

一次项:
w=[σ102μ11−σ112μ10σ112σ102,...,σD02μD1−σD12μD0σD12σD02]w=[\frac{\sigma_{10}^2\mu_{11}-\sigma_{11}^2\mu_{10}}{\sigma_{11}^2\sigma_{10}^2},...,\frac{\sigma_{D0}^2\mu_{D1}-\sigma_{D1}^2\mu_{D0}}{\sigma_{D1}^2\sigma_{D0}^2}]w=[σ112σ102σ102μ11σ112μ10,...,σD12σD02σD02μD1σD12μD0]

常数项:
b=ln(π1−π)+∑lnσi0σi1+∑σ112μ102−σ102μ1122σ112σ102b=ln(\frac{\pi}{1-\pi})+\sum ln\frac{\sigma_{i0}}{\sigma{i_1}}+\sum \frac{\sigma_{11}^2\mu_{10}^2-\sigma_{10}^2\mu_{11}^2}{2\sigma_{11}^2\sigma_{10}^2}b=ln(1ππ)+lnσi1σi0+2σ112σ102σ112μ102σ102μ112

其中

f(x)=11+exp(∑vixi2+wixi+b)f(x)=\frac{1}{1+exp(\sum v_ix_i^2+w_ix_i+b)}f(x)=1+exp(vixi2+wixi+b)1

由于σi0=σi1=σi\sigma_{i0} = \sigma_{i1}=\sigma_{i}σi0=σi1=σi

发现v=0.v=0.v=0.

二次项消失,一次项和常数项如下:

一次项:
w=[μ11−μ10σ12,...,μD1−μD0σD2]w=[\frac{\mu_{11}-\mu_{10}}{\sigma_{1}^2},...,\frac{\mu_{D1}-\mu_{D0}}{\sigma_{D}^2}]w=[σ12μ11μ10,...,σD2μD1μD0]

常数项:
b=ln(π1−π)+∑μ102−μ1122σ12b=ln(\frac{\pi}{1-\pi})+\sum \frac{\mu_{10}^2-\mu_{11}^2}{2\sigma_{1}^2}b=ln(1ππ)+2σ12μ102μ112

f(x)=11+exp(wixi+b)f(x)=\frac{1}{1+exp(w_ix_i+b)}f(x)=1+exp(wixi+b)1


2.当换成更普遍的高斯函数,是否仍有Logistic Regression形式?

生成式高斯朴素贝叶斯分类器如下:

P(y=1∣X)=P(X∣y=1)P(y=1)P(X)=P(X∣y=1)P(y=1)P(X∣y=1)P(y=1)+P(X∣y=0)P(y=0)P(y=1|X) = \frac{P(X|y=1)P(y=1)}{P(X)}=\frac{P(X|y=1)P(y=1)}{P(X|y=1)P(y=1)+P(X|y=0)P(y=0)}P(y=1X)=P(X)P(Xy=1)P(y=1)=P(Xy=1)P(y=1)+P(Xy=0)P(y=0)P(Xy=1)P(y=1)

=11+P(X∣y=1)P(y=1)P(X∣y=0)P(y=0)=11+exp(ln(P(X∣y=1)P(y=1)P(X∣y=0)P(y=0)))=\frac{1}{1+\frac{P(X|y=1)P(y=1)}{P(X|y=0)P(y=0)}}=\frac{1}{1+exp(ln(\frac{P(X|y=1)P(y=1)}{P(X|y=0)P(y=0)}))}=1+P(Xy=0)P(y=0)P(Xy=1)P(y=1)1=1+exp(ln(P(Xy=0)P(y=0)P(Xy=1)P(y=1)))1

其中

ln(P(X∣y=1)P(y=1)P(X∣y=0)P(y=0))=ln(π1−π)+lnP(X∣y=1)P(X∣y=0)ln(\frac{P(X|y=1)P(y=1)}{P(X|y=0)P(y=0)})=ln(\frac{\pi}{1-\pi})+ln\frac{P(X|y=1)}{P(X|y=0)}ln(P(Xy=0)P(y=0)P(Xy=1)P(y=1))=ln(1ππ)+lnP(Xy=0)P(Xy=1)

=ln(π1−π)+ln((2πσi1)−1exp(−(X−μ1)2/2σ12)(2πσi0)−1exp(−(X−μ0)2/2σ02))=ln(\frac{\pi}{1-\pi}) + ln(\frac{(\sqrt{2\pi}\sigma_{i1})^{-1}exp(-(X-\mu_1)^2/2\sigma_1^2)}{(\sqrt{2\pi}\sigma_{i0})^{-1}exp(-(X-\mu_0)^2/2\sigma_0^2)})=ln(1ππ)+ln((2πσi0)1exp((Xμ0)2/2σ02)(2πσi1)1exp((Xμ1)2/2σ12))

=ln(π1−π)+∑ln((2πσi1)−1exp(−(X−μi1)2/2σi12)(2πσi0)−1exp(−(X−μi0)2/2σi02))=ln(\frac{\pi}{1-\pi}) + \sum ln(\frac{(\sqrt{2\pi}\sigma_{i1})^{-1}exp(-(X-\mu_{i1})^2/2\sigma_{i1}^2)}{(\sqrt{2\pi}\sigma_{i0})^{-1}exp(-(X-\mu_{i0})^2/2\sigma_{i0}^2)})=ln(1ππ)+ln((2πσi0)1exp((Xμi0)2/2σi02)(2πσi1)1exp((Xμi1)2/2σi12))

=ln(π1−π)+∑(lnσi0σi1+xi2σi12−σi022σi12σi02+xiσi02μi1−σi12μi0σi12σi02+σi12μi02−σi02μi122σi12σi02)=ln(\frac{\pi}{1-\pi}) +\sum{(ln\frac{\sigma_{i0}}{\sigma{i_1}}+x_i^2\frac{\sigma_{i1}^2-\sigma_{i0}^2}{2\sigma_{i1}^2\sigma_{i0}^2}+x_i\frac{\sigma_{i0}^2\mu_{i1}-\sigma_{i1}^2\mu_{i0}}{\sigma_{i1}^2\sigma_{i0}^2}+\frac{\sigma_{i1}^2\mu_{i0}^2-\sigma_{i0}^2\mu_{i1}^2}{2\sigma_{i1}^2\sigma_{i0}^2})}=ln(1ππ)+(lnσi1σi0+xi22σi12σi02σi12σi02+xiσi12σi02σi02μi1σi12μi0+2σi12σi02σi12μi02σi02μi12)

所以

σi12=σi02\sigma_{i1}^2=\sigma_{i0}^2σi12=σi02时,xi2x_i^2xi2项不复存在,其对应形式刚好为logistic regression。

对应参数为:

二次项:
v=[σ112−σ1022σ112σ102,...,σD12−σD022σD12σD02]v=[\frac{\sigma_{11}^2-\sigma_{10}^2}{2\sigma_{11}^2\sigma_{10}^2},...,\frac{\sigma_{D1}^2-\sigma_{D0}^2}{2\sigma_{D1}^2\sigma_{D0}^2}]v=[2σ112σ102σ112σ102,...,2σD12σD02σD12σD02]

一次项:
w=[σ102μ11−σ112μ10σ112σ102,...,σD02μD1−σD12μD0σD12σD02]w=[\frac{\sigma_{10}^2\mu_{11}-\sigma_{11}^2\mu_{10}}{\sigma_{11}^2\sigma_{10}^2},...,\frac{\sigma_{D0}^2\mu_{D1}-\sigma_{D1}^2\mu_{D0}}{\sigma_{D1}^2\sigma_{D0}^2}]w=[σ112σ102σ102μ11σ112μ10,...,σD12σD02σD02μD1σD12μD0]

常数项:
b=ln(π1−π)+∑lnσi0σi1+∑σ112μ102−σ102μ1122σ112σ102b=ln(\frac{\pi}{1-\pi})+\sum ln\frac{\sigma_{i0}}{\sigma{i_1}}+\sum \frac{\sigma_{11}^2\mu_{10}^2-\sigma_{10}^2\mu_{11}^2}{2\sigma_{11}^2\sigma_{10}^2}b=ln(1ππ)+lnσi1σi0+2σ112σ102σ112μ102σ102μ112

其中

f(x)=11+exp(∑vixi2+wixi+b)f(x)=\frac{1}{1+exp(\sum v_ix_i^2+w_ix_i+b)}f(x)=1+exp(vixi2+wixi+b)1


3.非朴素高斯贝叶斯分类器是否仍具有Logistic Regress的性质?

P(y∣X)=P(x1,x2∣y=1)P(y=1)P(X)=P(x1,x2∣y=1)P(y=1)P(x1,x2∣y=1)P(y=1)+P(x1,x2∣y=0)P(y=0)P(y|X)=\frac{P(x1,x2|y=1)P(y=1)}{P(X)}=\frac{P(x1,x2|y=1)P(y=1)}{P(x1,x2|y=1)P(y=1)+P(x1,x2|y=0)P(y=0)}P(yX)=P(X)P(x1,x2y=1)P(y=1)=P(x1,x2y=1)P(y=1)+P(x1,x2y=0)P(y=0)P(x1,x2y=1)P(y=1)

=11+P(x1,x2∣y=1)P(y=1)P(x1,x2∣y=0)P(y=0)=11+exp(e)=\frac{1}{1+\frac{P(x1,x2|y=1)P(y=1)}{P(x1,x2|y=0)P(y=0)}} = \frac{1}{1+exp(e)}=1+P(x1,x2y=0)P(y=0)P(x1,x2y=1)P(y=1)1=1+exp(e)1

其中

e=lnπ1−π+ln(P(x1,x2∣y=1)P(x1,x2∣y=0))e =ln{\frac{\pi}{1-\pi}} + ln(\frac{P(x1,x2|y=1)}{P(x1,x2|y=0)})e=ln1ππ+ln(P(x1,x2y=0)P(x1,x2y=1))

由于

P(x1,x2∣y=k)=12πσ1σ21−p2exp(略去)P(x1,x2|y=k)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-p^2}}exp(略去)P(x1,x2y=k)=2πσ1σ21p21exp()

将其带入式子eee中,得到:

e∗2(1−p2)σ12σ22=lnπ1−π+x12(σ22−σ22)+x22(σ12−σ12)+x1(−2μ10σ22+2pσ1σ2μ20+2μ11σ22−2pσ1σ2μ21)+x2(−2μ20σ12+2pσ1σ2μ10+2μ21σ12−2pσ1σ2μ11)+x1x2(−2pσ1σ2+2pσ1σ2)−2pσ1σ2μ10μ20+2pσ1σ2μ11μ21e*2(1-p^2)\sigma_1^2\sigma_2^2 = ln{\frac{\pi}{1-\pi}} + x_1^2(\sigma_2^2-\sigma_2^2)+x_2^2(\sigma_1^2-\sigma_1^2)+x_1(-2\mu_{10}\sigma_2^2+2p\sigma_1\sigma_2\mu_{20}+2\mu_{11}\sigma_2^2-2p\sigma_1\sigma_2\mu_{21})+x_2(-2\mu_{20}\sigma_1^2+2p\sigma_1\sigma_2\mu_{10}+2\mu_{21}\sigma_1^2-2p\sigma_1\sigma_2\mu_{11})+x_1x_2(-2p\sigma_1\sigma_2+2p\sigma_1\sigma_2)-2p\sigma_1\sigma_2\mu_{10}\mu_{20}+2p\sigma_1\sigma_2\mu_{11}\mu_{21}e2(1p2)σ12σ22=ln1ππ+x12(σ22σ22)+x22(σ12σ12)+x1(2μ10σ22+2pσ1σ2μ20+2μ11σ222pσ1σ2μ21)+x2(2μ20σ12+2pσ1σ2μ10+2μ21σ122pσ1σ2μ11)+x1x2(2pσ1σ2+2pσ1σ2)2pσ1σ2μ10μ20+2pσ1σ2μ11μ21

=x1(−2μ10σ22+2pσ1σ2μ20+2μ11σ22−2pσ1σ2μ21)+x2(−2μ20σ12+2pσ1σ2μ10+2μ21σ12−2pσ1σ2μ11)+2pσ1σ2(μ11μ21−μ10μ20)=x_1(-2\mu_{10}\sigma_2^2+2p\sigma_1\sigma_2\mu_{20}+2\mu_{11}\sigma_2^2-2p\sigma_1\sigma_2\mu_{21})+x_2(-2\mu_{20}\sigma_1^2+2p\sigma_1\sigma_2\mu_{10}+2\mu_{21}\sigma_1^2-2p\sigma_1\sigma_2\mu_{11})+2p\sigma_1\sigma_2(\mu_{11}\mu_{21}-\mu_{10}\mu_{20})=x1(2μ10σ22+2pσ1σ2μ20+2μ11σ222pσ1σ2μ21)+x2(2μ20σ12+2pσ1σ2μ10+2μ21σ122pσ1σ2μ11)+2pσ1σ2(μ11μ21μ10μ20)

b=2pσ1σ2(μ11μ21−μ10μ20)/(2(1−p2)σ12σ22)b=2p\sigma_1\sigma_2(\mu_{11}\mu_{21}-\mu_{10}\mu_{20})/(2(1-p^2)\sigma_1^2\sigma_2^2)b=2pσ1σ2(μ11μ21μ10μ20)/(2(1p2)σ12σ22)

w1=(−2μ10σ22+2pσ1σ2μ20+2μ11σ22−2pσ1σ2μ21)/(2(1−p2)σ12σ22)w_1 =(-2\mu_{10}\sigma_2^2+2p\sigma_1\sigma_2\mu_{20}+2\mu_{11}\sigma_2^2-2p\sigma_1\sigma_2\mu_{21})/(2(1-p^2)\sigma_1^2\sigma_2^2)w1=(2μ10σ22+2pσ1σ2μ20+2μ11σ222pσ1σ2μ21)/(2(1p2)σ12σ22)

w2=(−2μ20σ12+2pσ1σ2μ10+2μ21σ12−2pσ1σ2μ11)/(2(1−p2)σ12σ22)w_2 =(-2\mu_{20}\sigma_1^2+2p\sigma_1\sigma_2\mu_{10}+2\mu_{21}\sigma_1^2-2p\sigma_1\sigma_2\mu_{11})/(2(1-p^2)\sigma_1^2\sigma_2^2)w2=(2μ20σ12+2pσ1σ2μ10+2μ21σ122pσ1σ2μ11)/(2(1p2)σ12σ22)

则原式可以写成:

P(y∣X)=11+exp(b+w1x1+w2x2)P(y|X)=\frac{1}{1+exp(b+w_1x_1+w_2x_2)}P(yX)=1+exp(b+w1x1+w2x2)1

因此,仍然满足logistic regression形式。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/320901.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Identity Server 4 - Hybrid Flow - Claims

前一篇 Identity Server 4 - Hybrid Flow - MVC客户端身份验证: https://www.cnblogs.com/cgzl/p/9253667.htmlClaims我不知道怎么样翻译这个词比较好, 所以我一般就不翻译了.在前一篇文章里, MVC客户端配置身份认证的时候有这么一句话(Startup的ConfigureServices):JwtSecurit…

图像处理作业第7次

图像处理作业第7次 1.请根据课本中Z变换的定义,证明如下结论。 (1)若x(n)x(n)x(n)的ZZZ变换为X(z)X(z)X(z),则(−1)nx(n)(-1)^nx(n)(−1)nx(n)的ZZZ变换为X(−z)X(-z)X(−z) 根据ZZZ变换的定义 X(z)∑x(n)z−n,∑(−1)nx(n)z−n∑x(n)(−z)−nX(−z)X(z…

【prim】【最小生成树】最优布线问题(ssl 1612)

最优布线问题 ssl 1612 题目大意: 求最小生成树 原题: 题目描述 学校有n台计算机,为了方便数据传输,现要将它们用数据线连接起来。两台计算机被连接是指它们之间有数据线连接。由于计算机所处的位置不同,因此不同…

P5304-[GXOI/GZOI2019]旅行者【最短路】

正题 题目链接:https://www.luogu.com.cn/problem/P5304 题目大意 nnn个点mmm条边的一张有向图,有kkk个关键点,求距离最短的一对关键点。 解题思路 我们能够O(nlog⁡n)O(n\log n)O(nlogn)的进行一个起点或多个起点同时的最短路,但是这题显然…

微软宣布ASP.NET Core 2.0正式支持OData标准

近日,OData 团队在微软开发者博客上宣布,ASP.NET Core 2.0 已正式支持 OData 标准,开发者现在可通过包管理器 NuGet 来获取 Microsoft.AspNetCore.OData 包。此软件包包含在使用 ASP.NET Core MVC 时创建 OData v4.0 端点以及支持 Web API 的…

P2710-数列【Splay】

正题 题目链接:https://www.luogu.com.cn/problem/P2710 题目大意 nnn个数,mmm次操作要求支持 插入若干个数删除某个位置开始的连续若干个数翻转一个区间修改一个区间为ttt求区间和输出一个位置的值询问一个区间的最大子段和 解题思路 用SplaySplaySplay维护&…

【并查集】【图论】【最小生成树】剑鱼行动(ssl 1618)

剑鱼行动 ssl 1618 题目大意: 求一个平面直角坐标系中的最小生成树 原题: 题目描述 给出N个点的坐标,对它们建立一个最小生成树,代价就是连接它们的路径的长度,现要求总长度最小。N的值在100以内,坐标…

图像处理作业4

图像处理作业4 1. 第二版课本习题4.21 本质没有区别,只将图片放置在中心,而周围填充0的个数不变时,不会影响结果。因为本质都是进行了周期延拓,使得尾部的信息不会被丢弃掉。相当于滤波前将图像进行了平移。需要注意的是&#x…

[译]ASP.NET Core Web API 中使用Oracle数据库和Dapper看这篇就够了

园子里关于ASP.NET Core Web API的教程很多,但大多都是使用EFMysql或者EFMSSQL的文章。甚至关于ASP.NET Core Web API中使用DapperMysql组合的文章都很少,更别提OracelDapper组合的文章了,那么今天就带着大家一起翻译一篇国外大牛写的关于ASP…

一个c#开发的web绘流系统

本项目为Web版流程图绘图,兼容IE、FF、Chrome等各主流浏览器,提供了各类基础图形,至于如何应用及用来做什么就随各位了,常规的流程图及逻辑辅助、工作流等皆可胜任。本系统虽为开源项目,然精心调配开发测试&#xff0c…

【二进制】17倍

17倍 题目大意: 有一个二进制数,求它的17倍 原题: 题目描述: 在了解做软件开发可能赚很多的钱之后,农夫约翰也开了一家小的软件公司为客户写程序。约翰的第一个任务对他来说看起来相当简单:输入一个数N&#xff0…

图像处理作业第五次

第5次图像处理作业 1. 复习理解课本中最佳陷波滤波器进行图像恢复的过程,请推导出w(x,y)最优解的计算过程. 根据公式: σ21(2a1)(2b1)∑∑[g−wη−(gˉ−wηˉ)]2\sigma ^2 \frac{1}{(2a1)(2b1)}\sum\sum[g-w\eta - (\bar g-w\bar\eta)]^2σ2(2a1)(2b1)1​∑∑[g…

2020牛客国庆集训派对day8G-Shuffle Cards【Splay】

正题 题目链接:https://ac.nowcoder.com/acm/contest/7865/G 题目大意 nnn个数从1∼n1\sim n1∼n,mmm次拿出其中一段放到头部,求最终序列。 解题思路 用SplaySplaySplay拿出一段区间然后丢到头部就好了。 时间复杂度O(nlog⁡n)O(n\log n)O(nlogn) cod…

将系统分解为微服务的策略

几年前,Vladik Khononov和他的团队决定开始使用微服务,但是几个月后他们发现自己陷入了巨大的混乱之中。他在最近于伦敦Skills Matter举行的DDD eXchange 2018会议上指出,造成这一现象的原因在于,他们只专注于采用酷炫的新技术&am…

图像处理作业 第8次

图像处理作业 第8次 7.11 说明尺度函数ϕ(x)1,0.25≤x<0.75\phi(x)1 ,0.25 \le x\lt 0.75ϕ(x)1,0.25≤x<0.75并未满足多分辨率分析的第二个要求. ϕ1,0(x)2ϕ(2x)1\phi_{1,0}(x)\sqrt 2 \phi(2x)1ϕ1,0​(x)2​ϕ(2x)1 当且仅当满足0.125≤x<0.3750.125 \le x\lt 0…

【dfs】马蹄印

马蹄印 题目大意&#xff1a; 有一个只含括号的图&#xff0c;要你走一条路&#xff08;从左上角出发&#xff09;&#xff0c;使你走的路上的括号加在一起是先k个左括号再k个右括号组成的&#xff0c;要求k最大 原题&#xff1a; 题目描述&#xff1a; 虽然当奶牛贝里斯找…

P4852-yyf hates choukapai【单调队列优化dp】

正题 题目链接:https://www.luogu.com.cn/problem/P4852 题目大意 给出n,m,c,dn,m,c,dn,m,c,d&#xff0c;有n∗cmn*cmn∗cm张卡牌。进行nnn次连抽mmm次单抽&#xff0c;连抽连续ccc张卡牌会获得第一张卡牌的欧气值&#xff0c;单抽可以获得抽到卡牌的欧气值。不能连续进行dd…

P4317-花神的数论题【组合数学】

正题 题目链接:https://www.luogu.com.cn/problem/P4317 题目大意 定义sum(i)sum(i)sum(i)表示iii二进制下111的个数 求∏i1nsum(i)\prod_{i1}^nsum(i)i1∏n​sum(i) 解题思路 考虑计算有iii个111的有多少个数字。 对于nnn的每一个111&#xff0c;我们可以知道如果这一位为…

【暴力】排队的奶牛

排队的奶牛 题目大意&#xff1a; 有一个序列&#xff0c;要你删去序列中的一类相同的数&#xff0c;然后求最长的相同数字段的长度 原题&#xff1a; 题目描述 农夫约翰的N只奶牛排成了一条直线&#xff0c;每只奶牛都有一个特定的标识序号&#xff0c;从左到右第i只奶牛…

NOIP2019 Emiya家今天的饭

NOIP2019 Emiya家今天的饭 ACM退役选手远程口胡 csf如今真的是太菜了,最后16分的做法愣是想了一下午 考虑使用容斥方法: 1 采用动态规划,先求出在无限制情况下,安排kkk种烹饪方法总的方案数. 记dp2[i][j]dp2[i][j]dp2[i][j]表示已经考虑完前iii种烹饪方法,共做了jjj个菜的方…