深入理解结构化学习:从结构化感知器到条件随机场

摘要
结构化学习是一类能够处理复杂输出空间问题的机器学习方法,被广泛应用于自然语言处理、图像分析等领域。本文将从三个经典模型——结构化感知器、隐马尔可夫模型 (HMM) 和条件随机场 (CRF) 入手,详细解析其理论基础、算法实现及应用案例,并对比它们的适用场景和性能表现。通过深入的剖析与代码示例,帮助读者理解结构化学习在解决序列标注和结构预测问题中的核心价值。

目录

一、结构化感知器

二、隐马尔可夫模型 (HMM)

三、条件随机场 (CRF)


一、结构化感知器

1.1 什么是结构化感知器?

结构化感知器是一种用于预测复杂结构输出(如序列、树或图)的扩展感知器模型,最初由 Collins 提出。它是标准感知器的推广,能够直接优化全局目标函数,而不是局部解。

主要特点:

  • 能处理结构化数据的标注问题,如 POS(词性标注)和 NER(命名实体识别)。
  • 基于“预测-更新”的迭代优化策略,简单高效。

1.2 算法推导

给定训练数据集 (x(i),y(i)),其中 x(i)是输入,y(i)是其对应的全局结构化输出。

损失函数

模型学习目标是找到权重向量 w,使得 〈w,ϕ(x,y)〉的值最大,其中 ϕ(x,y)表示特征向量。

核心思想是通过寻找损失最大的错误输出 y′:

若 y′≠y(i),更新权重: 

算法步骤
  1. 初始化权重 w=0。
  2. 对每个样本,进行预测,找到与真实值差距最大的预测 y′。
  3. 若 y′y'y′ 错误,则更新权重。
  4. 重复以上步骤直至收敛。

1.3 应用场景与代码实现

结构化感知器常用于序列标注任务。以下是 Python 示例代码:

class StructuredPerceptron:def __init__(self, feature_extractor, labels):self.feature_extractor = feature_extractorself.labels = labelsself.weights = {}def predict(self, x):scores = {label: sum(self.weights.get(feat, 0) for feat in self.feature_extractor(x, label)) for label in self.labels}return max(scores, key=scores.get)def train(self, training_data, epochs=10):for _ in range(epochs):for x, y_true in training_data:y_pred = self.predict(x)if y_true != y_pred:for feat in self.feature_extractor(x, y_true):self.weights[feat] = self.weights.get(feat, 0) + 1for feat in self.feature_extractor(x, y_pred):self.weights[feat] = self.weights.get(feat, 0) - 1

二、隐马尔可夫模型 (HMM)

2.1 隐马尔可夫模型简介

隐马尔可夫模型是一种生成式概率模型,用于建模具有隐状态的时间序列问题。HMM 通过定义状态转移概率和观测概率来建模序列数据。

2.2 模型定义

HMM 包括以下参数:

  • 状态集合:S={s1,s2,…,sN}。
  • 观测集合:O={o1,o2,…,oM}。
  • 初始状态分布:πi=P(s1=si)。
  • 状态转移概率:aij=P(st=sj∣st−1=si)。
  • 观测概率分布:bi(o)=P(ot=o∣st=si)。
任务目标

HMM 的主要任务包括:

  1. 评估问题:计算观测序列的概率 P(O∣λ)。
  2. 解码问题:找到最可能的状态序列。
  3. 学习问题:估计模型参数。

2.3 维特比算法

解码问题通常使用动态规划算法——维特比算法解决,具体步骤包括:

 初始化:

递推:

 

回溯得到最优路径。

2.4 应用案例

HMM 在语音识别、词性标注等任务中表现出色。

三、条件随机场 (CRF)

3.1 CRF 简介

CRF 是一种判别式模型,克服了 HMM 的独立假设局限,直接建模条件概率 P(Y∣X),能够灵活地引入特征。

3.2 CRF 的核心思想

CRF 基于图模型,定义为:

其中:

  • fk是特征函数。
  • λk是特征权重。
  • Z(X)是归一化因子。

3.3 训练与推断

训练:

最大化对数似然:

 

使用梯度下降或 L-BFGS 方法优化。

推断:

解码任务通常使用维特比算法扩展形式。

3.4 应用场景与实现

CRF 在序列标注任务(如命名实体识别、语义标注)中广泛应用。以下是使用 sklearn-crfsuite 的 Python 示例:

from sklearn_crfsuite import CRFcrf = CRF(algorithm='lbfgs',c1=0.1, c2=0.1,max_iterations=100,all_possible_transitions=True
)crf.fit(X_train, y_train)
y_pred = crf.predict(X_test)

 总结与对比

模型方法类型优势劣势应用场景
结构化感知器判别式简单高效,不依赖概率假设性能依赖特征设计 词性标注、实体识别
HMM生成式理论成熟,易于实现假设强独立性,灵活性有限序列预测、语音识别
CRF判别式无独立性假设,特征灵活强大训练复杂,计算量较大命名实体识别、语义标注

这三种模型分别代表了生成式和判别式方法的经典实践,在结构化学习任务中各有千秋。通过深入理解它们的理论和实现,你将能够根据任务需求选择合适的工具,解决复杂的结构化问题。

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/60718.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#基础题总结

16.一张单据上有一个5位数的号码为6**42,其中百位数和千位数已模糊不清,但知道该数能被 57 和 67 除尽。设计一个算法,找出该单据所有可能的号码。 17.编程序求2~10000以内的完全数。一个数的因子(除了这个数本身&…

Docker3:docker基础1

欢迎来到“雪碧聊技术”CSDN博客! 在这里,您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者,还是具有一定经验的开发者,相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导,我将…

详细探索xinput1_3.dll:功能、问题与xinput1_3.dll丢失的解决方案

本文旨在深入探讨xinput1_3.dll这一动态链接库文件。首先介绍其在计算机系统中的功能和作用,特别是在游戏和输入设备交互方面的重要性。然后分析在使用过程中可能出现的诸如文件丢失、版本不兼容等问题,并提出相应的解决方案,包括重新安装相关…

Golang项目:实现一个内存缓存系统

要求 支持设定过期时间,精确到秒支持设定最大内存,当内存超过时做出合适的处理支持并发安全按照以下接口安全 type Cache interface{//size : 1KB 100KB 1MB 2MB 1GBSetMaxMemory(size string )bool//将value写入缓存Set(key string, val interface{},e…

计算机网络复习笔记(湖科大教书匠)

课程链接:【计算机网络微课堂(有字幕无背景音乐版)】 https://www.bilibili.com/video/BV1c4411d7jb/?p61&share_sourcecopy_web&vd_sourcecd12864239c2976e9f2bce4b307393f0 一、基础概念 信息交换方式 电路交换 电话交换机接通…

C语言菜鸟入门·关键字·int的用法

目录 1. int关键字 1.1 取值范围 1.2 符号类型 1.3 运算 1.3.1 加法运算() 1.3.2 减法运算(-) 1.3.3 乘法运算(*) 1.3.4 除法运算(/) 1.3.5 取余运算(%) 1.3.6 自增()与自减(--) 1.3.7 位运算 2. 更多关键字 1. int关键字 int 是一个关键字&#xff0…

神经网络(系统性学习三):多层感知机(MLP)

相关文章: 神经网络中常用的激活函数 神经网络(系统性学习一):入门篇 神经网络(系统性学习二):单层神经网络(感知机) 多层感知机(MLP) 多层感…

Vue——响应式数据,v-on,v-bind,v-if,v-for(内含项目实战)

目录 响应式数据 ref reactive 事件绑定指令 v-on v-on 鼠标监听事件 v-on 键盘监听事件 v-on 简写形式 属性动态化指令 v-bind iuput标签动态属性绑定 img标签动态属性绑定 b标签动态属性绑定 v-bind 简写形式 条件渲染指令 v-if 遍历指令 v-for 遍历对象的值 遍历…

蓝桥杯c++算法秒杀【6】之动态规划【上】(数字三角形、砝码称重(背包问题)、括号序列、组合数问题:::非常典型的必刷例题!!!)

下将以括号序列、组合数问题超级吧难的题为例子讲解动态规划 别忘了请点个赞收藏关注支持一下博主喵!!!! ! ! ! ! 关注博主,更多蓝桥杯nice题目静待更新:) 动态规划 一、数字三角形 【问题描述】 上图给出了一…

YOLO-FaceV2: A Scale and Occlusion Aware Face Detector

《YOLO-FaceV2:一种尺度与遮挡感知的人脸检测器》 1.引言2.相关工作3.YOLO-FaceV23.1网络结构3.2尺度感知RFE模型3.3遮挡感知排斥损失3.4遮挡感知注意力网络3.5样本加权函数3.6Anchor设计策略3.7 归一化高斯Wasserstein距离 4.实验4.1 数据集4.2 训练4.3 消融实验4.3.1 SEAM块4…

【SQL Server】华中农业大学空间数据库实验报告 实验三 数据操作

1.实验目的 熟悉了解掌握SQL Server软件的基本操作与使用方法,以及通过理论课学习与实验参考书的帮助,熟练掌握使用T-SQL语句和交互式方法对数据表进行插入数据、修改数据、删除数据等等的操作;作为后续实验的基础,根据实验要求重…

【Elasticsearch入门到落地】2、正向索引和倒排索引

接上篇《1、初识Elasticsearch》 上一篇我们学习了什么是Elasticsearch,以及Elastic stack(ELK)技术栈介绍。本篇我们来什么是正向索引和倒排索引,这是了解Elasticsearch底层架构的核心。 上一篇我们学习到,Elasticsearch的底层是由Lucene实…

【Spring Boot】# 使用@Scheduled注解无法执行定时任务

1. 前言 在 Spring Boot中,使用Scheduled注解来定义定时任务时,定时任务不执行;或未在规定时间执行。 import org.springframework.scheduling.annotation.Scheduled; import org.springframework.stereotype.Component;Component public c…

STM32总体架构简单介绍

目录 一、引言 二、STM32的总体架构 1、三个被动单元 (1)内部SRAM (2)内部闪存存储器 (3)AHB到APB的桥(AHB to APBx) 2、四个主动(驱动)单元 &#x…

C# Postman或者PostApi调试前端webapi接口发送带有request/body/head信息

知识: 前端接口,表单形式提交。 req.ContentType "application/x-www-form-urlencoded"; x-www-form-urlencoded 是一种常见的 MIME 类型,用于将键值对编码为 HTTP 请求体中的 URL 编码格式。在 Web API 中,x-www-for…

李宏毅机器学习课程知识点摘要(1-5集)

前5集 过拟合: 参数太多,导致把数据集刻画的太完整。而一旦测试集和数据集的关联不大,那么预测效果还不如模糊一点的模型 所以找的数据集的量以及准确性也会影响 由于线性函数的拟合一般般,所以用一组函数去分段来拟合 sigmoi…

七、SElinux

一、SElinux简介 SELinux是Security-Enhanced Linux的缩写,意思是安全强化的linuxSELinux 主要由美国国家安全局(NSA)开发,当初开发的目的是为了避免资源的误用传统的访问控制在我们开启权限后,系统进程可以直接访问当我们对权限设置不严谨时…

小程序25- iconfont 字体图标的使用

项目中使用到图标,一般由公司设计进行设计,设计好后上传到阿里巴巴矢量图标库 日常开发过程中,也可以通过 iconfont 图标库下载使用自带的图标 补充:使用 iconfont 图标库报错:Failed to load font 操作步骤&#xff…

鸢尾花植物的结构认识和Python中scikit-learn工具包的安装

鸢尾花植物的结构认识和Python中scikit-learn工具包的安装 鸢尾花植物的结构认识和Python中scikit-learn工具包的安装 鸢尾花植物的结构认识和Python中scikit-learn工具包的安装一、鸢尾花的认识1.1 对花结构和功能认识1.2、鸢尾花认识1.2.1 鸢尾花种类1.2.2 鸢尾花结构 二. Py…

Unity3D 截图

使用 Unity3D 自带的截图接口,制作截图工具。 截图 有时候我们想对 Unity 的窗口进行截图,如果直接使用一些截图工具,很难截取到一张完整分辨率的图片(例如,我们想要截取一张 1920 * 1080 的图片)。 其实…