Beam Search 原理详解

文章目录

  • 1. 前言
  • 2. 原理
  • 3. 举例
  • 4. 参考


1. 前言

Beam Search 是一种启发式图搜索算法,用于在图或树的搜索过程中寻找最有可能的路径。它常用于自然语言处理(NLP)中的序列生成任务,如机器翻译、语音识别和文本生成等。与穷举搜索(如广度优先搜索)不同,Beam Search 通过限制搜索过程中的候选节点数量来提高效率,从而在保证搜索质量的同时减少计算资源的消耗。

2. 原理

Beam Search 的核心思想是维护一个固定大小的候选列表(称为 beam),在每一步中,算法只保留最有可能的几个候选节点,而不是考虑所有可能的节点。这个“最有可能”的判断通常基于节点的累积得分,该得分是节点从起始点到当前节点路径的得分之和。

以下是 Beam Search 的基本步骤:

  1. 初始化:将起始节点(通常是序列的开始标记)加入到候选列表中,并将其得分设为0。

  2. 扩展节点:对于候选列表中的每个节点,生成所有可能的后继节点,并计算每个后继节点的得分。

  3. 选择和更新:根据得分,从所有生成的后继节点中选择得分最高的 beam 个节点,将它们加入到候选列表中,并更新它们的得分。

  4. 终止条件:重复步骤2和3,直到达到预设的终止条件,例如达到序列的最大长度,或者候选列表中没有新的节点生成。

  5. 选择最终结果:从候选列表中选择得分最高的节点作为搜索结果。

Beam Search 的关键参数是 beam 的宽度,即在每一步中保留的候选节点数量。beam 的宽度越大,搜索过程越接近穷举搜索,计算成本也越高;beam 的宽度越小,搜索过程越快,但可能丢失一些好的候选节点。

在实际应用中,Beam Search 已被证明是一种有效的搜索策略,特别是在处理具有大量可能输出的复杂序列生成任务时。通过调整 beam 的宽度,可以在搜索质量和计算效率之间取得平衡。

3. 举例

下面是 Beam Search 生成句子的具体例子,从 start token 开始,最终生成 the green witch arrived
在这里插入图片描述
Beam Search 不是在每个时间步选择最佳的生成词元,而是在每一步保留 k(束宽 beam width) 个可能的词元,k 可以根据需要调整得更宽或更窄。

在解码的第一步,计算整个词汇表上的 softmax 函数,给每个词分配一个概率。然后从这个 softmax 输出中选择 k 个最佳选项。这些初始的 k 个输出构成了搜索前沿,这 k 个初始词被称为假设 (hypotheses)。一个假设是一个输出序列,即到目前为止的翻译 + 概率。

在后续步骤中,每个最佳假设通过分别传递给不同的解码器而逐步扩展,这些解码器各自在全部词汇表上生成一个 softmax 函数以将假设扩展到每一个可能的下一个词元。

每个这样的 k ∗ V k*V kV 个假设都通过 P ( y i ∣ x , y < i ) P(y_i | x, y < i) P(yix,y<i) 来评分:当前词选择的概率乘以导致该路径的概率。然后我们将 k ∗ V k*V kV 个假设裁剪到 k 个最佳假设,因此搜索前沿始终不超过 k 个假设,且不会同时存在超过 k 个解码器。

4. 参考

https://stackoverflow.com/questions/22273119/what-does-the-beam-size-represent-in-the-beam-search-algorithm


欢迎关注本人,我是喜欢搞事的程序猿; 一起进步,一起学习;

欢迎关注知乎/CSDN:SmallerFL

也欢迎关注我的wx公众号(精选高质量文章):一个比特定乾坤

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/49223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络三剑客之awk

目录 一、awk理论简述 1.1 awk概述 1.2 工作原理 1.3 工作流程 1.3.1 运行模式 1.3.2 执行流程 1.3.3 awk程序结构 1.4 基本语法 1.4.1 命令格式 二、awk操作显示 2.1 基础显示 注&#xff1a;扩展生产案例&#xff08;网卡ip、流量&#xff09; 2.2 BEGIN END 运…

AI大模型写的高考作文,你觉得怎么样?

下方为2024年高考新课标I卷语文作文题目&#xff0c;接下来将使用Chatgpt、文心一言、讯飞星火等众多AI大模型来写这篇高考作文 Chatgpt 标题&#xff1a;问题的演变与思考 随着互联网和人工智能技术的飞速发展&#xff0c;我们获得信息的方式和速度发生了前所未有的变化。曾经…

Spring-Aop源码解析(二)

书接上文&#xff0c;上文说到&#xff0c;specificInterceptors 不为空则执行createProxy方法创建代理对象&#xff0c;即下图的createProxy方法开始执行&#xff0c;生成代理对象&#xff0c;生成代理对象有两种方式&#xff0c;JDK和CGLIB。 createAopProxy就是决定使用哪…

减轻幻觉新SOTA,7B模型自迭代训练效果超越GPT-4,上海AI lab发布

LLMs在回答各种复杂问题时&#xff0c;有时会“胡言乱语”&#xff0c;产生所谓的幻觉。解决这一问题的初始步骤就是创建高质量幻觉数据集训练模型以帮助检测、缓解幻觉。 但现有的幻觉标注数据集&#xff0c;因为领域窄、数量少&#xff0c;加上制作成本高、标注人员水平不一…

介绍一下TCP/IP 模型和 OSI 模型的区别

OSI 模型是由国际标准化组织制定的一个用于计算机或通信系统间互联的标准体系&#xff0c;一共有七层&#xff0c;由上而下分别为应用层&#xff0c;表示层&#xff0c;会话层&#xff0c;传输层&#xff0c;网络层&#xff0c;数据链路层和物理层&#xff0c;虽然 OSI 模型理论…

微信公众平台无限回调系统 /user/ajax.php SQL注入漏洞复现

0x01 产品简介 微信公众平台无限回调系统是一种旨在提升企业客户服务体验和运营效率的工具。该系统通过一系列智能化和自动化的功能,帮助企业与用户之间建立更加便捷、高效的沟通桥梁。 0x02 漏洞概述 微信公众平台无限回调系统 /user/ajax.php 接口存在SQL注入漏洞,未经身…

k8s多集群管理工具kubecm

文章目录 一、概述二、安装1、官网链接2、各平台安装2.1、MacOS2.2、Linux2.3、Windows 三、实例1、验证2、配置kubecm自动补全&#xff08;选做&#xff09;2.1、Bash2.2、Zsh2.3、fish2.4、PowerShell 3、创建存放kubeconfig文件的目录4、添加到 $HOME/.kube/config4.1、kube…

win10系统通过docker部署pytorch的cpu环境_中文地址命名实体识别案例

命名实体有关文章参考这篇文章 中文地址命名实体识别训练和预测 其它docker部署类似文章参考 分布式爬虫管理平台gerapy通过docker部署scrapyd来添加主机(四) 背景 通过win10系统通过docker来部署,可以方便的在其它没有python环境的电脑上部署python项目,下面所有操作基…

【网络安全】通过导入功能将权限提升至管理员

未经许可&#xff0c;不得转载。 文章目录 正文 正文 一款学习型 Web 应用&#xff0c;具有多个角色&#xff0c;其中两个相关角色是admin和student。 管理员拥有完全访问权限&#xff0c;而学生拥有有限的访问权限。管理面板中的一项功能允许管理员通过 CSV 方便地导入用户&…

EXCEL自动公式计算始终为0

如果你的数据单元格的左上角存在绿色的三角小箭头&#xff0c;那么就会造成这种问题&#xff1a; 你的数字是以文本形式存入的单元格 解决办法&#xff1a; 选中数据列&#xff0c;数据->分列 直接选择完成 此时就可以进行公式计算了

嵌入式人工智能(26-基于树莓派4B的声音传感器)

发声体产生的振动在空气或其他物质中的传播叫作声波。声波可以借助各种介质向四面八方传播,根据频率的不同&#xff0c;可分为普通的声波(人耳能听到的&#xff0c;频率为20~20000Hz)和超声波(人耳不能听到,频率大于20000Hz)。声波传感器可以检测环境中的声波信号&#xff0c;根…

Linux进程——环境变量之二

文章目录 环境变量查看环境变量获取环境变量main()的第三个参数本地变量全局环境变量内建命令与常规命令 环境变量 查看环境变量 在上一篇文章中我们只说了查看某个环境变量的值&#xff0c;那么如何查看所有的环境变量呢 使用指令env即可 例如 这里我们也不需要全部记住&a…

WPF MVVM框架:CommunityToolkit.Mvvm包使用介绍

最近在需要使用MVVM框架的时候才发现MvvmLight作者宣布停止更新了&#xff0c;有点可惜。 原作者推荐使用CommunityToolkit.Mvvm包&#xff0c;所以这里做一个CommunityToolkit.Mvvm包使用的全面的总结。 开发环境&#xff1a; Visual Studio 2019Windows 10 1903CommunityTo…

海山数据库(He3DB)性能优化方案解析

前端优化是一个永恒的话题&#xff0c;每个前端开发者都希望自己的页面能够快速加载&#xff0c;给用户良好的体验。但往往事与愿违。因此&#xff0c;本文从编码优化、构建优化、部署优化三方面入手进行web页面性能优化。 1. 编码优化 1.1. Css优化 1.1.1. 合理使用css选择…

vue 实战 区域内小组件元素拖拽 示例

<template><div><el-button type"primary" click"showDialog true">快捷布局</el-button><el-dialog title"快捷布局配置" :visible.sync"showDialog"><el-row :gutter"20"><el-co…

全方位数据管理:一站式爬虫服务解决方案

摘要 面对互联网信息爆炸的时代&#xff0c;如何高效地收集、整理并分析海量数据&#xff0c;成为企业与开发者面临的一大挑战。本文将深入探讨一站式爬虫服务解决方案&#xff0c;揭示如何通过全方位数据管理策略&#xff0c;助力企业轻松驾驭大数据海洋&#xff0c;实现数据…

专业视频拍摄与编辑SDK,定制专属视频解决方案

无论是社交媒体营销、产品展示、教育培训还是直播电商&#xff0c;高质量的视频内容都是吸引眼球、传递信息的关键。美摄科技&#xff0c;作为视频编辑处理领域的佼佼者&#xff0c;以其强大的视频拍摄与编辑SDK&#xff0c;为企业开启了视觉创意的新篇章。 【专业级功能&…

web3d值得学习并长期发展,性价比高吗?

在数字化浪潮日益汹涌的今天&#xff0c;Web3D技术以其独特的魅力和广泛的应用前景&#xff0c;逐渐成为技术领域的焦点。对于许多热衷于技术探索和创新的人来说&#xff0c;学习并长期发展Web3D技术无疑是一个值得考虑的选择。那么&#xff0c;Web3D技术的学习和发展究竟是否性…

07 JSP

文章目录 JSP1、JSP 概述2、JSP 脚本和缺点3、EL 表达式4、JSTL标签5、MVC模式和三层架构6、案例 JSP 1、JSP 概述 JSP&#xff08;全称&#xff1a;Java Server Pages&#xff09;&#xff1a;Java 服务端页面 &#xff08;1&#xff09;是一种动态的网页技术 &#xff08;2&…

【C++高阶】哈希之美:探索位图与布隆过滤器的应用之旅

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ ⏩收录专栏⏪&#xff1a;C “ 登神长阶 ” &#x1f921;往期回顾&#x1f921;&#xff1a;模拟实现unordered 的奥秘 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀哈希应用 &#x1f4…