简单理解机器学习中top_k、top_p、temperature三个参数的作用

AI系列文章:
AWS AI认证考试中经常提及几个重要的工具介绍

简单理解机器学习中top_k、top_p、temperature三个参数的作用

用Deepseek + Kimi 快速生成高质量的ppt

在机器学习中,top_k、top_p 和 temperature 是用于控制生成模型(如语言模型)输出质量的参数,尤其在文本生成任务中常见。然而,网上文章很多很全,但大多晦涩难懂,今天我们来用最简单的语言谈谈它们的具体作用:

1. 点菜式筛选法:top_k参数

英文全称:top-k

中文名称:前k个

具体意义:

top_k参数就像是你在餐厅点菜时,服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中,top_k参数用于限制模型在每个词生成时考虑的候选词数量。当设置top_k=n时,模型会从预测概率最高的n个词中随机挑选一个作为下一个生成的词。

举例说明:

假设我们要让AI续写“举头望明月”,如果设置top_k=3,AI可能会从以下候选词中选择一个:

低头思故乡(概率58%)

对影成三人(概率27%)

疑似地上霜(概率10%)

这时,AI生成的句子很可能是“举头望明月,低头思故乡”,既符合语境又经典。但如果设置top_k=50,就可能出现一些意想不到的组合,比如“举头望明月,外卖还没到”,这样的句子虽然有趣,但可能并不符合我们的预期。

2. 智能购物车模式:top_p参数

英文全称:top-p(有时也被称为Nucleus Sampling,即核采样)

中文名称:前p%

具体意义:

top_p参数则更像是你在超市购物时,设定了一个预算上限。当购物车里的商品总价达到这个上限时,你就停止购物。在AI文本生成中,top_p参数用于限制模型考虑的候选词的累积概率。当设置top_p=p时,模型会选取累积概率达到p%的候选词作为可选范围,然后从中随机挑选一个。

举例说明:

假设我们要让AI续写“人工智能将”,如果设置top_p=0.9,AI可能会从以下候选词中选择:

改变世界(45%)

引领未来(30%)

替代人类(15%)

帮我写作业(10%)

做蛋炒饭(5%)

这时,AI会考虑累积概率达到90%的候选词,即前四个词,并自动过滤掉“做蛋炒饭”这种低概率且不太相关的词。最终生成的句子可能是“人工智能将改变世界,引领未来”,既专业又合理。

3. 创意温度计:temperature参数

具体意义:

temperature参数就像是你调节火锅火力的开关。低温时,火锅清汤寡水,味道保守;高温时,火锅麻辣鲜香,味道多变。在AI文本生成中,temperature参数用于控制模型生成文本的随机性。低温值使模型生成更保守、更确定的文本;高温值则使模型生成更随机、更多样化的文本。

举例说明:

低温(0.2):生成如“床前明月光,疑是地上霜”这种稳妥诗句,适合写公文或正式文件。

中温(0.7):可能产出如“月光洒键盘,代码写成诗”的跨界组合,适合写广告文案或创意写作。

高温(1.2):会创造如“明月照冰箱,剩菜在发光”的神奇脑洞,适合写玄幻小说或进行脑暴创意。

参数组合实战案例

生成情人节文案:

保守方案:top_p=0.8 + temperature=0.3 → 生成如“你是我心中的日月星辰,永远照亮我前行的路”这样稳妥而深情的文案。

创意方案:top_k=20 + temperature=0.9 → 生成如“我们的爱情,就像WiFi满格,无论走到哪里都不断线”这样富有创意的比喻。

脑洞方案:top_p=0.95 + temperature=1.5 → 生成如“在平行宇宙的咖啡厅,我点了杯加糖的量子纠缠,只为与你共享这份跨越时空的甜蜜”这样充满奇幻色彩的文案。

综合使用:找到生成文本的完美平衡

在实际应用中,我们通常会结合使用这三个参数,以找到生成文本的完美平衡。比如:

对于学术论文或技术文档的生成,可以设置较低的top_k(如5)、top_p(如0.8)和temperature(如0.2),以确保生成内容严谨、逻辑性强。

对于创意写作或诗歌生成,则可以设置较高的top_k(如50)、top_p(如0.9)和temperature(如1.2),以生成内容丰富多彩、富有诗意的文本。

总结

top_k: 限制候选词数量,提升文本质量。

top_p: 动态调整候选词集,平衡质量与多样性,想创意高点,top_p就大点。

temperature: 控制生成文本的随机性,影响文本的确定性与多样性。温度高就多样性高,确定性低。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

红宝书第十三讲:详解JavaScript核心对象:Array、Object、Date、RegExp

红宝书第十三讲:详解JavaScript核心对象:Array、Object、Date、RegExp 资料取自《JavaScript高级程序设计(第5版)》。 查看总目录:红宝书学习大纲 一、Object:万物皆对象的“盒子” Object是JavaScript中…

昆仑技术重构AI大模型落地范式,长期作“加法”迎来国产生态化“拐点”

作者 | 曾响铃 文 | 响铃说 DeepSeek的爆火,在业内迅速掀起了一场国产化的变革。“国产大模型国产算力”软硬协同的范式正在被重构,AI产业国产化的含金量持续提升,越来越多的企业在这一趋势下加速走上数智化转型路径。 其中,以…

原开源鸿蒙仓库停止更新

2月24日,gitee 上的开源鸿蒙组织,所有代码停止更新,查看代码仓显示已关闭,不少小伙伴以为停止更新了,发生了什么? 原因很简单,所有代码仓迁移至 Gitcode,至于为什么改用 Gitcode&…

Spring Boot框架中常用注解

以下是Spring Boot框架中常用注解的详细说明,包括名称、用途、用法、使用位置及扩展示例,按功能模块分类整理: 一、核心启动与配置注解 1. SpringBootApplication 用途:主启动类注解,整合了 Configuration、EnableAu…

Azure Delta Lake、Databricks和Event Hubs实现实时欺诈检测

设计Azure云架构方案实现Azure Delta Lake和Azure Databricks,结合 Azure Event Hubs/Kafka 摄入实时数据,通过 Delta Lake 实现 Exactly-Once 语义,实时欺诈检测(流数据写入 Delta Lake,批处理模型实时更新&#xff0…

车载以太网网络测试 -23【TCPUDP通信示例】

1 摘要 在车载通信场景中,TCP以及UDP的通信可以用于多种应用,例如车辆状态监控、远程控制、数据采集等。以下是详细的代码示例,展示了如何使用Python实现简单的TCP客户端与服务端通信以及简单的UDP客户端与服务端通信,并模拟了车…

SpringBoot大学生竞赛管理系统设计与实现

一个用于管理大学生竞赛报名、信息查询与竞赛管理的系统,采用了现代化的SpringBoot框架进行开发。该系统的主要功能包括学生信息管理、教师信息管理、竞赛报名审核、竞赛信息管理等模块,适用于学校或教育机构进行竞赛活动的组织与管理。系统界面简洁&…

深入解析libsunrpc:构建分布式系统的核心RPC库

深入解析libsunrpc:构建分布式系统的核心RPC库 引言 在分布式系统开发中,远程过程调用(Remote Procedure Call, RPC) 是连接不同节点、实现跨网络服务调用的关键技术。作为SUN公司开源的经典RPC实现,libsunrpc 凭借其…

MinIO搭建部署

1、命令行安装 访问monio官网下载应用程序 # wget https://dl.min.io/server/minio/release/linux-amd64/archive/minio-20250228095516.0.0-1.x86_64.rpm -O minio.rpm # sudo dnf install minio.rpm # mkdir ~/minio # minio server ~/minio --console-address :90012、dock…

Linux修改SSH端口号

我这里那RedHat系列的操作系统举例,修改SSH端口号 修改SSH配置文件:/etc/ssh/sshd_config,将端口号修改为2222.vim /etc/ssh/sshd_config重启SSH服务systemctl restart sshd# 如果是比较旧的OS,使用下面的命令重启 service ssh restart验证端口更改是否成功netstat -tulnp …

【嵌入式Linux】基于ArmLinux的智能垃圾分类系统项目

目录 1. 功能需求2. Python基础2.1 特点2.2 Python基础知识2.3 dict嵌套简单说明 3. C语言调用Python3.1 搭建编译环境3.2 直接调用python语句3.3 调用无参python函数3.4 调用有参python函数 4. 阿里云垃圾识别方案4.1 接入阿里云4.2 C语言调用阿里云Python接口 5. 香橙派使用摄…

【商城实战(63)】配送区域与运费设置全解析

【商城实战】专栏重磅来袭!这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建,运用 uniapp、Element Plus、SpringBoot 搭建商城框架,到用户、商品、订单等核心模块开发,再到性能优化、安全加固、多端适配&#xf…

字节跳动实习生主导开发强化学习算法,助力大语言模型性能突破

目录 禹棋赢的背景与成就 主要成就 DAPO算法的技术细节 算法优势 禹棋赢的研究历程 关键时间节点 字节跳动的“Top Seed人才计划” 计划特点 小编总结 在大模型时代,经验不再是唯一的衡量标准,好奇心、执行力和对新技术的敏锐洞察力成为推动技术…

Rust + 时序数据库 TDengine:打造高性能时序数据处理利器

引言:为什么选择 TDengine 与 Rust? TDengine 是一款专为物联网、车联网、工业互联网等时序数据场景优化设计的开源时序数据库,支持高并发写入、高效查询及流式计算,通过“一个数据采集点一张表”与“超级表”的概念显著提升性能…

使用LangChain实现基于LLM和RAG的PDF问答系统

目录 前言一.大语言模型(LLM)1. 什么是LLM?2. LLM 的能力与特点 二、增强检索生成(RAG)三. 什么是 LangChain?1. LangChain 的核心功能2. LangChain 的优势3. LangChain 的应用场景4. 总结 四.使用 LangChain 实现基于 PDF 的问答系统 前言 本文将介绍 …

群核科技持续亏损近18亿:营销费用偏高,市场份额优势面临挑战

《港湾商业观察》施子夫 2025年开年,DeepSeek的爆火让大众将目光聚焦到了“杭州六小龙”。其中,杭州群核信息技术有限公司(以下简称,群核科技)因系“六小龙”中首家启动上市的公司而被外界更多关注。 在此次递表港交…

java版嘎嘎快充玉阳软件互联互通中电联云快充协议充电桩铁塔协议汽车单车一体充电系统源码uniapp

演示: 微信小程序:嘎嘎快充 http://server.s34.cn:1888/ 系统管理员 admin/123456 运营管理员 yyadmin/Yyadmin2024 运营商 operator/operator2024 系统特色: 多商户、汽车单车一体、互联互通、移动管理端(开发中) 另…

音视频学习(三十):fmp4

FMP4(Fragmented MP4)是 MP4(MPEG-4 Part 14)的扩展版本,它支持流式传输,并被广泛应用于DASH(Dynamic Adaptive Streaming over HTTP)和HLS(HTTP Live Streaming&#xf…

26考研——图_图的存储(6)

408答疑 文章目录 二、图的存储图的存储相关概念邻接矩阵存储方式邻接矩阵的定义顶点的度计算邻接矩阵的特点邻接矩阵的局限性 应用场景邻接矩阵的幂次意义(了解即可) 邻接表存储方式邻接表定义邻接表结构邻接表的特点 邻接矩阵和邻接表的适用性差异十字…

以高斯(GaussDB) 为例, 在cmd 命令行连接数据,操作数据库,关闭数据库的详细步骤

以下是使用 Windows 命令行(cmd) 操作 GaussDB(以 GaussDB(for openGauss) 社区版为例) 的详细步骤,涵盖 连接数据库、基本操作、关闭数据库 的全流程: 1. 环境准备 前提条件: 安装 GaussDB&a…