openai类模型的超参数含义

model: 模型名
frequency_penalty
Number between -2.0 and 2.0. Positive values penalize new tokens based on their existing frequency in the text so far, decreasing the model’s likelihood to repeat the same line verbatim.
该参数的值范围为-2.0到2.0。正值会对新token进行惩罚,基于其在当前文本中的出现频率,从而减少模型重复相同行的可能性。

logit_bias
修改指定token在生成文本中的出现概率。
接受一个JSON对象,将token(通过其在tokenizer中的ID指定)映射到一个-100到100之间的偏差值。数学上,这个偏差值会在采样前添加到模型生成的logits中。具体效果因模型而异,但-1到1之间的值会略微减少或增加选择的可能性;-100或100这样的值应导致相关token被禁止或被唯一选择。

logprobs
该参数用于决定是否返回输出token的log概率。如果设置为true,将返回消息内容中每个输出token的log概率。

top_logprobs
一个在0到20之间的整数,指定在每个token位置返回最有可能的token数量,每个token都附带其log概率。如果使用此参数,必须将logprobs设置为true。

max_tokens
生成的聊天内容中最大token数量。
输入token和生成token的总长度受模型的上下文长度限制。

n:
指定为每条输入消息生成的聊天完成选项数量。

presence_penalty
Number between -2.0 and 2.0. Positive values penalize new tokens based on whether they appear in the text so far, increasing the model’s likelihood to talk about new topics.
一个介于 -2.0 和 2.0 之间的数值。正值会基于新token是否已出现在已有文本中对其进行惩罚,从而增加模型讨论新话题的可能性。

response_format
设置为{ "type": "json_object" }可以启用JSON模式,确保模型生成的消息是有效的JSON。

重要提示:使用JSON模式时,你必须通过系统或用户消息指示模型生成JSON,否则模型可能会生成无限的空白,直到达到token限制,导致请求长时间运行且看似“卡住”。如果finish_reason为“length”,表示生成超过max_tokens或对话超过最大上下文长度,消息内容可能会部分被截断。

seed
指定时,系统会尽力按确定性采样,相同的seed和参数应返回相同结果。

stop(字符串/数组/null):可选,默认null。最多4个序列,API在生成这些序列时停止。

stream(布尔值或null):可选,默认false。设置后,会像ChatGPT那样发送部分消息delta,生成的token以数据服务器发送事件形式发送,终止时发送data: [DONE]消息。

top_p(数值或null):可选,默认1。采样替代方法,称为核采样,模型考虑top_p概率质量的token结果。0.1表示仅考虑组成前10%概率质量的token。

top_k:
指只保留概率最高的前k个单词,然后基于剩余单词的概率进行归一化,从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度,并仍然保持样本的一定多样性。

参考:
https://blog.csdn.net/qq_18555105/article/details/130355217
https://platform.openai.com/docs/api-reference/chat/create

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/35774.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国家自然科学基金标书大全(2002-2024)

数据来源:在20世纪80年代初,为了促进中国的科技体制革新并改革科研资金分配机制,中国科学院的89位院士联名向党和国家领导人提出建议,设立了国家自然科学基金的设立。国自然基金自创立以来,根据国家发展科学技术方针、…

Vue配置项data

data 目录 data 目录类型介绍关键原理编译过程 Vue2Vue3 📌Vue.js 中的 data(Obj/Function)属性是 Vue 实例的一个配置选项 类型介绍 对象式 对于根实例或者非复用组件,通常直接提供一个对象字面量作为 data 的值。在对象式中…

Follow Carl To Grow|【LeetCode】491.递增子序列,46.全排列,47.全排列 II

【LeetCode】491.递增子序列 题意:给你一个整数数组 nums ,找出并返回所有该数组中不同的递增子序列,递增子序列中 至少有两个元素 。你可以按 任意顺序 返回答案。 数组中可能含有重复元素,如出现两个整数相等,也可以…

dataguard 主备切换方式switchover 和 failover 操作步骤

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG数据库运维(如安装迁移,性能优化、故障应急处理等) 公众号:老苏畅谈运维 欢迎关注本人公众号,更多精彩与您分享。datagu…

SpringBoot整合拦截器和日期转换器

一、SpringBoot整合拦截器 1.添加拦截器 package com.by.interceptor;import com.by.pojo.User; import org.springframework.stereotype.Component; import org.springframework.web.servlet.HandlerInterceptor;import javax.servlet.http.HttpServletRequest; import java…

一文读懂充电桩平台如何实现分账:汇付是如何实现分账的

汇付实现分账的方式是通过多方分账功能和延时分账模式,结合接口与控台操作来实现灵活的资金分配和高效结算。 【慧哥开源充电桩平台】下载源码地址 https://liwenhui.blog.csdn.net/article/details/134773779?spm1001.2014.3001.5502 在当前支付环境中&#xff0c…

【ARM】内存属性Memory Attributes (MemAttr)

目录 1. EWA 2. Device 3. Cacheable 4. Allocate 5. 内存属性的传播 6. 事务属性组合 7. Memory Type 内存属性Memory Attributes (MemAttr) 包含Early Write Acknowledgment (EWA), Device, Cacheable, 以及Allocate。 1. EWA EWA,Early Write Acknowledg…

AI自动生成角色和情节连续的漫画,中山大学联想提出AutoStudio,可以多轮交互式连续生成并保持主题一致性。

中山大学和联想研究院提出AutoStudio: 是一种无需训练的多代理框架,用于多轮交互式图像生成,能够在生成多样化图像的同时保持主体一致性。 AutoStudio 采用三个基于 LLM 的智能体来解释人类意图并为 SD 模型生成适当的布局指导。此外,还引入…

微软代码页标识符 (Code Page Identifiers)

代码页标识符 (Code Page Identifiers) 双语对照 Identifiere标识符.NET Name.NET 名称Additional information其他信息037IBM037IBM EBCDIC US-CanadaIBM EBCDIC US-Canada437IBM437OEM United StatesOEM 美国500IBM500IBM EBCDIC InternationalIBM EBCDIC 国际字符集708ASMO…

让AI保持怪异

让AI保持怪异 Anthropic的创意技术专家和员工设计师凯尔图尔曼(Kyle Turman)分享了一种深深引起共鸣的观点。他说(转述原话):“人工智能实际上真的很奇怪,我认为人们对这一点的认识还不够。”这引发了我向小组提出的问题:我们是否有消毒人工智能固有的陌生感的风险?…

python-序列相关

序列(squence)是一组按顺序、紧密排列在一起的数据集。序列的作用是便于管理、方便数据操作更重要的是序列支持切片操作。 序列主要包括:列表、元组、字符串和字节串 内置数据结构: 容器:列表、元组、字典、集合 结构…

Chromium 调试指南2024 Mac篇 - 准备工作 (一)

1.引言 Chromium是一个由Google主导开发的开源浏览器项目,它为Google Chrome浏览器提供了基础框架。Chromium不仅是研究和开发现代浏览器技术的重要平台,还为众多其他基于Chromium的浏览器(如Microsoft Edge、Brave等)提供了基础…

atcoder abc 359

A count takahashi 问题: 思路&#xff1a;字符串比较 代码&#xff1a; #include <bits/stdc.h>using namespace std;int main() {int n;cin >> n;int ans 0;for(int i 1; i < n; i ) {string s;cin >> s;if(s[0] T) ans ;}cout << ans;re…

命令ifconfig-显示网络接口的当前状态

ifconfig是一个在类Unix系统中用于配置网络接口的命令行工具。它可以用来显示网络接口的当前状态&#xff0c;或者设置网络接口的参数&#xff0c;如IP地址、子网掩码、MAC地址等。 基本用法 显示所有网络接口的信息&#xff1a; ifconfig显示特定网络接口的信息&#xff1a…

Android 多媒体开发——Media3与MediaSession最全使用指南

一、Media3库简介 1.1 Media3是什么&#xff1f; 官方释义&#xff1a; Jetpack Media3 is the new home for media libraries that enables Android apps to display rich audio and visual experiences. Media3 offers a simple architecture with powerful customization,…

软考出成绩了,速查,查分方式看这里

各位考生&#xff0c;软考出成绩啦&#xff01;大家赶紧查一下&#xff0c;各科都45分就是通过&#xff01; 软考成绩查询入口已开通&#xff0c;此刻你是不是既激动又忐忑&#xff1f;速查&#xff01; ★ 查询网站 中国计算机技术职业资格网https://bm.ruankao.org.cn/sign/…

如何轻松获取 GitLab 指定分支特定路径下的文件夹内容

第一步&#xff1a; 获取 accessToken 及你的 项目 id &#xff1a; 获取 accessToken ,点击用户头像进入setting 按图示操作&#xff0c;第 3 步 填写你发起请求的域名。 获取项目 id , 简单粗暴方案 进入 你项目仓库页面后 直接 源码搜索 project_id&#xff0c; value 就…

记录Gstreamer的uridecodebin可以自动选择硬解码器

记录&#xff1a; uridecodebin3 和uridecodebin优先硬解码 这两个插件&#xff0c;本来是负责动态选择合适的解码器来处理特定的媒体流&#xff0c;使用案例&#xff1a; gst-launch-1.0 uridecodebin urirtsp://192.168.1.120:8554/test ! glimagesink -v gst-launch-1.0 …

Linux通用LInux高危漏洞(CVE-2024-1086)修复案例

一、漏洞描述 2024年3月28日&#xff0c;监 Linux kernel权限提升漏洞&#xff08;CVE-2024-1086&#xff09;的PoC/EXP在互联网上公开&#xff0c;该漏洞的CVSS评分为7.8&#xff0c;目前漏洞细节已经公开披露&#xff0c;美国网络安全与基础设施安全局&#xff08;CISA&…

Java高手的30k之路|面试宝典|精通项目介绍方法优化简历项目介绍

常用项目介绍结构及原因 以下是几个常用的项目介绍结构&#xff0c;以及为什么使用这些结构的原因&#xff1a; 1. STAR 方法 Situation&#xff08;情境&#xff09;&#xff1a;项目的背景和情况。 Task&#xff08;任务&#xff09;&#xff1a;你需要完成的任务。 Actio…