自动创作PPT 利用提示词和大模型自动创建ppt

背景

ppt创作可以分为3个步骤:1.大纲撰写;2.内容填充;3.ppt实现。我前几天用十分钟的时间做了一个ppt,主讲大模型测评。这里给大家分享一下我的创作过程。

关于步骤1和步骤2,最近发现一个非常好的提示词,能够帮助模型更好的思考,并给出逻辑完备的大纲和内容填充。关于步骤3,我发现了几个好用的网站,最后会议并分享给大家。

步骤1:大纲撰写

1.1 提示词

我使用kimi探索版完成相关任务。创作大纲,你可以使用以下的提示词帮助模型思考、反思、创作。

您是一个旨在提供详细的、逐步的回答的Al助手。您的输出应遵循以下结构:
1.<thinking>部分开始。
2.在思考部分内:a.简要分析问题并概述您的方法。b.提出一个清晰的解决问题的步骤计划。c.如有必要,使用"思维链"推理过程,将您的思考过程分解为编号的步骤。
3.为每个想法包含一个<reflection>部分,其中您要:a.回顾您的推理。b.检查潜在的错误或疏忽。c.如有必要,确认或调整您的结论。
4.确保关闭所有反思部分。
5.</thinking>结束思考部分。
6.<output>部分提供您的最终答案。
在您的回答中始终使用这些标签。在您的解释中要彻底,展示您推理过程的每一步。努力使您的方法精确和合乎逻辑,不要犹豫将复杂问题分解为更简单的组成部分。您的语气应该是分析性的,稍微正式一些,重点是清晰地传达您的思维过程。
记住:<thinking><reflection>必须是标签,并且必须在结束时关闭。确保所有<标签>都在单独的行上,没有其他文本。不要在包含标签的行上包含其他文本。
请帮我解决这个问题:请撰写大纲,介绍大模型评估方面的知识。

1.2 模型输出思考过程

使用该提示词,模型会首先输出思考过程:

<thinking>
a. 分析问题并概述方法:
用户要求撰写一个大纲,介绍大模型评估方面的知识。为了满足这个需求,需要涵盖大模型评估的基本概念、评估方法、指标、工具以及当前的挑战和未来发展方向。b. 解决问题的步骤计划:
介绍大模型评估的背景和重要性。
详细描述大模型评估的主要维度和类别。
介绍常用的评估方法和指标。
讨论大模型评估的工具和平台。
分析当前大模型评估面临的挑战。
展望大模型评估的未来发展方向。c. 思维链推理过程:
背景和重要性:解释为什么大模型评估是必要的,以及它在AI发展中的角色。
评估维度和类别:列出并解释不同的评估维度,如知识和能力评测、对齐评测、安全评测等。
评估方法和指标:详细介绍各种评估方法和指标,如BLEU、ROUGE、F1分数等。
工具和平台:介绍一些常用的大模型评估工具和平台,如OpenCompass、FlagEval等。
当前挑战:讨论大模型评估中存在的问题,如数据标注困难、评估成本高等。
未来方向:展望大模型评估的潜在发展方向,如动态评测、智能体评测等。
<reflection>a. 回顾推理:
上述步骤涵盖了大模型评估的各个方面,从背景到具体方法,再到工具和未来展望,确保了内容的全面性和逻辑性。b. 检查潜在的错误或疏忽:
需要确保每个部分都有足够的详细信息,并且逻辑上前后连贯。同时,确保引用的内容准确无误。c. 确认或调整结论:
当前的步骤计划合理且全面,可以按照这个大纲进行详细撰写。</reflection> 
</thinking>

1.3 模型生成大纲

然后,模型会生成以下的大纲:

<output>
大模型评估大纲
1. 背景和重要性
1.1 大模型的定义和发展
1.2 大模型评估的必要性
1.3 大模型评估在AI发展中的角色2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
2.1.2 知识补全能力评测
2.1.3 推理能力评测
2.1.4 工具学习能力评测
2.2 对齐评测
2.2.1 道德和伦理评测
2.2.2 偏见性评测
2.2.3 毒性评测
2.2.4 诚实性评测
2.3 安全评测
2.3.1 鲁棒性评测
2.3.2 风险评测
2.4 行业大模型评测
2.4.1 生物 & 医疗
2.4.2 教育
2.4.3 法律
2.4.4 计算机
2.4.5 金融
2.5 综合评测组织
2.5.1 评测基准
2.5.2 评测平台和排行榜3. 评估方法和指标
3.1 直接评估指标
3.1.1 BLEU
3.1.2 ROUGE
3.1.3 F1分数
3.2 基于辅助模型的评估
3.2.1 QAEval
3.2.2 QuestEval
3.3 基于模型的评估
3.3.1 Perplexity
3.3.2 Generation-based methods4. 工具和平台
4.1 OpenCompass
4.1.1 概述和特点
4.1.2 安装和使用
4.1.3 评测结果可视化
4.2 FlagEval
4.2.1 概述和特点
4.2.2 使用方法
4.3 其他评估工具
4.3.1 Scikit-learn
4.3.2 TensorFlow 和 Keras
4.3.3 PyTorch
4.3.4 Hugging Face Transformers5. 当前挑战
5.1 数据标注困难
5.2 评估成本高
5.3 标准答案的多样性和复杂性
5.4 真实应用场景中的表现难以评估6. 未来发展方向
6.1 动态评测
6.2 智能体评测
6.3 风险评测
6.4 以优化大模型为目标的评测
</output>

可以看到,生成的大纲非常的全面,除了章节4.3之外,基本满足了我作为一个计算机专业人员的需求。

不是用相关提示词,大纲如下:

大纲:大模型评估知识
一、引言
背景介绍:大模型在人工智能领域的重要性及其广泛应用。
评估的必要性:确保模型的可靠性、安全性、公平性和实际应用效果。
二、评估动力与需求
技术创新推动:通过评估发现模型的优势和局限性,推动技术进步。
实际应用验证:验证模型在实际场景中的表现。
安全性与合规评估:确保模型在使用过程中不产生潜在危害。
用户体验提升:通过评估优化用户交互体验。
三、评估维度与框架
文本理解:文本分类、命名实体识别、信息抽取等。
文本生成:摘要生成、文本改写、作文生成等。
知识掌握:学科知识问答、常识推理等。
逻辑推理:逻辑推理、数学计算等。
多模态能力:视觉问答、视觉推理、图文一致性等。
智能性与鲁棒性:指令跟随能力、思维链能力、鲁棒性等。
四、评估方法
人工评估:通过人类专家对模型输出进行定性和定量评估。
自动评估:基于规则或模型的自动化评估方法。
Rule-based方法:基于预定义规则的评估。
Model-based方法:使用裁判员模型或对等评估的方法。
五、评估指标
基础评估指标:准确率、召回率、F1分数等。
高级评估指标:BLEU、ROUGE、METEOR等。
RAI指标:评估模型的责任性,包括公平性、安全性等。
应用场景评估指标:根据具体应用场景定制的评估指标。
六、评估工具与平台
Azure AI Studio:用于构建、评估和部署大模型的平台。
Prompt Flow:简化大模型应用开发的工具。
Weights & Biases:用于跟踪实验和评估模型性能的平台。
LangSmith:帮助跟踪和评估大模型应用的平台。
TruLens:用于神经网络评估和监控的工具。
Vertex AI Studio:评估生成式AI模型的平台。
Amazon Bedrock:支持大模型评估的Amazon平台。
七、评估挑战与未来展望
评估数据集构建:高质量评估数据集的构建及其挑战。
动态评估:持续更新测试样本和评估方法。
智能体评估:在模拟环境中评估大模型的自主性和风险。
以优化为目标的评估:不仅给出评分,还提供改进建议。
八、总结
全面性与公正性:未来评估体系的发展方向。
行业结合:针对不同领域的需求制定专门的评估标准。
持续改进:随着技术发展不断更新和完善评估体系

1.4 效果分析

以评估方法和指标为例,前者说得更详细,例如关于模型评估,前者详细的说出了方法名字“QAEval”,而后者只是一笔带过,这说明前者更加专业。前者更像大纲,后者写了很多具体内容,这些内容应该在步骤2实现,这说明提示词帮助模型更好的理清了我的需求。前者的章节5,也比后者的章节7更加提纲挈领。

步骤2:内容填充

在内容撰写的时候,你可以直接把大纲丢给模型,让模型生成相关内容。

你也可以参照步骤1中的方法,把1.1中的提示词和1.3中的大纲结合起来,重新提问(你可以每次让模型写一个小章节,也可以让模型一口气完成6个章节的思考和撰写,前者效果更好)。我让模型每次撰写一个章节,以章节2“评估维度和类别”为例(这里仍然使用kimi探索版):

2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
问答能力评测主要评估大模型在回答问题时的准确性和流畅性。
常用的评测工具包括QAEval、QAFactEval和QuestEval,分别关注答案的质量、事实准确性和信息完整性。
评估指标包括精确度、召回率和F1分数等。复杂问答任务中,模型需要展示出色的多跳推理和低资源语言处理能力。2.1.2 知识补全能力评测
知识补全能力评测考察模型掌握大量事实性知识的能力。
常用的方法和基准包括LAMA(使用完形填空形式的知识探针评估语言模型中的关系知识)、Kola(针对世界知识的大规模中文评测基准)和WikiFact(基于维基百科构建的事实准确性评估方法)。
这些方法帮助评估模型在知识问答和知识补全任务中的表现。

步骤3:ppt实现

你可以使用以下几个软件来撰写ppt。你可以把步骤2中文字内容发给他们。个人使用了gamma。

islide、
Kimi、
gamma、
wps的AI生成、
MotionGO、
mindshow、
博思AI PPT、
腾讯文档、
canva:https://www.canva.com/design/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/57701.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【AscendC算子开发】笔记1 算子开发哲学

重看这门课&#xff0c;有很多内容的认识更深了&#xff0c;做一些记录。 为什么不能将网络节点融合 这个问题关联到另一个问题&#xff1a;为什么我们需要激活函数&#xff1f; 使用线性的神经元堆叠得到的方程最后也是线性方程&#xff0c;无法表征非线性的信息&#xff0c…

一文1800字从0到1浅谈web性能测试!

什么是性能测试&#xff1f; web性能应该注意些什么&#xff1f; 性能测试&#xff0c;简而言之就是模仿用户对一个系统进行大批量的操作&#xff0c;得出系统各项性能指标和性能瓶颈&#xff0c;并从中发现存在的问题&#xff0c;通过多方协助调优的过程。而web端的性能测试…

基于知识图的电影推荐系统

&#x1f3ac; 毕设灵感——“基于知识图谱的电影推荐系统”&#x1f680; &#x1f449; 如果你的毕业设计还没有灵感&#xff0c;那么这个基于知识图谱的电影推荐系统绝对值得参考&#xff01;这不是普通的推荐系统&#xff0c;而是通过知识图谱大数据的结合&#xff0c;来为…

Genmo 的 Mochi1 AI 视频生成技术:内容创作的新纪元

Genmo 的 Mochi1 AI 视频生成技术&#xff1a;内容创作的新纪元 随着 AI 技术的快速发展&#xff0c;AI 视频生成工具已经成为许多创作者的重要工具。Genmo 最新推出的 Mochi1 技术&#xff0c;作为一款开源的 AI 视频生成工具&#xff0c;为内容创作者提供了极具创新性的视频…

详解:CentOS 7 NAT模式的网络配置

打开虚拟机发现并没有网络选项 一、解决虚拟机ping通主机 解决方法1&#xff1a; 启动VMware NAT Service &#xff08;1&#xff09;首先查看主机的ip地址&#xff0c;winR打开搜索框&#xff0c;输入cmd &#xff08;2&#xff09;输入ipconfig查看网络配置信息 ipcon…

Bug:通过反射修改@Autowired注入Bean的字段,明确存在,报错 NoSuchFieldException

【BUG】通过Autowired注入了一个Bean SeqNo&#xff0c;测试的时候需要修改其中的字段。通过传统的反射&#xff0c;无论如何都拿不到信息&#xff0c;关键是一方面可以通过IDEA跳转&#xff0c;一方面debug也确实能看到这个字段。但是每次调用set方法报错&#xff1a;NoSuchFi…

腾讯云轻量服务器Lighthouse的前世今生

目录 序一、名字的由来二、Lighthouse的定位是什么&#xff0c;与CVM的差异化有哪些三、Lighthouse是如何实现简单易用的四、Lighthouse对于开发者有哪些具体的利好 序 印象中&#xff0c;腾讯云轻量应用服务器Lighthouse是在2020年正式上线的。 在其一经推出后&#xff0c;就…

【C++进阶】之C++11的简单介绍(三)

&#x1f4c3;博客主页&#xff1a; 小镇敲码人 &#x1f49a;代码仓库&#xff0c;欢迎访问 &#x1f680; 欢迎关注&#xff1a;&#x1f44d;点赞 &#x1f442;&#x1f3fd;留言 &#x1f60d;收藏 &#x1f30f; 任尔江湖满血骨&#xff0c;我自踏雪寻梅香。 万千浮云遮碧…

Vue项目实战-新能源汽车可视化(一)(持续更新中)

一.项目代码 1.App.vue <template><!-- 模板--><div id"wrapper"><div style"width: 100%"><el-tabs v-model"activeName" id"tabs"> <!-- 标签栏里包含了三个标签面板&#xff0c;分别是研发与维…

web前端-html:简单创建表格表单相结合的网页

效果&#xff1a; <body><form action"这里如果为空表单提交后不会有任何操作"method"get"<label for"edit">用户名</label><input type"text" name"用户名" id"最好不要空&#xff0c;id属性…

【论文学习与撰写】论文里配图的题注、多张图片同列排版格式等

目录 1、插入题注 2、多张图排版 1、插入题注 word--引用--插入题注&#xff0c;就会出来这个 直接点确定的话&#xff0c;是会出来图1/图2/图3.。。。之类的 那是因为标签设置的是 图 如图新建标签为&#xff1a; 图 1. 那么&#xff0c;插入题注之后&#xff0c;就会…

【分立元件】贴片电阻的额定功率

贴片电阻器通过电流后将会发热。而贴片电阻的额定功率(Power Rating)是在额定环境温度中可在连续工作状态下使用的最大功率值。 此外,由于使用温度的上限是确定的,因此在高于额定环境温度的条件下使用时,需要按照以下的功率降额曲线来降低功率。额定环境温度是能够…

ionic Capacitor 生成 Android 应用

官方文档 https://ionic.nodejs.cn/developing/android/ https://capacitorjs.com/docs/getting-started 1、创建新的 Capacitor 应用程序 空目录下面 npm init capacitor/app2、install Capacitor npm install npm start在这里插入图片描述 3、生成dist目录 npm run buil…

SpringBoot篇(缓存层)

目录 前言 缓存是什么&#xff1f; 一、SpringBoot内置缓存解决方案 1. 简介 2. 手机验证码案例 二、SpringBoot整合Ehcache缓存 1. 简介 2. 总结 三、SpringBoot整合Redis缓存 1. 简介 2. 总结 四、SpringBoot整合Memcached缓存 1. 简介 2. 安装 3. 变更缓存为M…

5G 现网信令参数学习(1) - MIB

MIB消息中的参数 systemFrameNumber 000101B, subCarrierSpacingCommon scs30or120, ssb-SubcarrierOffset 6, dmrs-TypeA-Position pos2, pdcch-ConfigSIB1 { controlResourceSetZero 10, searchSpaceZero 4 }, cellBarred notBarred, intraFreqReselection allowed, sp…

1024程序员节特惠题解!

#题外话&#xff1a;/ #先看题目 题目传送门https://www.luogu.com.cn/problem/P1035#思路&#xff1a;直接模拟&#xff08;Shift1&#xff09; #代码&#xff1a; #include <bits/stdc.h> using namespace std; int main(){double cnt0,k,sum0,x;cin>>k;while…

2.1 > Shell 是什么、如何更熟练的使用 Bash Shell

Shell 基础知识 Shell是计算机操作系统中的一个命令行解释器&#xff0c;由C语言编写&#xff0c;用于用户与操作系统之间进行交互。用户可以通过Shell输入命令&#xff0c;操作系统接收到这些命令后执行相应的操作。Shell一般还提供了编程语言的基本功能&#xff0c;允许用户…

【Mac 上将 MOV 格式转换为 MP4 格式的简易指南】

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

R语言笔记(四):函数

文章目录 一、Function basics1、Creating your own function2、Function structure3、Using your created function4、Multiple inputs5、Default inputs 二、Return values and side effects1、Returning more than one thing2、Side effectsExample of side effect: plot 三…

从零开始学python必看,最强“Python编程三剑客(pdf)”

目录 三剑客PDF传送门&#xff1a;三剑客 第一本&#xff1a;《Python编程&#xff1a;从入门到实践》 1.1《Python编程&#xff1a;从入门到实践》第一部分&#xff1a;基础知识 1.2《Python编程&#xff1a;从入门到实践》第二部分&#xff1a;项目 第二本&#xff1a;《…