当前LLM和VLM在PPT生成任务上已经小有成效,如ChatPPT。
@TOC
1. PPT-LLM
LLM根据用户的instruction生成规范的绘制ppt的API语句:即使是最强的GPT-4 + CoT
也只能达到20-30%的内容准确度。
-
LLM输入:
User_instruction
(当前+过去)、PPT_content
、PPT_reader_API
。其中 PPT_reader_API将 PPT 文件转换为基于文本的格式作为 PPT 文件内容。 -
LLM输出:
API 代码序列
。并执行它以获得预测 PPT 文件。
2. CAD-LLM
参数化计算机辅助设计(CAD)是现代机械设计的主导范式。训练LLM来推理和生成参数化CAD可以显著加快设计工作流程。预训练好的基础模型在自然语言处理和计算机视觉方面取得了巨大的成功。这些模型中嵌入的跨领域知识在理解几何学和执行复杂的设计推理方面具有重要的潜力。
我们可以通过利用预训练过的L