何谓大模型开发?
将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。
主要功能点:
- 调用工具
- prompt engineering
- 数据工程
- 业务逻辑拆分
一般开发流程:
1、确定目标
开发的应用场景、目标人群、核心价值,
tips:确认最小的开发目标,构建一个MVP开始,逐步的完善和优化
2、设计功能
本应用所要提供的功能, 以及每个功能的大体实现逻辑,
tips:约清晰、越深入的业务逻辑理解,往往更能带来好的prompt效果,
确定应用的核心功能,然后衍生出设计功能的上下游功能,
3、搭建整体框架
绝大部分大模型应用都是采用的特定数据库 + Prompt + 通用大模型的架构,构建从用户输入到应用输出的全流程贯通,推荐基于langchain框架开发,提供较多的工具、供大家适用,
4、搭建数据库
个性化大模型应用需要有个性化数据库进行支撑,
数据预处理、向量数据库的搭建,尤其是对错误数据、异常数据的清晰、切片构建出个性化数据库
5、prompt engineering
优质的prompt 对大模型能力具有较大影响,我们需要逐步迭代构建优秀的prompt来提升性能,
tips:需要明确prompt设计的一般原则和技巧, 构建出一个来源于实际业务的小型验证集
6、验证迭代
验证迭代在大模型开发中极其重要的一步,
一般指通过不断发现 Bad Case 并针对性改进 Prompt Engineering 来提升系统效果、应对边界情况。
tips:找到bad case ,并针对性分析prompt存在的问题,从而不断迭代优化,
7、前后端搭建,
验证大语言模型的能力后,接下俩就是搭建前后端,设计产品页面,
8、优化体验
在完成前后端搭建之后,应用就可以上线体验了。
素材来源于datawhale开源学习教程:动手学大模型应用开发,感兴趣的进去点star