LLM大模型开发的一般流程

何谓大模型开发?

将开发以大语言模型为功能核心、通过大语言模型的强大理解能力和生成能力、结合特殊的数据或业务逻辑来提供独特功能的应用称为大模型开发。

主要功能点:
  • 调用工具
  • prompt engineering
  • 数据工程
  • 业务逻辑拆分

一般开发流程:

在这里插入图片描述

1、确定目标
开发的应用场景、目标人群、核心价值,
tips:确认最小的开发目标,构建一个MVP开始,逐步的完善和优化

2、设计功能
本应用所要提供的功能, 以及每个功能的大体实现逻辑,
tips:约清晰、越深入的业务逻辑理解,往往更能带来好的prompt效果,
确定应用的核心功能,然后衍生出设计功能的上下游功能,

3、搭建整体框架
绝大部分大模型应用都是采用的特定数据库 + Prompt + 通用大模型的架构,构建从用户输入到应用输出的全流程贯通,推荐基于langchain框架开发,提供较多的工具、供大家适用,

4、搭建数据库
个性化大模型应用需要有个性化数据库进行支撑,
数据预处理、向量数据库的搭建,尤其是对错误数据、异常数据的清晰、切片构建出个性化数据库

5、prompt engineering
优质的prompt 对大模型能力具有较大影响,我们需要逐步迭代构建优秀的prompt来提升性能,
tips:需要明确prompt设计的一般原则和技巧, 构建出一个来源于实际业务的小型验证集

6、验证迭代
验证迭代在大模型开发中极其重要的一步,
一般指通过不断发现 Bad Case 并针对性改进 Prompt Engineering 来提升系统效果、应对边界情况。
tips:找到bad case ,并针对性分析prompt存在的问题,从而不断迭代优化,

7、前后端搭建,
验证大语言模型的能力后,接下俩就是搭建前后端,设计产品页面,

8、优化体验
在完成前后端搭建之后,应用就可以上线体验了。

素材来源于datawhale开源学习教程:动手学大模型应用开发,感兴趣的进去点star

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/26670.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

API安全性的重要性及实施策略

在当今日益互联的世界中,API(应用程序编程接口)成为连接不同软件系统的关键桥梁。随着API的使用越来越广泛,其安全性问题也日益凸显。一个不安全的API可能会使企业数据和用户信息面临严重的风险。因此,确保API的安全性…

Perl语言入门学习

引言 Perl是一种功能强大的编程语言,广泛用于文本处理、系统管理和Web开发。它以其灵活性和强大的正则表达式处理能力著称。本篇博客将介绍Perl的基础知识,并通过多个例子帮助初学者快速上手。 1. 安装Perl 在开始学习Perl之前,您需要确保…

Stable diffusion 3 正式开源

6月12日晚,著名开源大模型平台Stability AI正式开源了,文生图片模型Stable Diffusion 3 Medium(以下简称“SD3-M”)权重。 SD3-M有20亿参数,平均生成图片时间在2—10秒左右推理效率非常高,同时对硬件的需求…

贪心+构造,CF1153 C. Serval and Parenthesis Sequence

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 Problem - 1153C - Codeforces 二、解题报告 1、思路分析 对于括号匹配问题我们经典做法是左括号当成1,右括号当成-1 那么只要任意前缀非负且最终总和为0那么该括号序列就是合法 对于本题&…

计算机网络 —— 运输层(TCP三次握手)

计算机网络 —— 运输层(TCP三次握手) 三次握手第一次握手第二次握手第三次握手两次握手行不行? 我们今天来学习TCP的三次握手: 三次握手 TCP三次握手是TCP协议中建立连接的过程,旨在确保双方准备好进行可靠的通信。…

从零开始的<vue2项目脚手架>搭建:vite+vue2+eslint

前言 为了写 demo 或者研究某些问题,我经常需要新建空项目。每次搭建项目都要从头配置,很麻烦。所以我决定自己搭建一个项目初始化的脚手架(取名为 lily-cli)。 脚手架(scaffolding):创建项目时…

本地GPT-window平台 搭建ChatGLM3-6B

一 ChatGLM-6B 介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,新一代开源模型 ChatGLM3-6B 已发布,拥有10B以下最强的基础模型,支持工具调用(Function Call)、代码执行(Code Interpreter&…

gitlab怎么实现将A仓库的新内容推送到B仓库,假设A仓库有1,2文件,B仓库有4,5,6,经过操作后,B仓库有1,2,4,5,6

要求给出两种方法:手动git或者自动化python脚本 文章目录 GPT-4o:手动Git命令实现Python 脚本实现总结 gpt3.5: GPT-4o: 为了将A仓库的新内容(文件1和文件2)推送到B仓库(保留其已有文件4、5、…

webshell获取总结(cms获取方法、非cms获取方法、中间件拿Webshell方法)

目录 前期准备: 1、cookices靶场网站搭建: 2、dedecms靶场环境搭建: 获取Webshell方法总结: 一、CMS获取Webshell方法 二、非CMS获取Webshell方法 1、数据库备份获取Webshell 例如: 2、抓包上传获取Webshell 3、…

新注册与新核准有什么区别?在哪可以找到新注册新核准的企业名单?

新注册:指的是公司刚刚完成工商注册登记,成为法律意义的经营实体。 新核准:指的是企业通过证券监管机构的审核,获得公开发行股票或债券的资格。 注册主要关注企业的基本资质和合规性,而核准是已经注册的公司进行财务…

49.Python-web框架-Django解决多语言redirect时把post改为get的问题

目录 1.背景 2.思路 3.寻找 Find and Replace 4.再次运行程序,POST来了 5.小结 1.背景 昨天在练习一个Django功能时,把form的method设置为POST,但是实际提交时,一直是GET方法。最后发现这是与多语言相关,django前面…

MySQL 8.3.0 主从热备

IP角色版本192.168.140.153主8.3.0192.168.140.159从8.3.0 一、准备环境 1、卸载mariadb rpm -qa | grep mariadb rpm -e mariadb-libs --nodeps 2、安装依赖 yum -y install perl 二、安装MySQL 1、下载安装包 wget https://downloads.mysql.com/archives/get/p/23/fil…

37、matlab矩阵运算

1、前言 矩阵运算是指对矩阵的各种操作和运算,包括矩阵加法、矩阵减法、矩阵乘法、矩阵转置、求逆矩阵等。以下是常见的矩阵运算: 矩阵加法:对应位置的元素相加,要求加数和被加数的维度相同。 A B | a11 b11 | | a12 b12 | | …

PyQt5 强制退出进程

1.增加包,如下 import osimport signal 2.重写def closeEvent(self, event)函数,如下 def closeEvent(self, event):try:pidvalue os.getpid() # 获取当前进程的PIDos.kill(pidvalue, signal.SIGTERM) # 主动结束指定ID的程序运行except Exception …

C++中变量的使用细节和命名方案

C中变量的使用细节和命名方案 C提倡使用有一定含义的变量名。如果变量表示差旅费,应将其命名为cost_of_trip或 costOfTrip,而不要将其命名为x或cot。必须遵循几种简单的 C命名规则。 在名称中只能使用字母字符、数字和下划线()。 名称的第一个字符不能是数字。 区分…

【Python入门与进阶】Python模块的导入与使用

在Python中,模块是包含Python代码的文件,通常包含函数、类和变量的定义。要使用一个模块,你可以通过import语句导入它。以下是如何导入和使用模块的基本方法: 导入整个模块:你可以使用import关键字来导入整个模块&…

FRP 内网穿透 | 实现远程访问与安全管理

唠唠闲话 内网穿透简介 在互联网上,两个不同主机进行通信需要知道对方的 IP 地址。由于世界人口和设备众多,IPv4 资源相对紧缺,因此绝大部分情况下是通过路由器或交换机转换公网 IP 后才上网。 位于路由器或交换机后的设备通常是内网设备&…

C#操作MySQL从入门到精通(22)——创建表与操纵表

前言 我们新建数据库以后,最需要做的就是创建表,对数据库的操作绝大多数情况下都是都对表的操作,本文就是讲解如何创建表以及修改表中的列,修改表名等操作。由于创建表的方法基本上有两种,一种是使用带有界面的工具比如Navicate来创建表,另一种是使用sql语句来创建表,实…

SAP 价格金额信息控制

1)migo / mb51/mb51/mb59 关于价格和金额的显示,需要权限控制,当权限对象F_BKPF_BUK,检查对应【公司代码】 和 ACTVT有03’的权限,如果没有03的权限,对应行的价格和金额显示为空 关于价格和金额的显示,需要权限控制&a…

景联文科技:打造亿级高质量教育题库,赋能教育大语言模型新未来

随着人工智能技术的持续进步,从广泛的通用大语言模型到针对各行业的垂直大语言模型,已成为人工智能大语言模型技术深化演进的必然趋势。 教育大语言模型是适用于教育场景、具有庞大规模参数、融合了广泛的通用知识和专业知识训练形成的人工智能模型。能为…