使用 LLaMA-Factory 实现对大模型函数调用功能

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。

针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。

合集:

《大模型面试宝典》(2024版) 正式发布!


大模型函数调用(function calling)功能,能让大模型调用成千上万的工具API,赋予大模型更多的外部知识,使得大模型能力变得更加强大。

本文将会介绍如何使用 LLaMa-Factory 这个大模型微调框架,对 Qwen1.5-4B 模型进行微调,实现 function calling 功能,使得大模型具有工具调用能力。

如何微调大模型的function calling能力?

首先,训练数据集是关键,我们在这里使用Glaive AI生成的工具调用数据集,也可以在HuggingFace找到function calling相关的数据集,该数据集包含用户(human)、模型(gpt)、工具调用(function_call)和工具调用结果(observation)四种不同角色,以及工具列表(tools)字段。

同时,我们还选择了alpaca_gpt4_en、alpaca_gpt4_zh 和 oaast_sft_zh这三种数据集,以增强大模型的通用对话能力。

其中一条样本为:

{"conversations": [{"from": "human","value": "I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"},{"from": "function_call","value": "{\"name\": \"calculate_discount\", \"arguments\": {\"original_price\": 200, \"discount_percentage\": 20}}"},{"from": "observation","value": "{\"discounted_price\": 160}"},{"from": "gpt","value": "The dress will cost you $160 after the 20% discount."}],"tools": "[{\"name\": \"calculate_discount\", \"description\": \"Calculate the discounted price\", \"parameters\": {\"type\": \"object\", \"properties\": {\"original_price\": {\"type\": \"number\", \"description\": \"The original price of the item\"}, \"discount_percentage\": {\"type\": \"number\", \"description\": \"The percentage of discount\"}}, \"required\": [\"original_price\", \"discount_percentage\"]}}]"
}

其加工成对话样本后的格式如下:

<|im_start|>system
You are a helpful assistant.You have access to the following tools:
> Tool Name: calculate_discount
Tool Description: Calculate the discounted price
Tool Args:- original_price (number, required): The original price of the item- discount_percentage (number, required): The percentage of discountUse the following format if using a tool:
Action: tool name (one of [calculate_discount]).```
Action Input: the input to the tool, in a JSON format representing the kwargs (e.g. ```{"input": "hello world", "num_beams": 5}```).```
<|im_end|>
<|im_start|>user
I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?<|im_end|>
<|im_start|>assistant
Action: calculate_discount
Action Input: {"original_price": 200, "discount_percentage": 20}<|im_end|>
<|im_start|>user
{"discounted_price": 160}<|im_end|>
<|im_start|>assistant
The dress will cost you $160 after the 20% discount.<|im_end|>

微调的基座模型选择Qwen1.5-4B,每个数据集最大样本量为50000,训练2轮,训练命令如下:

python src/train_bash.py     \
--stage sft     \
--do_train True     \
--model_name_or_path /models/Qwen1.5-4B     \
--finetuning_type lora     \
--template qwen     \
--dataset_dir data     \
--dataset glaive_toolcall,alpaca_gpt4_en,alpaca_gpt4_zh,oaast_sft_zh     \
--cutoff_len 1024     \
--learning_rate 5e-05     \
--num_train_epochs 2.0     \
--max_samples 50000     \
--per_device_train_batch_size 2     \
--gradient_accumulation_steps 4     \
--lr_scheduler_type cosine     \
--max_grad_norm 1.0     \
--logging_steps 100     \
--save_steps 1000     \
--warmup_steps 0     \
--optim adamw_torch     \
--report_to none     \
--output_dir saves/Qwen1.5-4B/lora/train_2024-04-20-15-30-29     \
--fp16 True     \
--lora_rank 8     \
--lora_alpha 16     \
--lora_dropout 0.1     \
--lora_target all     \
--plot_loss True

在笔者的GPU上大约训练了14个小时(同时还在运行其它任务)。训练完后,将lora部分的参数与原始模型进行合并,形成新的训练后的模型(Qwen1.5-4B-agent),此时,新模型已经具有了function calling的调用能力。

测试微调后的大模型的function calling

我们来测试下训练后的大模型的function calling的能力。模型服务的部署命令如下:

python -m llmtuner.api.app --model_name_or_path /models/Qwen1.5-4B-agent --template qwen

笔者找了三个API工具来进行测试,它们的作用分别为生活垃圾分类,动漫信息查询,歌曲信息查询,API具体的入参、出参可以参考网址为:https://apifox.com/apidoc/shared-faff130e-7aa3-42da-9f93-574b16c8acda。

测试脚本如下:

# -*- coding: utf-8 -*-
# @place: Pudong, Shanghai
# @file: llama_factory_agent_test.py
import os
import json
from openai import OpenAI
from typing import Sequence
import requestsos.environ["OPENAI_BASE_URL"] = "http://localhost:50079/v1"
os.environ["OPENAI_API_KEY"] = "0"def get_rubbish_category(keyword):url = f"https://api.timelessq.com/garbage?keyword={keyword}"response = requests.request("GET", url)output_str_list = []for item in response.json()['data']:output_str_list.append(f"{item['name']}: {item['categroy']}")return '\n'.join(output_str_list)def get_song_information(keyword):url = f"https://api.timelessq.com/music/tencent/search?keyword={keyword}"response = requests.request("GET", url)song_infor = response.json()['data']['list'][0]singer = '' if not song_infor['singer'] else song_infor['singer'][0]['name']return f"歌曲: {keyword}\n歌手: {singer}\n时长: {song_infor['interval']}秒\n专辑名称: {song_infor['albumname']}"def get_cartoon_information(title):url = f"https://api.timelessq.com/bangumi?title={title}"response = requests.request("GET", url)data = response.json()['data'][0]return f"标题: {data['title']}\n类型:{data['type']}\n语言:{data['lang']}\n出品方:{data['officialSite']}\n上映时间:{data['begin']}\n完结事件:{data['end']}"tool_map = {"get_rubbish_category": get_rubbish_category,"get_song_information": get_song_information,"get_cartoon_information": get_cartoon_information}if __name__ == "__main__":client = OpenAI()tools = [{"type": "function","function": {"name": "get_rubbish_category","description": "适用于生活垃圾分类时,判断物品属于哪种类型的垃圾?","parameters": {"type": "object","properties": {"keyword": {"type": "string","description": "物品名称,用于垃圾分类",},},"required": ["keyword"],}}},{"type": "function","function": {"name": "get_cartoon_information","description": "根据用户提供的动漫标题,查询该动漫的相关信息。","parameters": {"type": "object","properties": {"title": {"type": "string","description": "动漫",},},"required": ["title"],}}},{"type": "function","function": {"name": "get_song_information","description": "根据用户提供的歌曲名称,查询歌曲相关信息,包括歌手、时长、专辑名称等。","parameters": {"type": "object","properties": {"keyword": {"type": "string","description": "歌曲名称",},},"required": ["keyword"],}}}]messages = []messages.append({"role": "system", "content": "你是一个有用的小助手,请调用下面的工具来回答用户的问题,参考工具输出进行回答。"})# messages.append({"role": "user", "content": "鸡蛋壳属于哪种类型的垃圾?"})# messages.append({"role": "user", "content": "爱在西元前是谁唱的,来自哪张专辑?"})messages.append({"role": "user", "content": "动漫《棋魂》是哪个国家的,什么时候上映的?"})result = client.chat.completions.create(messages=messages, model="Qwen1.5-4B-agent", tools=tools)tool_call = result.choices[0].message.tool_calls[0].functionprint(tool_call)name, arguments = tool_call.name, json.loads(tool_call.arguments)messages.append({"role": "function", "content": json.dumps({"name": name, "argument": arguments}, ensure_ascii=False)})tool_result = tool_map[name](**arguments)messages.append({"role": "tool", "content": "工具输出结果为: " + tool_result})for msg in messages:print('--->', msg)result = client.chat.completions.create(messages=messages, model="Qwen1.5-4B-agent")print("Answer: ", result.choices[0].message.content)

测试结果如下:

  • 问题: 鸡蛋壳属于哪种类型的垃圾?

输出:

---> {'role': 'system', 'content': '你是一个有用的小助手,请调用下面的工具来回答用户的问题,参考工具输出进行回答。'}
---> {'role': 'user', 'content': '鸡蛋壳属于哪种类型的垃圾?'}
---> {'role': 'function', 'content': '{"name": "get_rubbish_category", "argument": {"keyword": "鸡蛋壳"}}'}
---> {'role': 'tool', 'content': '工具输出结果为: 熟鸡蛋壳: 湿垃圾\n生鸡蛋壳: 湿垃圾\n鸡蛋壳: 湿垃圾\n包裹着鸡蛋壳的餐巾纸: 干垃圾'}
Answer:  鸡蛋壳属于湿垃圾。
  • 问题: 爱在西元前是谁唱的,来自哪张专辑?

输出:

---> {'role': 'system', 'content': '你是一个有用的小助手,请调用下面的工具来回答用户的问题,参考工具输出进行回答。'}
---> {'role': 'user', 'content': '爱在西元前是谁唱的,来自哪张专辑?'}
---> {'role': 'function', 'content': '{"name": "get_song_information", "argument": {"keyword": "爱在西元前"}}'}
---> {'role': 'tool', 'content': '工具输出结果为: 歌曲: 爱在西元前\n歌手: 周杰伦\n时长: 234秒\n专辑名称: 范特西'}
Answer:  歌曲《爱在西元前》的演唱者是周杰伦,来自专辑《范特西》。
  • 问题: 动漫《棋魂》是哪个国家的,什么时候上映的?

输出:

---> {'role': 'system', 'content': '你是一个有用的小助手,请调用下面的工具来回答用户的问题,参考工具输出进行回答。'}
---> {'role': 'user', 'content': '动漫《棋魂》是哪个国家的,什么时候上映的?'}
---> {'role': 'function', 'content': '{"name": "get_cartoon_information", "argument": {"title": "棋魂"}}'}
---> {'role': 'tool', 'content': '工具输出结果为: 标题: ヒカルの碁\n类型:tv\n语言:ja\n出品方:http://www.tv-tokyo.co.jp/anime/hikaru/\n上映时间:2001-10-10T10:27:00.000Z\n完结事件:2003-03-26T10:55:00.000Z'}
Answer:  动漫《棋魂》是日本的,它于2001年10月10日上映。

总结

OpenAI模型的function calling能力无疑是让人惊讶的,但自己实现大模型的function calling能力也是值得开心的。

本文重点介绍了如何使用 LLaMa-Factory 微调框架来自己实现 function calling 能力,并在测试中验证了大模型的工具调用能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/24729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

现代密码学-认证、消息认证码

什么是单向散列函数 单向散列函数&#xff08;one way hash function&#xff09;&#xff1a;一个输入&#xff1a;消息&#xff08;message&#xff09;,一个固定长度的输出(散列值&#xff0c;hash value),根据散列值检查消息完整性(integrity) 单向散列函数也称为消息摘要…

linux中创建sftp

前言&#xff1a;每次创建sftp的时候总是查一堆文档&#xff0c;不是有的步骤不对&#xff0c;就是缺失步骤&#xff0c;索性自己写一份以供后续方便使用。 一、添加用户组sftp --> groupadd sftp ●查看用户组是否创建成功 --> cat /etc/group 二、创建用户&#xf…

Docker大学生看了都会系列(七、Dokcerfile详解)

系列文章目录 第一章 Docker介绍 第二章 2.1 Mac通过Homebrew安装Docker 第二章 2.2 CentOS安装Docker 第三章 Docker常用命令 第四章 常用命令实战 第五章 Docker镜像详解 第六章 Docker容器数据卷 第七章 Dockerfile详解 第八章 Dokcerfile部署go项目 文章目录 一、Dockerfil…

图形化红队行动辅助平台Viper使用记录

图形化红队行动辅助平台Viper使用记录 简介 Viper(炫彩蛇)是一款图形化内网渗透工具,将内网渗透过程中常用的战术及技术进行模块化及武器化. Viper(炫彩蛇)集成杀软绕过,内网隧道,文件管理,命令行等基础功能. Viper(炫彩蛇)当前已集成70个模块,覆盖初始访问/持久化/权限提升/…

Python 中的字符串、列表、元组和字典数据类型的特点和使用场景

字符串&#xff08;str&#xff09;是一种不可变的序列类型&#xff0c;由字符组成。它的特点是&#xff1a; 可以使用单引号或双引号来定义字符串。字符串中的字符是按照索引进行访问的&#xff0c;索引从0开始。字符串可以进行切片操作&#xff0c;获取部分子串。字符串可以…

【数据结构】初识数据结构之复杂度与链表

【数据结构】初识数据结构之复杂度与链表 &#x1f525;个人主页&#xff1a;大白的编程日记 &#x1f525;专栏&#xff1a;C语言学习之路 文章目录 【数据结构】初识数据结构之复杂度与链表前言一.数据结构和算法1.1数据结构1.2算法1.3数据结构和算法的重要性 二.时间与空间…

【FPGA】arm数据总线和axi数据总线有什么异同点?

ARM数据总线和AXI数据总线在概念和应用上有一些异同点&#xff1a; 相同点 功能目的&#xff1a;两者都是用于处理器与外部设备或内存之间传输数据的通道。设计原则&#xff1a;它们都遵循一些设计原则&#xff0c;以确保数据传输的可靠性和效率。 异同点 架构级别&#xff…

Elasticsearch 认证模拟题 - 13

一、题目 集群中有索引 task3&#xff0c;用 oa、OA、Oa、oA 查询结构是 4 条&#xff0c;使用 dingding 的查询结果是 1 条。通过 reindex 索引 task3 为 task3_new&#xff0c;能够使 task3_new 满足以下查询条件。 使用 oa、OA、Oa、oA、0A、dingding 查询都能够返回 6 条…

【纯血鸿蒙】——自适应布局如何实现?

界面级一多能力有 2 类&#xff1a; 自适应布局: 略微调整界面结构 响应式布局&#xff1a;比较大的界面调整 本文章先主要讲解自适应布局&#xff0c;响应式布局再后面文章再细讲。话不多说&#xff0c;开始了。 自适应布局 针对常见的开发场景&#xff0c;方舟开发框架提…

React Native 快速Demo(1)

为了快速实现一个项目雏型&#xff08;prototype&#xff09;demo并提交给他们确认&#xff0c;可以按照以下步骤进行&#xff1a; 1. 环境设置 1.1 安装开发工具 安装Node.js和npm&#xff1a;用于管理项目依赖。 sudo apt install nodejs sudo apt install npm安装React Na…

QT系列教程(10) QTextEdit学习

简介 QTextEdit是文本编辑器&#xff0c;支持富文本功能。接下来我们创建一个Qt Application 应用&#xff0c;然后在ui中添加一个QTextEdit插件。 运行程序后&#xff0c;可以在QTextEdit中输入任何文字也包括富文本。 文本块 我们在MainWindow的ui文件中添加了textedit插件…

24年江苏省教资认定报名照片要求

24年江苏省教资认定报名照片要求&#xff0c;速速查收&#xff01;

Python代码——压缩整个文件夹

使用 Python 的 zipfile 模块来创建一个压缩文件夹。 下面是一个示例代码&#xff0c;展示了如何将一个文件夹中的所有文件和子文件夹压缩成一个 ZIP 文件&#xff1a; import os import zipfiledef zip_folder(folder_path, output_path):# 创建一个 ZipFile 对象&#xff0…

蓝屏绿屏黑屏?别急,有它们仨【送源码】

使用Windows系统的电脑时&#xff0c;可能会碰到各种问题&#xff0c;导致系统无法正常使用。 这些问题都有一个统一的专业叫法就是bug&#xff01; 系统一旦出现bug&#xff0c;最明显的特点就是&#xff0c; ①电脑蓝屏 电脑蓝屏是最经典的&#xff0c;从XP时代一直延续到…

STM32项目分享:智能台灯系统

目录 一、前言 二、项目简介 1.功能详解 2.主要器件 三、原理图设计 四、PCB硬件设计 1.PCB图 2.PCB板及元器件图 五、程序设计 六、实验效果 七、资料内容 项目分享 一、前言 项目成品图片&#xff1a; 哔哩哔哩视频链接&#xff1a; https://www.bilibili.c…

Anaconda软件:安装、管理python相关包

Anaconda的作用 一个python环境中需要有一个解释器, 和一个包集合. 解释器&#xff1a; 根据python的版本大概分为2和3. python2和3之间无法互相兼容, 也就是说用python2语法写出来的脚本不一定能在python3的解释器中运行. 包集合&#xff1a;包含了自带的包和第三方包, 第三…

泛微开发修炼之旅--12ecology工作流常用实用性查询语句源码汇总(二)

文章链接&#xff1a;泛微开发修炼之旅--12ecology工作流常用实用性查询语句源码汇总&#xff08;二&#xff09;

搭建mysql主从服务

搭建mysql主从服务 [!TIP] 基于docker和mysql 8搭建主从服务&#xff0c;一主二从的结构&#xff0c;并且把数据文件放置在master_slave_mysql 文件夹下 首先规划端口&#xff0c;master&#xff1a;3306&#xff0c;slave_one&#xff1a;3307&#xff0c;slave_two&#xff1…

Elasticsearch 认证模拟题 - 11

一、题目 编写一个名为 a_data_stream 数据流满足以下请求&#xff1a; 数据流索引主分片数为 1&#xff0c;副本为 2数据流索引指定相应的 mapping &#xff0c;二个字段为 keyword 类型&#xff0c;一个字段为 text 类型并指定分词器为 standard。 按照上述要求建立数据流…

【Android面试八股文】说一说synchronized在JDK1.6之后做了哪些优化?

文章目录 说一说synchronized在JDK1.6之后做了哪些优化?一、为什么加上`synchronized`关键字就能实现锁,它的原理是怎么回事呢?1.1 字节码查看synchronized的实现1.2 为什么Java6之前的synchronized效率很低?1.3 Java6对synchronized的优化二、Java对象头2.1 Java对象头简介…