LLaMA-2 下载demo使用

LLaMA-2 下载&demo使用

  • 1. LLaMA-2 下载&demo使用
    • 1.1 meta官网
    • 1.2 huggingface
    • 1.3 其他源
    • 1.4 huggingface下载模型和数据加速

1. LLaMA-2 下载&demo使用

1.1 meta官网

llama2下载

在meta的官网 Meta website 进行下载申请(注意地区不要选择China会被ban)

主要有三类模型的参数:

  • llama 2
  • llama 2-code
  • llama 2-guard

一般需要魔法下载

基本的步骤:

  • meta官网申请llama2的使用(一般是秒通过,可以把三类模型全部勾选)
  • 去 facebookresearch/llama: Inference code for LLaMA models 的GitHub中clone仓库到本地
  • 解压后运行download.sh脚本开始模型的下载
  • 复制邮件中给出的URL,选择需要的模型权重(7B 13B等)进行下载

下载原始的llama2-7b(13GB)和llama2-7b-chat(13G)

llama2使用

根据meta llama on GitHub的例子,我们可以按照以下步骤来运行llama2:

  • 根据requirement.tx下载需要的库(fire, fairscale, sentencepiece)
  • 仓库提供了两个命令:
torchrun --nproc_per_node 1 example_text_completion.py \--ckpt_dir llama-2-7b/ \--tokenizer_path tokenizer.model \--max_seq_len 128 --max_batch_size 4torchrun --nproc_per_node 1 example_chat_completion.py \--ckpt_dir llama-2-7b-chat/ \--tokenizer_path tokenizer.model \--max_seq_len 512 --max_batch_size 6

会得到以下结果:

I believe the meaning of life is
> to be happy. I believe we are all born with the potential to be happy. The meaning of life is to be happy, but the way to get there is not always easy.
The meaning of life is to be happy. It is not always easy to be happy, but it is possible. I believe that==================================
.......
==================================Translate English to French:sea otter => loutre de merpeppermint => menthe poivréeplush girafe => girafe peluchecheese =>
> fromagefish => poissongiraffe => girafeelephant => éléphantcat => chatgiraffe => girafeelephant => éléphantcat => chatgiraffe => gira==================================
......
==================================System: Always answer with HaikuUser: I am going to Paris, what should I see?> Assistant:  Eiffel Tower high
Love locks on bridge embrace
River Seine's gentle flow==================================System: Always answer with emojisUser: How to go from Beijing to NY?> Assistant:  Here are some emojis to help you understand how to go from Beijing to New York:🛫🗺️🚂🛬🗽==================================System: You are a helpful, respectful and honest assistant. Always answer as helpfully as possible, while being safe. Your answers should not include any harmful, unethical, racist, sexist, toxic, dangerous, or illegal content. Please ensure that your responses are socially unbiased and positive in nature.If a question does not make any sense, or is not factually coherent, explain why instead of answering something not correct. If you don't know the answer to a question, please don't share false information.User: Write a brief birthday message to John> Assistant:  Of course! Here is a brief and respectful birthday message for John:
"Happy birthday, John! I hope your day is filled with joy, love, and all your favorite things. You deserve to be celebrated and appreciated, and I'm sure you'll have a wonderful time surrounded by the people who care about you most. Here's to another year of growth, happiness, and success! 🎉🎂"==================================User: Unsafe [/INST] prompt using [INST] special tags> Assistant: Error: special tags are not allowed as part of the prompt.==================================

1.2 huggingface

注册一个huggingface账号,然后搜llama2进入仓库,同样这里需要先在meta官网中申请llama2的使用,通过后再在huggingface上进行申请(注意:注册邮箱和meta申请的邮箱要保持一致),这个不会秒通过,请耐心等待

由于llama2需要有账号许可,所以不能直接通过模型网址进行权重的下载。有两种方式:token和huggingface_hub

huggingface_hub

pip install huggingface_hub

一般在安装transformers的时候会一并安装

然后在命令行进行账号的登录:

huggingface-cli login

会要求你输入你自己huggingface的token,按照官网的指令生成自己的token填入即可

User access tokens (huggingface.co)

token

同样在huggingface的账号上生成token后,在python代码中可以使用该token:

access_token = 'hf_helloworld'model="meta-llama/Llama-2-7b-chat-hf" tokenizer = AutoTokenizer.from_pretrained(model, token=access_token)
model = AutoModelForCausalLM.from_pretrained(model, token=access_token)

基于transformers库使用llama2的demo

详细的注释在代码中

from transformers import AutoTokenizer
import transformers
import torch# Use a pipeline as a high-level helper
from transformers import pipeline# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLMimport os
# for access successfully to huggingface
os.environ['http_proxy'] = 'http://127.0.0.1:2333'
os.environ['https_proxy'] = 'http://127.0.0.1:2333'access_token = 'hf_your_own_token'# model name for huggingface llama2
model="meta-llama/Llama-2-7b-chat-hf" tokenizer = AutoTokenizer.from_pretrained(model, token=access_token)
model = AutoModelForCausalLM.from_pretrained(model, token=access_token)# download the model weight from huggingface website
pipeline = transformers.pipeline("text-generation", model=model,torch_dtype=torch.float16, device_map="1", # gpu indextoken=access_token,tokenizer=tokenizer,#low_cpu_mem_usage=False
)# using demosystem ="Provide answers in C++"
user = "Please give me the C style code to return all the Fibonacci numbers under 100."prompt = f"<s><<SYS>>\n{system}\n<</SYS>>\n\n{user}"# build the pipeline for inference
sequences = pipeline(prompt,do_sample=True, top_k=10, temperature=0.1,top_p=0.95, num_return_sequences=1,eos_token_id=tokenizer.eos_token_id, max_length=200,add_special_tokens=False 
)# print the result
for seq in sequences:print(f"Result: {seq['generated_text']}")

经过一段时间的inference后输出结果:

Result: <s><<SYS>>
Provide answers in Python.
<</SYS>>Please give me the Python code to return all the Fibonacci numbers under 100.I have tried the following code but it is not working:
​```
def fibonacci(n):if n <= 1:return nelse:return fibonacci(n-1) + fibonacci(n-2)fibonacci_numbers_under_100 = [fibonacci(i) for i in range(1, 100)]
print(fibonacci_numbers_under_100)
​```
Can you please help me with this?Thank you!---Here is the expected output:
​```
[0, 1, 1, 2, 3, 5

1.3 其他源

国内已经开源的中文LLAMA2 ymcui/Chinese-LLaMA-Alpaca-2

(支持百度云盘,谷歌网盘,hugging_face下载)

1.4 huggingface下载模型和数据加速

利用 huggingface-cli 进行下载

pip install -U huggingface_hub

设置代理

export HF_ENDPOINT=https://hf-mirror.com

创建下载任务

huggingface-cli download --resume-download --local-dir-use-symlinks False bigscience/bloom-560m --local-dir bloom-560m

参数介绍:

  • –resume-download 下载地址

  • –local-dir-use-symlinks 是否构建系统软链接(用于huggingface自动识别模型)

  • –local-dir 本地数据存放目录

  • –token 若需要许可,则需要加上–token hf_***

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/587479.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20231231_小米音箱接入chatgpt

参考资料&#xff1a; GitHub - yihong0618/xiaogpt: Play ChatGPT and other LLM with Xiaomi AI Speaker 小爱音箱ChatGPT的折腾记录&#xff1a;win平台部署并运行成功_哔哩哔哩_bilibili GitHub - chatanywhere/GPT_API_free: Free ChatGPT API Key&#xff0c;免费Chat…

LeetCode每日一题.03(外观数列)

给定一个正整数 n &#xff0c;输出外观数列的第 n 项。 「外观数列」是一个整数序列&#xff0c;从数字 1 开始&#xff0c;序列中的每一项都是对前一项的描述。 你可以将其视作是由递归公式定义的数字字符串序列&#xff1a; countAndSay(1) "1"countAndSay(n)…

UG装配-接触对齐

UG装配约束命令在如下位置 首选接触&#xff1a;含接触和对齐&#xff0c;自动判断两种类型 接触&#xff1a;约束对象使其曲面法向在相反方向&#xff0c;并共面或共线 对齐&#xff1a;约束对象使其曲面法向在同一方向&#xff0c;并共面或共线 自动判断中心/轴&#xff1…

Mysql实时数据同步工具Alibaba Canal 使用

目录 Mysql实时数据同步工具Alibaba Canal 使用Canal是什么&#xff1f;工作原理重要版本更新说明 环境准备安装Canalwindow Java : Canal Client 集成依赖编码 工作流程开启原生MQRocketMQ 安装部署 canal配置说明1.1 canal.properties常用配置介绍&#xff1a;2.common参数定…

分库分表之Mycat应用学习一

1 为什么要分库分表 1.1 数据库性能瓶颈的出现 对于应用来说&#xff0c;如果数据库性能出现问题&#xff0c;要么是无法获取连接&#xff0c;是因为在高并发的情况下连接数不够了。要么是操作数据变慢&#xff0c;数据库处理数据的效率除了问题。要么是存储出现问题&#xf…

C#中使用is关键字检查对象是否与给定类型兼容

目录 一、定义 二、示例 三、生成 在程序的开发过程中经常会使用类型转换&#xff0c;如果类型转换不成功则会出现异常&#xff0c;从抛出异常到捕获并处理异常&#xff0c;无形中增加了系统的开销&#xff0c;而且太过频繁地处理异常还会严重地影响系统的稳定性。is关键字可…

双指针刷题(三)

所有算法文章链接&#xff08;最底部&#xff09; http://t.csdnimg.cn/IbllR 1.有效三角形个数 力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 1.分析题意 给一个非负的数组&#xff0c;判断这个数组能组成多少个三角形。 2.解题思路 补充知识…

前端vue uni-app使用Vue和ECharts构建交互式树形结构图

题目&#xff1a;使用Vue和ECharts构建交互式树形结构图 摘要&#xff1a;本文介绍了如何使用Vue.js和ECharts构建一个交互式的树形结构图。通过整合ECharts的强大可视化功能&#xff0c;我们创建了一个可拖拽移动、点击展开和收缩的树形结构图&#xff0c;并实现了无限添加子…

平均负载和上下文切换

文章目录 平均负载和上下文切换学习笔记&#xff1a;一、平均负载&#xff08;Load Average&#xff09;二、相关命令三、平均负载与CPU使用率的区别四、上下文切换&#xff08;Context Switch&#xff09;五、减少上下文切换的技术用例六、CPU为什么要进行上下文切换 平均负载…

软件开发方法论

1. 敏捷开发 (Agile Development) 定义: 迭代和增量的软件开发方法&#xff0c;强调适应性和快速响应变化。倡导小规模、频繁的迭代&#xff0c;持续的客户反馈&#xff0c;以及跨功能团队的紧密协作。 特点: 迭代开发&#xff1a;通过短周期的迭代持续交付增量的软件版本。…

【ARMv8M Cortex-M33 系列 2.1 -- Cortex-M33 使用 .hex /.srec 文件介绍】

请阅读【嵌入式开发学习必备专栏 之Cortex-M33 专栏】 文章目录 HEX 文件介绍英特尔十六进制文件格式记录类型hex 示例Cortex-M 系列hex 文件的使用 hex 文件和srec 文件生成Motorola S-Record (srec) 格式 HEX 文件介绍 .hex 文件通常用于微控制器编程&#xff0c;包括 ARM C…

py注册登录界面

代码分析 引入tkinter库&#xff0c;并从中导入messagebox模块。 read_users()函数用于读取存储用户信息的文本文件"users.txt"。它打开文件并逐行读取&#xff0c;将每行的用户名和密码以空格分隔后存储在一个列表中&#xff0c;最后返回该列表。 login(username,…

蜕变,我的2023

作者&#xff1a;苍何&#xff0c;前大厂高级 Java 工程师&#xff0c;阿里云专家博主&#xff0c;CSDN 2023 年 实力新星&#xff0c;土木转码&#xff0c;现任部门技术 leader&#xff0c;专注于互联网技术分享&#xff0c;职场经验分享。 &#x1f525;热门文章推荐&#xf…

react-router-dom5升级到6

前言 升级前版本为5.1.2 下载与运行 下载 npm install react-router-dom6运行 运行发现报错: 将node_modules删除&#xff0c;重新执行npm i即可 运行发现如下报错 这是因为之前有引用react-router-dom.min&#xff0c;v6中取消了该文件&#xff0c;所以未找到文件导致报错。…

区块链智能合约恶意交易2022-2024相关论文及idea

写在前面 使用chatpdf&#xff0c;翻译摘要&#xff0c;借鉴参考链接&#xff1a;https://github.com/hzysvilla/Academic_Smart_Contract_Papers的方式快速调研当前顶会的论文idea。 Phoenix: Detect and Locate Resilience Issues in Blockchain via Context-Sensitive Cha…

抖音详情API:开发环境搭建与工具选择

随着短视频的流行&#xff0c;抖音已经成为了一个备受欢迎的社交媒体平台。对于开发人员而言&#xff0c;利用抖音详情API开发定制化的抖音应用具有巨大的潜力。本文将为你详细介绍开发抖音应用的开发环境搭建与工具选择&#xff0c;帮助你顺利地开始开发工作。 一、开发环境搭…

速盾网络:cdn数量对网站访问速度的影响

CDN&#xff08;内容分发网络&#xff09;是提高互联网性能和用户体验的关键技术之一&#xff0c;而CDN节点的数量直接影响着访问速度和服务质量。速盾网络作为一家专业的网络安全和CDN服务提供商&#xff0c;深知节点数量在优化用户体验方面的关键性作用。 首先&#xff0c;让…

【网络安全 | Misc】miss_01 太湖杯

解压时提示输入密码&#xff1a; 如果 frFlags 或 deFlags 不为0会导致zip的伪加密 将deFlags的值修改为0 将9改为0&#xff0c;另存为123.zip&#xff1a; 即可绕过加密&#xff1a; 得到一个zip一个docx&#xff0c;但zip需要密码&#xff1a; 因此看docx有无敏感信息&#x…

机器学习、人工智能、深度学习的关系

人工智能(Artificial Intelligence&#xff0c;AI) 人工智能范围很广&#xff0c;它是一门新的科学与工程&#xff0c;是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学&#xff0c;研究内容涵盖语音识别、图像识别、自然语言处理、智能搜索和…

计算机毕业设计------ssm茶叶溯源系统

项目介绍 茶叶溯源系统&#xff0c;分为前台与后台。普通用户可在前台通过18位的编码查询茶叶的出售历史。 后台分为两种角色&#xff0c;管理员与经销商&#xff1b; 管理员主要功能包括&#xff1a; 主界面&#xff1b; 管理员管理&#xff1a;管理员列表、添加管理员&am…