人工智能大模型LLM开源资源汇总(持续更新)

说明

目前是大范围整理阶段,所以存在大量机翻说明,后续会逐渐补充和完善资料,减少机翻并增加说明。

Github上的汇总资源(大部分英文)

awesome-production-machine-learning

此存储库包含一系列精选的优秀开源库,可帮助您部署、监控、版本化、扩展和保护生产机器学习。您可以通过观看此 github 存储库来了解最新信息。此外,我们还提供了一个搜索工具包,可帮助您快速浏览工具链。如下图:
在这里插入图片描述
工具包:https://huggingface.co/spaces/zhiminy/Awesome-Production-Machine-Learning-Search

数据处理

data-juicer

Data-Juicer 是一个一站式多模式数据处理系统,可以使数据质量更高、更丰富、更易于LLMs理解。
阿里云人工智能平台(PAI)引用了他们的工作,并将Data-Juicer集成到其数据处理产品中。 PAI是一个AI Native大模型和AIGC工程平台,提供数据集管理、算力管理、模型工具链、模型开发、模型训练、模型部署和AI资产管理。有关数据处理的文档,请参阅: PAI-大型模型的数据处理。
Data-Juicer 正在积极更新和维护。我们将定期增强和添加更多功能、数据配方和数据集。
https://github.com/modelscope/data-juicer

datatrove

通过提供一组与平台无关的可自定义管道处理块,将数据处理从脚本疯狂中解放出来。
https://github.com/huggingface/datatrove

dolma

用于生成和检查 OLMo 预训练数据的数据和工具。
https://github.com/allenai/dolma

NeMo-Curator

用于数据管理的可扩展工具包。
https://github.com/NVIDIA/NeMo-Curator

dataverse

数据宇宙。关于数据、数据科学和数据工程。
https://github.com/UpstageAI/dataverse

EasyInstruct

一个易于使用的 LLM 指令处理框架。
https://github.com/zjunlp/EasyInstruct

data-prep-kit

用于 LLM 应用程序构建器数据准备的开源项目。
https://github.com/IBM/data-prep-kit

dps

多语言数据处理系统。
https://github.com/EleutherAI/dps

LLM 训练/微调

nanoGPT

用于训练/微调中型 GPT 的最简单、最快的存储库。
https://github.com/karpathy/nanoGPT

LLaMA-Factory

用于对 100+ LLM 进行高效微调的 WebUI。
https://github.com/hiyouga/LLaMA-Factory

unsloth

微调Llama 3.2、Mistral、Phi和Gemma LLMs的速度提高2-5倍,同时内存减少80%。
https://github.com/unslothai/unsloth

peft

PEFT: 最先进的参数高效微调。

llama-recipes

用于微调Meta Llama3的脚本,使用可组合的FSDP和PEFT方法覆盖单/多节点GPU。
https://github.com/huggingface/peft

litgpt

20+ 高性能 LLM,具有用于大规模预训练、微调和部署的配方。
https://github.com/Lightning-AI/litgpt

Megatron-LM

正在进行的研究大规模训练变压器模型。
https://github.com/NVIDIA/Megatron-LM

trl

使用强化学习训练 transformer 语言模型。
https://github.com/huggingface/trl

LMFlow

一个用于微调和推理大型基础模型的可扩展工具包。适合所有人的大型模型。
https://github.com/OptimalScale/LMFlow

gpt-neox

基于 Megatron 和 DeepSpeed 库的 GPU 上模型并行自回归转换器的实现。
https://github.com/EleutherAI/gpt-neox

torchtune

用于 LLM 微调的 Native-PyTorch 库。
https://github.com/pytorch/torchtune

xtuner

一个高效、灵活且功能齐全的工具包,用于微调 LLM (InternLM2, Llama3, Phi3, Qwen, Mistral, …)。
https://github.com/InternLM/xtuner

torchtitan

用于大型模型训练的原生 PyTorch 库。
https://github.com/pytorch/torchtitan

nanotron

极简大语言模型 3D 并行训练。
https://github.com/huggingface/nanotron

LLM 服务和推理

ollama

启动并运行 Llama 3.1、Mistral、Gemma 2 和其他大型语言模型。
https://github.com/ollama/ollama

gpt4all

GPT4All:在任何设备上与本地 LLM 聊天
https://github.com/nomic-ai/gpt4all

llama.cpp

C/C++ 中的 LLM 推理
https://github.com/ggerganov/llama.cpp

FastChat

一个用于训练、服务和评估大型语言模型的开放平台。Vicuna 和 Chatbot Arena 的发布存储库。
https://github.com/lm-sys/FastChat

vllm

用于 LLM 的高吞吐量和内存高效推理和服务引擎。
https://github.com/vllm-project/vllm

guidance

用于控制大型语言模型的指导语言。
https://github.com/guidance-ai/guidance

text-generation-inference

大型语言模型 Text Generation Inference
https://github.com/huggingface/text-generation-inference

TensorRT-LLM

TensorRT-LLM 为用户提供了一个易于使用的 Python API 来定义大型语言模型 (LLM) 并构建包含最先进优化的 TensorRT 引擎,以在 NVIDIA GPU 上高效执行推理。
https://github.com/NVIDIA/TensorRT-LLM

SGLang

是适用于大型语言模型和视觉语言模型的快速服务框架。
https://github.com/sgl-project/sglang

LMDeploy

是一个用于压缩、部署和提供 LLM 的工具包。
https://github.com/InternLM/lmdeploy

torchchat

在服务器、桌面和移动设备上本地运行.
https://github.com/pytorch/torchchat

RouteLLM

一个用于服务和评估 LLM 路由器的框架 - 在不影响质量的情况下节省 LLM 成本!
https://github.com/lm-sys/RouteLLM

LightLLM

是一个基于 Python 的 LLM(大型语言模型)推理和服务框架,以其轻量级设计、轻松的可扩展性和高速性能而著称。ModelTC
https://github.com/ModelTC/lightllm

LLM 防护/安全

NeMo-GuardrailsNeMo Guardrails
是一个开源工具包,用于轻松地将可编程护栏添加到基于 LLM 的对话系统中。
https://github.com/NVIDIA/NeMo-Guardrails

guardrails

向大型语言模型添加 guardrail。
https://github.com/guardrails-ai/guardrails

PurpleLlama

用于评估和改进 LLM 安全性的工具集。
https://github.com/meta-llama/PurpleLlama

llm-guard

用于 LLM 交互的安全工具包。
https://github.com/protectai/llm-guard

LLM开发和示例文档

openai-cookbook

使用 OpenAI API 的示例和指南。

anthropic-cookbook

一组笔记本/食谱,展示了一些使用 Claude 的有趣且有效的方法。

gemini-cookbook

使用 Gemini API 的示例和指南。

Phi-3CookBook

这是一本用于 Phi-3 入门的 Phi-3 书籍。Phi-3 是 Microsoft 开发的一系列开放式 AI 模型。

amazon-bedrock-workshop

这是专为 Amazon Bedrock(一种基础模型服务)设计的研讨会。

mistral-cookbook

Mistral Cookbook 包含由 Mistralers 和我们的社区以及我们的合作伙伴提供的示例。

gemma-cookbook

来自 Google 的 Gemma 开放模型的指南和示例集合。

amazon-bedrock-samples

此存储库包含供客户开始使用 Amazon Bedrock 服务的示例。这包含所有可用基础模型的示例

cohere-notebooks

适用于 Cohere 平台的代码示例和 Jupyter 笔记本Cohere

upstage-cookbook

Upstage API 示例和指南

课程

generative-ai-for-beginners

18 节课,开始使用生成式 AI 进行构建Microsoft LLM课程,通过路线图和 Colab 笔记本进入大型语言模型 (LLM)。
https://github.com/microsoft/generative-ai-for-beginners

llm-zoomcampLLM

关于构建问答系统的免费在线课程DataTalksClub
https://github.com/DataTalksClub/llm-zoomcamp

llm-twin-course

免费学习如何使用LLMOps最佳实践构建端到端的生产就绪LLM和RAG系统:~源代码+12个实践课程
https://github.com/decodingml/llm-twin-course

LLM 基准测试

SWE-benchSWE-bench

是一个基准测试,用于评估从 GitHub 收集的真实世界软件问题上的大型语言模型。

MMAU (axlearn)

大规模多任务代理理解 (MMAU) 基准测试旨在评估大型语言模型 (LLM) 作为代理在各种任务中的性能。

mle-benchMLE-bench

是衡量 AI 代理在机器学习工程中表现的基准

WindowsAgentArena(WAA)

是一个可扩展的操作系统平台,用于多模态 AI 代理的测试和基准测试。Microsoft
DevAI (agent-as-a-judge)DevAI,一个由 55 个现实的 AI 开发任务和 365 个分层用户需求组成的基准测试。

natural-planNatural Plan

是自然语言中现实的规划基准,包含 3 项关键任务:旅行计划、会议计划和日历安排。

RAG增强检索

AutoGPT AutoGPT is the vision of accessible AI for everyone, to use and to build on. Our mission is to provide the tools, so that you can focus on what matters.
langchain (LangChain) Build context-aware reasoning applications
dify (LangGenius) Dify is an open-source LLM app development platform. Dify’s intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
MetaGPT The Multi-Agent Framework: First AI Software Company, Towards Natural Language Programming
llama_index (LlamaIndex) LlamaIndex is a data framework for your LLM applications
AutoGen (Microsoft) A programming framework for agentic AI
Flowise (FlowiseAI) Drag & drop UI to build your customized LLM flow
mem0 (Mem0) The memory layer for Personalized AI
RAGFlow (InfiniFlow) RAGFlow is an open-source RAG (Retrieval-Augmented Generation) engine based on deep document understanding.
crewAI (crewAI) Framework for orchestrating role-playing, autonomous AI agents. By fostering collaborative intelligence, CrewAI empowers agents to work together seamlessly, tackling complex tasks.
GraphRAG (Microsoft) A modular graph-based Retrieval-Augmented Generation (RAG) system
haystack (Deepset) LLM orchestration framework to build customizable, production-ready LLM applications. Connect components (models, vector DBs, file converters) to pipelines or agents that can interact with your data.
swarm (OpenAI) Educational framework exploring ergonomic, lightweight multi-agent orchestration. Managed by OpenAI Solution team.
Letta (Letta) Letta (fka MemGPT) is a framework for creating stateful LLM services.
llmware (LLMware.ai) Unified framework for building enterprise RAG pipelines with small, specialized models
TaskingAI (TaskingAI) The open source platform for AI-native application development.
AgentScope (ModelScope) Start building LLM-empowered multi-agent applications in an easier way.
pathway (Pathway) Python ETL framework for stream processing, real-time analytics, LLM pipelines, and RAG.
llama-stack (Meta) Model components of the Llama Stack APIs

  • llama-stack-apps (Meta) Agentic components of the Llama Stack APIs
    Qwen-Agent (QwenLM) Agent framework and applications built upon Qwen>=2.0, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
    Langroid (Langroid) Harness LLMs with Multi-Agent Programming
    AutoRAG (Markr Inc.) AutoML tool for RAG
    AgentOps (AgentOps-AI) Python SDK for AI agent monitoring, LLM cost tracking, benchmarking, and more. Integrates with most LLMs and agent frameworks like CrewAI, Langchain, and Autogen
    Lagent (InternLM) A lightweight framework for building LLM-based agents

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/63640.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++实现排序算法:冒泡排序

目录 前言 冒泡排序性质 C代码实现冒泡排序 冒泡图解 第一趟排序 第二趟排序 第三趟排序 排序结果 结语 前言 冒泡排序的基本思想是通过从前往后&#xff08;从后往前&#xff09;两两比较&#xff0c;若为逆序&#xff08;即arr[i] < arr[i 1]&#xff09;则交换…

中介者模式的理解和实践

一、中介者模式概述 中介者模式&#xff08;Mediator Pattern&#xff09;&#xff0c;也称为调解者模式或调停者模式&#xff0c;是一种行为设计模式。它的核心思想是通过引入一个中介者对象来封装一系列对象之间的交互&#xff0c;使得这些对象不必直接相互作用&#xff0c;从…

PlantUML——类图

背景 类图是UML模型中的静态视图&#xff0c;其主要作用包括&#xff1a; 描述系统的结构化设计&#xff0c;显示出类、接口以及它们之间的静态结构和关系。简化对系统的理解&#xff0c;是系统分析与设计阶段的重要产物&#xff0c;也是系统编码和测试的重要模型依据。 在U…

【Java知识】Java进阶-如何开启远程调式

java远程调试 概述Java远程调试的开启与底层原理开启Java远程调试底层原理 JVM参数 概述 Java远程调试的开启与底层原理 开启Java远程调试 Java远程调试允许开发者在本地IDE&#xff08;如Eclipse、IntelliJ IDEA等&#xff09;中调试运行在远程服务器上的Java应用程序。以下…

入选国家数据局案例!浙江“一体化智能化公共数据平台”总体架构详解~

国家数据局在2024中国国际大数据产业博览会上发布了首批50个数字中国建设典型案例。案例涉及数据基础设施、数据资源、数字技术创新、数字政府、数字经济、数字社会、数字文化、数字生态文明等领域&#xff0c;集中反映了近年来数字中国建设的实践和成效。 其中&#xff0c;由…

vscode IntelliSense Configurations

IntelliSense 是一个强大的代码补全和代码分析功能&#xff0c;它可以帮助开发者提高编程效率。图中显示的是 VSCode 的 IntelliSense 配置界面&#xff0c;具体配置如下&#xff1a; Compiler path&#xff08;编译器路径&#xff09;: 这里指定了用于构建项目的编译器的完整路…

同三维TL200H2S6 6机位精品教育录播主机

录制点播、直播导播、互动、音频处理器、中控等多功能为一体 8路视频输入:6路SDI1路HDMI1(4K30)1路(3选1:HDMI2/2路VGA) 2路视频输出&#xff1a;1路HDMI1(4K30)1路&#…

欢乐斗地主案例

1&#xff0c;创建对象 package anlidoudizhu;public class pai implements Comparable<pai> {private Double value;private String name;Overridepublic int compareTo(pai o) {return -Double.compare(this.value,o.value);}//升序排序&#xff0c;treeset集合public…

技术型企业如何高效搭建企业博客以增强品牌影响力和市场竞争力

在数字化时代&#xff0c;技术型企业面临着激烈的市场竞争和快速变化的行业环境。为了在这场竞争中脱颖而出&#xff0c;企业需要寻找新的营销渠道和品牌建设工具。企业博客作为一种低成本、高效率的在线内容平台&#xff0c;已经成为技术型企业增强品牌影响力和市场竞争力的重…

go-zero(十二)消息队列

go zero 消息队列 在微服务架构中&#xff0c;消息队列主要通过异步通信实现服务间的解耦&#xff0c;使得各个服务可以独立发展和扩展。 go-zero中使用的队列组件go-queue&#xff0c;是gozero官方实现的基于Kafka和Beanstalkd 的消息队列框架,我们使用kafka作为演示。 一、…

【JAVA高级篇教学】第二篇:使用 Redisson 实现高效限流机制

在高并发系统中&#xff0c;限流是一项非常重要的技术手段&#xff0c;用于保护后端服务&#xff0c;防止因流量过大导致系统崩溃。本文将详细介绍如何使用 Redisson 提供的 RRateLimiter 实现分布式限流&#xff0c;以及其原理、使用场景和完整代码示例。 目录 一、什么是限流…

基于卷积神经网络的Caser算法

将一段交互序列嵌入到一个以时间为纵轴的平面空间中形成“一张图”后&#xff0c;基于卷积序列嵌入的推荐&#xff08;Caser&#xff09;算法利用多个不同大小的卷积滤波器&#xff0c;来捕捉序列中物品间的点级&#xff08;point-level&#xff09;、联合的&#xff08;union-…

ubuntu下的chattts 学习5:Example: self introduction

代码 import ChatTTS import torch import torchaudiochat ChatTTS.Chat() chat.load(compileFalse) # Set to True for better performance ################################### inputs_en """ chat T T S is a text to speech model designed for dialogu…

【银河麒麟高级服务器操作系统】修改容器中journal服务日志存储位置无效—分析及解决方案

了解更多银河麒麟操作系统全新产品&#xff0c;请点击访问 麒麟软件产品专区&#xff1a;https://product.kylinos.cn 开发者专区&#xff1a;https://developer.kylinos.cn 文档中心&#xff1a;https://documentkylinos.cn 服务器环境以及配置 【机型】 整机类型/架构&am…

HTML:表格重点

用表格就用table caption为该表上部信息&#xff0c;用来说明表的作用 thead为表头主要信息&#xff0c;效果加粗 tbody为表格中的主体内容 tr是 table row 表格的行 td是table data th是table heading表格标题 &#xff0c;一般表格第一行的数据都是table heading

[创业之路-187]:《华为战略管理法-DSTE实战体系》-1-从UTStarcom的发展历程,如何辩证的看企业初期发展太顺利中的危机

目录 一、UTStarcom&#xff08;UT斯达康&#xff09;的发展历程 1、创立与初期发展 2、快速成长与上市 3、技术创新与业务拓展 4、战略调整与持续发展 二、从UTStarcom的发展历程&#xff0c;如何辩证的看企业初期发展太顺利中的危机 1、企业初期发展的顺利表现 2、顺…

ubuntu系统生成SSL证书配置https

自签名【Lets Encrypt】的测试证书&#xff0c;有效期三个月。 第一步&#xff1a;安装acme&#xff0c;如果没有安装git&#xff0c;需要提前安装 下载came资源 git clone https://github.com/Neilpang/acme.sh.git 无法访问&#xff0c;可以试用gitee的资源&#xff0c;安…

CentOS 7 环境下常见的操作和配置

目录 1. CentOS 7 中的 vsftpd 配置与使用 安装与启动 vsftpd 配置 vsftpd&#xff08;/etc/vsftpd/vsftpd.conf&#xff09; 常见命令 2. 使用 yum 包管理器 3. 安全性与防火墙配置 开放端口 4. 使用 systemd 管理服务 5. SELinux 配置 查看 SELinux 状态 临时禁用…

《AI教学能力:开启教育新纪元》

一、摘要 AI 在教育领域的应用日益广泛&#xff0c;对教学能力产生了深远影响。本文将深入探讨 AI 教学能力的核心技术、实际应用、教学模式与策略、全球实践以及未来趋势&#xff0c;为教育的现代化发展提供参考。 摘要&#xff1a; AI 在教育领域的应用及其对教学能力的影响…

【信息系统项目管理师】第10章:项目进度管理过程详解

文章目录 一、规划进度管理1、输入2、工具与技术3、输出 二、定义活动1、输入2、工具与技术3、输出 三、排列活动顺序1、输入2、工具与技术3、输出 四、估算活动持续时间1、输入2、工具与技术3、输出 五、制订进度计划1、输入2、工具与技术3、输出 六、控制进度1、输入2、工具与…