2024最新AI大模型产品汇总

文章目录

  • 1. 写在前面
  • 2. 效率工具
  • 3. 聊天机器人
  • 4. 应用开发工具
  • 5. Prompt工具与社区
  • 6. 通用基础大模型
  • 7. 训练框架
  • 8. 开源数据集
  • 9. 推理与部署平台及工具

【作者主页】:吴秋霖
【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作!
【作者推荐】:对JS逆向感兴趣的朋友可以关注《爬虫JS逆向实战》,对分布式爬虫平台感兴趣的朋友可以关注《分布式爬虫平台搭建与开发实战》
还有未来会持续更新的验证码突防、APP逆向、Python领域等一系列文章

1. 写在前面

  在数字化时代,人工智能(AI)正成为推动创新和变革的引擎。从高效的工具和聊天机器人到强大的训练框架和开源数据集,AI 大模型产品正在改变我们看待和使用技术的方式

本文作者将汇总AI大模型领域最前沿的效率工具、应用开发工具、Prompt 技术、训练框架、开源数据集、数据服务,以及推理与部署平台,建议大家收藏起来~总会有用的

在这里插入图片描述

2. 效率工具

devv.ai是一款面向开发者的下一代AI搜索引擎

在这里插入图片描述

CodeFuse是一款为国内开发者提供智能研发服务的产品,该产品是基于蚂蚁集团自研的基础大模型进行微调的代码大模型。具备代码补全、添加注释、解释代码、生成单测,以及代码优化功能,以帮助开发者更快、更轻松地编写代码

在这里插入图片描述

简单AI提供全面的AI社区服务,包括AI作图、文生图prompt社区、AI文案、AI头像、AI素材、AI设计等。 以“快人一步,轻松玩转AI” 为理念,致力于让每一个用户都能便捷地使用和理解人工智能

在这里插入图片描述

看看这些生成的图,惟妙惟肖的

在这里插入图片描述

AutoDraw是由Google推出的一个在线绘图工具,它利用机器学习和人工智能技术来帮助用户绘制图形。主要特点是识别用户所绘制的简单图形,并提供相关的预定义图形供用户选择,从而快速转换手绘图为更精确的图形。这个工具通过智能识别和建议功能,使得用户无需具备专业绘图技能,就能轻松创建出美观的图形

在我们绘制图形时,系统会实时分析用户的绘图意图,并在画布上显示相应的建议图标。用户可以从建议图标中选择最符合他们意图的图形,从而快速完成绘图过程,如下:
在这里插入图片描述

在这里插入图片描述

Fliki是一个文本转视频工具,通过使用AI语音将创意转化为引人注目的内容。该工具可能允许用户输入文本,然后使用人工智能生成声音并将其合成到视频中,从而帮助用户快速而轻松地创建视觉和听觉上的内容

在这里插入图片描述

Midjourney是第一个快速生成AI制图并开放予大众申请使用的平台!只需要输入关键字,就能够通过AI算法生成相对应的图片,还可以选择不同艺术家的风格,识别特定镜头或摄影术语,效果炸裂

在这里插入图片描述

Notion是一款多功能协作工具,它将笔记、项目管理、文档编辑、知识库等多种功能集成在一个应用程序中!通过AI的方式我们可以快速整理笔记、写文章、条列大纲、制作表格、检查文法等

在这里插入图片描述

Amazon CodeWhisperer是亚马逊推出的实时AI编程助手,是一项基于机器学习的服务,它可以分析开发者在集成开发环境(IDE)中的注释和代码,并根据其内容生成多种代码建议

在这里插入图片描述

笔灵AI是一款面向专业写作领域的AI写作工具,一键生成工作计划,营销方案等100种真实案例写作内容

在这里插入图片描述
妙鸭相机通过AI学习消费者上传的照片来构建人脸模型,然后把人脸模型套用其他模型合成照片(简单来说就是AI获取人的五官后,给五官P上新的发型、妆容、衣服、场景来合成一张新的照片)。所以只要上传完照片,就能产生无数风格的写真

在这里插入图片描述

3. 聊天机器人

ChatGPT当属第一!它是OpenAI训练的对话式大规模语言模型,是InstructGPT的兄弟模型,二者同属GPT-3.5系列的主力模型。 模型采用对话格式,可以跟进回答问题、承认错误、挑战不正确的前提并拒绝不正当的请求,且支持中文

在这里插入图片描述

Monica是一款一体化 AI 助手,配备最先进的 AI 模型(GPT-4、Claude、Gemini 等),帮助您聊天、搜索、写作、翻译等。它还提供图像、视频和 PDF 处理工具在这里插入图片描述

豆包是你的智能小助手,可以为你答疑解惑,提供灵感,辅助创作,也可以和你畅聊任何你感兴趣的话题

在这里插入图片描述

4. 应用开发工具

DevOpsGPT是一款开源人工智能驱动的软件开发自动化解决方案,做为AI驱动的智能软件开发平台,DevOpsGPT将LLM(大语言模型)和DevOps工具相结合,通过利用Chat-GPT等大型语言模型的能力,将自然语言需求转化为可工作的软件。这一创新功能极大地提高了开发效率、缩短了开发周期、降低了沟通成本,从而带来更高质量的软件交付

在这里插入图片描述

xTuring提供了对LLMs(如LLaMA、GPT-J、Galactica等)快速、高效、简单的微调服务。通过易用的界面,用户可以根据自己的数据和应用来微调LLMs,方便定制和控制。整个过程可以在个人电脑或私有云中完成,确保数据的隐私和安全性

在这里插入图片描述

FlowiseAI是一个开源的用户界面可视化工具,使用Node Typescript/Javascript编写,通过LangchainJS来构建定制的大型语言模型(LLM)流程。该工具以图形化方式简化了AI模型的创建和管理,使用户能够更方便地定制和使用人工智能技术

在这里插入图片描述

Dify是一个易用的LLMOps平台,基于不同的大型语言模型能力,让更多人可以简易地创建可持续运营的原生AI应用。Dify提供多种类型应用的可视化编排,应用可开箱即用,也能以“后端即服务”的API提供服务

在这里插入图片描述

LlamaIndex是一个简单、灵活的数据框架,用于将自定义数据源连接到大型语言模型

在这里插入图片描述

LangChain是一个基于语言模型开发应用程序的框架

在这里插入图片描述

5. Prompt工具与社区

FlowGPT是一个专注于分享ChatGPT聊天指令问答模板的在线社区网站。在这里,用户可以浏览大量由FlowGPT社区上传的ChatGPT提示词,以及查找当前最流行且有用的提示词

在这里插入图片描述

Prompt Engine一个帮助开发者为大型语言模型制作提示的库

在这里插入图片描述

6. 通用基础大模型

Gemini是Google开发的跨模态的、真正通用的AI模型,可以无缝地处理文本、视觉、音频、图像和视频等多种输入和输出

在这里插入图片描述

Yi是李开复博士创办的AI2.0公司零一万物开源发布的首款预训练大模型

在这里插入图片描述

MistralAI团队发布了Mistral 7B,这是迄今为止最强大的小型语言模型。Mistral 7B是一个拥有73亿参数的模型,其在所有基准测试中均超过了Llama 2 13B,在许多基准测试中超过了Llama 1 34B,接近CodeLlama 7B在代码任务的表现,同时还擅长英语任务。该模型采用了分组查询注意力(GQA)和滑动窗口注意力(SWA)以实现更快的推理和处理更长的序列。Mistral 7B已在Apache 2.0许可下发布,可以无限制使用,并且易于微调以适应任何任务

在这里插入图片描述

Alpaca斯坦福大学的项目旨在构建并分享一种遵循指令的LLaMA模型。项目的代码库包含:用于微调模型的52K数据,生成数据的代码,微调模型的代码,以及从发布的权重差异中恢复Alpaca-7B权重的代码

在这里插入图片描述

GPT-4是由 OpenAI 开发的多模态大型语言模型,是 GPT 基础模型系列的第四个版本。它于2023年3月14日首次发布,并通过付费聊天机器人产品 ChatGPT Plus 和 OpenAI 的 API 向公众提供服务。作为一个基于 Transformer 的模型,GPT-4 采用了一种范式,即使用公共数据和“从第三方供应商许可的数据”进行预训练,以预测下一个标记。在此步骤之后,模型通过人类和人工智能的强化学习反馈进行了微调,以实现与人类对齐和符合政策的目标

Llama2是Meta(Facebook的母公司)的AI团队开发的一系列预训练和微调的大型语言模型(LLMs),参数规模从70亿到700亿不等。这些模型被设计用于在人工智能领域进行各种任务,如自然语言理解、文本生成和机器翻译等

在这里插入图片描述

百川大模型百川大模型目前包括Baichuan-7B/13B,Baichuan2-7B/13B,四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型。其中Baichuan-7B/13B两款大模型在多个权威评测榜单均名列前茅,累积下载量突破六百万在这里插入图片描述

书生·浦语 InternLM是一个开源的轻量级训练框架,旨在支持大模型训练而无需大量的依赖。通过单一的代码库,它支持在拥有数千个GPU的大型集群上进行预训练,并在单个GPU上进行微调,同时实现了卓越的性能优化。在1024个GPU 上训练时,InternLM可以实现近90%的加速效率。 基于InternLM训练框架,我们已经发布了两个开源的预训练模型:InternLM-7B和 InternLM-20B

在这里插入图片描述

Qwen通义千问是阿里推出的超大规模语言模型

在这里插入图片描述

7. 训练框架

Ray是一种高性能的分布式执行框架,主要针对大规模的机器学习和强化学习应用。它通过在全局控制存储中抽象系统的控制状态,并保持所有其他组件无状态,实现了可扩展性和容错性。Ray利用共享内存的分布式对象存储有效处理大数据,并采用自下而上的分层调度架构实现低延迟和高吞吐量的调度。它使用基于动态任务图和参与者的轻量级API,以灵活的方式表达各种应用

在这里插入图片描述

MindSpore是一种适用于端边云场景的新型开源深度学习训练/推理框架。 MindSpore提供了友好的设计和高效的执行,旨在提升数据科学家和算法工程师的开发体验,并为Ascend AI处理器提供原生支持,以及软硬件协同优化

在这里插入图片描述

Colossal-AI为您提供了一系列并行组件。我们的目标是让您的分布式 AI 模型像构建普通的单 GPU 模型一样简单。我们提供的友好工具可以让您在几行代码内快速开始分布式训练和推理

OneFlow是一个旨在用户友好、可扩展和高效的深度学习框架。使用OneFlow,可以轻松地通过类似PyTorch的API编写模型,利用全局张量将模型扩展到n维并行执行,并通过图编译器加速/部署模型。OneFlow提供了简洁而强大的工具,使开发者能够更轻松地构建和训练深度学习模型,并且具备灵活性和可扩展性

在这里插入图片描述

Jittor是一个基于即时编译和元算子的高性能深度学习框架,整个框架在即时编译的同时,还集成了强大的Op编译器和调优器,为您的模型生成定制化的高性能代码。Jittor还包含了丰富的高性能模型库,涵盖范围包括:图像识别,检测,分割,生成,可微渲染,几何学习,强化学习等等
在这里插入图片描述

Megatron是NVIDIA应用深度学习研究团队开发的大型强大的Transformer模型。该项目致力于大规模训练Transformer语言模型的研究。我们开发了高效的模型并行(张量、序列和管道)以及使用混合精度的多节点预训练方法,适用于GPT、BERT和T5等基于Transformer的模型

在这里插入图片描述

飞桨是一个开源的深度学习框架,由百度推出。它包含了各种深度学习模型和工具,可以帮助开发者更快速、高效地构建和训练深度学习模型。Paddle 支持多种深度学习模型,包括卷积神经网络 (CNN)、循环神经网络 (RNN)、生成对抗网络 (GAN)、自动编码器 (AE) 等。它还提供了多种预训练模型,可以直接使用,满足各种不同应用场景的需求

在这里插入图片描述

JAX是Google开发的用于变换数值函数的Python机器学习框架。它结合了修改版本的Autograd(自动通过函数的微分获得其梯度函数),和TensorFlow的XLA(加速线性代数)。它被设计为尽可能的遵从NumPy的结构和工作流程,并协同工作于各种现存的框架如TensorFlow和PyTorch

在这里插入图片描述

ONNX是一种针对机器学习所设计的开放式的文件格式,用于存储训练好的模型。它使得不同的人工智能框架(如Pytorch、MXNet)可以采用相同格式存储模型数据并交互

在这里插入图片描述

TensorFlow是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统,其中包含各种工具、库和社区资源,可助力研究人员推动先进机器学习技术的发展

在这里插入图片描述

PyTorch是一个开源的Python机器学习库,基于Torch,底层由C++实现,应用于人工智能领域,如计算机视觉和自然语言处理。它主要由Meta Platforms的人工智能研究团队开发

在这里插入图片描述

8. 开源数据集

RedPajama-Data-v2是一个开放的数据集,发布了RedPajama-V2版本,包含来自84个CommonCrawl数据集的30万亿个经过过滤和去重处理的标记(原始数据超过100万亿个),涵盖了5种语言:英语、法语、西班牙语、德语和意大利语

LLMDataHub致力于收集LLM高质量训练语料库的项目,提供了一系列专门用于聊天机器人训练的数据集

Hugging Face Datasets提供的开源数据集服务

9. 推理与部署平台及工具

OpenVINO是英特尔开发的一款功能强大的深度学习工具包,可实现跨多个硬件平台的优化神经网络推理。在本文中,我们讨论了 OpenVINO 的特性和优势,以及它如何与领先的计算机视觉平台 Viso Suite 集成,以构建和交付可扩展的应用程序

在这里插入图片描述

OpenLLM是一个用于在生产中操作大型语言模型 (LLM) 的开放平台,可以轻松地微调、服务、部署和监控任何LLM大模型

在这里插入图片描述

jina使用云原生技术构建多模式人工智能应用程序,Jina 为服务 ML 模型提供了流畅的 Python 体验,从本地部署过渡到 Docker-Compose、Kubernetes 或 Jina AI Cloud 等高级编排框架。Jina 使每个开发人员都可以使用先进的解决方案工程和云原生技术

在这里插入图片描述

  好了,到这里又到了跟大家说再见的时候了。创作不易,帮忙点个赞再走吧。你的支持是我创作的动力,希望能带给大家更多优质的文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/720870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter整体框架

Flutter整体框架由三部分组成:Framework、Engine和Embedder。 Framework Framework提供了一个用 Dart 语言编写的现代、反应式框架,由许多抽象的层级组成。它包括一套丰富的布局、动画、绘制、手势UI组件及配套代码,以及更基础的异步、文件、…

李沐动手学习深度学习——4.5练习

1. 在本节的估计问题中使用λ的值进行实验。绘制训练和测试精度关于λ的函数。观察到了什么? 修改代码运行如图所示,可以发现对于lamda值的变化而言,对于训练loss和测试loss的影响不大。但是如果λ 太大后,train和test的loss会变得…

Databend 开源周报第 134 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 支持多语句事务…

基于dashscope在线调用千问大模型

前言 dashscope是阿里云大模型服务平台——灵积提供的在线API组件。基于它,无需本地加载大模型,通过在线方式访问云端大模型来完成对话。 申请API key 老规矩:要想访问各家云端大模型,需要先申请API key。 对于阿里云&#x…

STM32(14)USART

USART:一种片上外设,用来实现串口通信,就是stm32内部的串口 USART简介 串并转换电路 串行通信和并行通信 串行:一根数据线,逐个比特位发送 为什么要串并转换 移位寄存器 USART的基本模型 通过查询SR(状态寄存器&…

简介IP地址证书如何申请

IP地址证书通常包含在SSL/TLS证书中,根据验证级别可分为域名验证型(DV)、组织验证型(OV)。对于直接绑定IP地址的场景,需选择支持IP地址验证的SSL证书。 跟常见的域名证书一样,IP地址证书在申请过程中同样需要验证IP的所有权,常见的…

Sublime Text4代码配色自定义方案

文章目录 前言Settings设置效果图 前言 关于Sublime Text对于我的使用体验,只能说内置的代码主题真的都太low了,一点都不好看。所以接下来我分享一下我自定义代码配色。当然,大家也可以通过我给的中文翻译注释来自定义自己喜欢的颜色。废话不…

Linux 设置快捷命令

以ll命令为例: 在 Linux 系统上,ll 命令通常不是一个独立的程序,而是 ls 命令的一个别名。 这个别名通常在用户的 shell 配置文件中定义,比如 .bashrc 或 .bash_aliases 文件中。 要在 Debian 上启用 ll 命令,你可以按…

神经网络结构——CNN、RNN、LSTM、Transformer !!

文章目录 前言 一、什么是CNN 网络结构 解决问题 工作原理 实际应用 二、什么是RNN 网络结构 解决问题 工作原理 应用场景 三、什么是LSTM 网络结构 解决问题 工作原理 应用场景 四、什么是Transformer 网络结构 解决问题 工作原理 BERT GPT 前言 本文将从什么是CNN&#xff1…

一个完整的Flutter项目的基本构成

目录 1.页面跳转2.本地数据库和读取2.1 在pubspec.yaml中添加数据库框架依赖2.2 创建db.dart 初始化数据库并创建表2.3 安装JsonToDart插件2.4 创建实体类 user_bean.dart2.5 增删改查: 3.网络请求数据解析UI渲染 本篇主要总结下一个完整的Flutter项目有哪些基本构成…

徐工集团与宁夏天元锰业集团召开战略合作会议

2024年3月3日,徐工集团党委书记、董事长杨东升一行考察宁夏天元锰业集团,并举行战略合作会议。宁夏天元锰业集团董事局主席贾天将及相关高管参加会议。双方围绕绿色低碳、智能化和信息化推进新一轮机械设备“以旧换新”,物流运输和矿山开采设…

VSCode通过SSH连接Docker环境进行开发

文章目录 VSCode 插件Docker 镜像构建镜像部署环境 VSCode 连接本地Docker容器VSCode SSH连接Docker容器VSCode 打开容器内目录文件 VSCode 插件 Remote - SSH Docker 镜像 https://hub.docker.com/_/golang # Golang 镜像 docker pull golang:1.22构建镜像 Dockerfile F…

ThreadPoolExecutor 学习

ThreadPoolExecutor 是开发中最常用的线程池,今天来简单学习一下它的用法以及内部构造。 1、线程池存在的意义? 一般在jvm上,用户线程和操作系统内核线程是1:1的关系,也就是说,每次创建、销毁线程的时候&am…

Python基础:标准库 -- Time 时间的访问和转换

1. 官方文档 time --- 时间的访问和转换 — Python 3.12.2 文档 2. 准备知识 协调世界时 UTC (Coordinated Universal Time) 协调世界时(Coordinated Universal Time,UTC),是一种国际标准的时间表示方式。UTC 是以原子钟为基础…

【代码】Python3|无GUI环境中使用Seaborn作图的学习路线及代码(阴影折线图)

我有个需求是需要画图,让GPT帮我生成了一下学习计划。 学习路线依照GPT的来的,使用的Prompt工具是https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor。 文章目录 PrerequisiteMain Curriculum1.1 Seaborn介绍Seaborn基础保存图形为文件练习 1.2 单变量数…

产品推荐 - GX-SOPC-5CEFA5-M484 FPGA核心开发板

● 核心板采用8层板精心设计 ● FPGA:采用Intel(ALTERA) Cyclone V 5CEFA5,Les为77K,内嵌存储器为4460Kb,硬件乘法器为300个,最大等效门数约2300万门;新增DSP Block(150…

Unity3D

一、C# 输入输出 二、三维数学

线性dp P1004 【方格取数】题解

代码比较简单的一题,重在思路(除非写假了) 传送门https://www.luogu.com.cn/problem/P1004 我的最初思路是两次二维dp,即贪心的取,用pre记录前一个位置,只有80pts,要是是在蓝桥拿分就可以跑路…

使用reduce递归获取有多层嵌套的数组中的children

常见的多层嵌套的数组,如下 const items [{id: 1,name: "item1",children: [{id: 11,name: "item11",children: [{id: 111, name: "item111"},{id: 112, name: "item112"}]},{id: 12,name: "item12",children:…

MySQL--优化(SQL语句执行慢,如何分析)

MySQL–优化(SQL语句执行慢,如何分析) 定位慢查询SQL执行计划索引 存储引擎索引底层数据结构聚簇和非聚簇索引索引创建原则索引失效场景 SQL优化经验 一、如何分析 聚合查询: 对于涉及大量数据的聚合操作,如果可能的…