大模型现有领域研究

分类参考https://csdnnews.blog.csdn.net/article/details/137337597?spm=1000.2115.3001.5926&ydreferer=aHR0cHM6Ly93d3cuY3Nkbi5uZXQv

对现有领域热点进行总结,后续会基于这些进行补充,会对其中的名词进行解释。

开始编辑日期2024/4//4,最后编辑时间2024/4/4

1. 大语言模型技术演进

LLM: Large Language Model大语言模型

AGI: Artificial General Intelligence人工通用智能

2. 多模态大模型

多模态:多模态即多种异构模态数据协同推理。多模态数据分析外需与高级认知智能内需相互促进。在人工智能领域中,往往指感知信息,如图像、文本、语音等协同,帮人工智能更准确地理解外部世界。 可用方法包含:双路卷积神经网络等。

3 大模型工程与架构

分布式:基于多节点/机器的,之间通过网络互联,可以是高性能网络、也可以是Internet网络。

4 大模型应用开发实践

大模型RAG:Retrieval-Augmented Generation检索增强生成

具体来说,RAG通过以下方式工作:

  • 它首先利用检索模块从大规模知识库中检索与当前任务相关的信息。

  • 然后,这些检索到的信息与大型语言模型结合,以生成符合上下文的准确回答。这种结合不仅提高了答案的准确性,还增强了其相关性。

RAG的应用范围广泛,包括问答系统、文本摘要、对话系统等多个领域。它的主要技术优势在于能够提供准确且符合上下文的答案,同时减少模型幻觉,提升对实时性要求较高问题的处理能力。这与传统仅依赖LLM生成内容的方法相比,RAG技术可以从外部知识库中检索信息,避免了模型的幻觉问题,并提升了对实时性要求较高问题的处理能力。

5 GenAI

GenAI(生成式人工智能)是一种基于深度学习和自然语言处理技术的人工智能系统,能够生成类似人类的文本、图像、音频等内容。

GenAI利用大规模神经网络模型,根据训练数据对文本、图像、视频、音频等进行自动生成。其代表应用包括对话系统如ChatGPT)、图像生成模型(如DALL-E),以及其他模态的生成模型。GenAI不仅能分析现有数据,还能生成新数据,甚至探索未知领域。

6 代码大模型

论文综述:A Survey on Language Models for Code

https://arxiv.org/pdf/2311.07989v1.pdf

7 大模型应用框架

例如:TensorRT-LLM

8 AI 智能代理 (AI Agent)

LLM-based Agent: 例如定制化的LLM

复旦团队调研:https://github.com/WooooDyy/LLM-Agent-Paper-List?tab=readme-ov-file

9 AI Infra 大模型基础设施

AI Infra,即人工智能基础设施,是连接算力和应用的AI中间层基础设施。它涵盖了数据准备、模型训练、模型部署和应用整合等环节,其中的基础软件工具有较高商业化潜力。AI Infra包括处理器、操作系统、存储系统、网络基础设施、云计算平台等底层技术设施。

10 ML/LLM Ops 大模型运维

MLOps是一种将软件工程的原则和实践应用于机器学习(ML)系统的实践,旨在自动化和管理机器学习模型的生命周期。

MLOps涵盖数据处理、模型训练、模型部署、模型监控和模型更新等阶段。MLOps的核心目标是提高机器学习系统的可靠性、可重复性、可扩展性和安全性,以更好地满足业务需求。MLOps不仅仅是一组工具或技术,而是一种整合数据科学家、工程师和运营人员之间合作的实践方法,旨在实现高效、协作的机器学习开发和部署流程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/797440.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

提升团队工程交付能力,从“看见”工程活动和研发模式开始

作者:张裕、雅纯 理想中的研发团队应当具有以下特征: 总是工作在最高优先级的事项上 理想的研发团队能够识别并始终集中精力在当前最紧迫和最有价值的任务上。这需要团队具备出色的项目管理能力和决策能力,以便能够正确评估优先级&#xff0…

Vue 项目如何在VSCode中进行断点调试

概要: 简单介绍一下,在VSCode中如何对Vue项目进行断点调试。具体内容包括但不限于:如何配置调试环境、如何在代码中设置断点、如何启动调试以及如何解决在调试过程中可能遇到的问题。 实际开发中,我们的前端项目一般都是在浏览器…

算法 day28 回溯4

93 复原IP地址 给定一个只包含数字的字符串 s ,用以表示一个 IP 地址,返回所有可能的有效 IP 地址,这些地址可以通过在 s 中插入 ‘.’ 来形成。你 不能 重新排序或删除 s 中的任何数字。你可以按 任何 顺序返回答案。 有效 IP 地址 正好由…

设计模式:享元模式案例

让我们以游戏开发中的棋类游戏(例如国际象棋)为例来展示享元模式的代码实现。在这个例子中,棋子的类型是内部状态,而棋子的位置是外部状态。 Java 代码示例 import java.util.HashMap; import java.util.Map;// 享元接口 interf…

windows 系统下 mysql 数据库的下载与安装(包括升级安装)

windows 系统下 mysql 数据库的下载与安装(包括升级安装) 一、mysql 介绍: MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,属于 Oracle 旗下产品。 MySQL 是最流行的关系型数据库管理系统之一&#xf…

Springboot的事务管理

在Service层的方法头顶上加上Transactional 声明这个方法是个事务,要么都成功,要么都失败。 这经常用于批量操作,避免第一次没成功,执行第二次的时候重复插入相同数据,或者有些插入删除操作未被执行,就开…

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。 …

5G时代下电子元器件电商平台的发展策略与应对措施

在5G时代下,电子元器件电商平台的发展策略与应对措施需要考虑以下几个关键因素: 技术产品更新换代: 随着5G技术的普及和应用,电子元器件的需求将发生变化,对于支持5G技术的电子元器件的需求会增加,而对于旧…

llama2的python视角

1 调试代码 if __name__ __main__ :config ModelArgs(dim8, n_layers2, n_heads32, n_kv_heads32, vocab_size32000, hidden_dimNone, multiple_of256, norm_eps1e-05, max_seq_len3, dropout0.0)model Transformer(config)input_tokens torch.randint(0, 32000, (1, 3)) …

【已解决】HalconDotNet.HOperatorException:“HALCON error #1201: Wrong type of control

前言 最近在学习Halcon视觉和C#的联合开发,碰到一个比较有意思的问题记录一下,大致的报错信息是说我用的halcondotnet版本和我在halcon导出的使用的halcondotnet.dll版本不一致,所以才报错的! 解决 首先你得找到你安装halcon的…

大模型技术ollama入门教程

下载 下载:https://ollama.com/download 我下载的是Windows版本: Docker启动 使用Docker启动要更简单点。 拉取镜像: docker pull ollama/ollama使用CPU启动: docker run -d -v ollama:/root/.ollama -p 11434:11434 --nam…

设计模式面试题(六)

1.什么是建造者模式 建造者模式(Builder Pattern)是一种创建型设计模式,它提供了一种构建复杂对象的最佳方式。这种模式允许你将一个复杂对象的构造过程分解成若干个简单的步骤,这样可以使最终对象的构建过程和表示方式分离&…

云骑士数据恢复怎么授权别的电脑

随着科技的不断发展,数据恢复已经成为了我们生活中不可或缺的一部分。云骑士数据恢复作为一款功能强大的数据恢复软件,受到了广泛的欢迎。但是,有时候我们需要将云骑士数据恢复授权给其他电脑使用,这就需要我们了解相关的操作步骤…

夯实智慧新能源数据底座,TiDB Serverless 在 Sandisolar+ 的应用实践

本文介绍了 SandiSolar通过 TiDB Serverless 构建智慧新能源数据底座的思路与实践。作为一家致力于为全球提供清洁电力解决方案的新能源企业,SandiSolar面临着处理大量实时数据的挑战。为了应对这一问题,SandiSolar选择了 TiDB Serverless 作为他们的数据…

【JAVASE】带你了解instanceof和equals的魅力

✅作者简介:大家好,我是橘橙黄又青,一个想要与大家共同进步的男人😉😉 🍎个人主页:再无B~U~G-CSDN博客 1.instanceof instanceof 是 Java 的保留关键字。它的作用是测试…

【排列回溯】Leetcode 46. 全排列 47. 全排列 II

【排列回溯】Leetcode 46. 全排列 47. 全排列 II 46 全排列——used数组上下层保证不取重复的即可47. 全排列 II——used去重上下层,再去重本层重复元素 46 全排列——used数组上下层保证不取重复的即可 ---------------🎈🎈题目链接&#x…

Redis数据库的入门学习

关系型数据库和非关系型数据库的区别: 简介 Redis数据库和MySql数据库的区别:Redis数据库是基于内存的key-value结构的数据库。本质上是内存存储。 而MySql数据库是通过数据文件的方式存在磁盘当中,本质上是磁盘存储。且MySql当中是通过二维…

考研数学|《880题》这样刷效率最高,效果最好!

考研数学880题是很多考生在备考过程中会选择的一本习题集,它涵盖了大量的基础题、综合题和拓展题,对于巩固知识点和提升解题能力非常有帮助。针对你的情况,这里提供一些建议来提高刷题效率。 首先在过完1800基础篇后,你已经具备了…

C++ 枚举类型 ← 关键字 enum

【知识点:枚举类型】● 枚举类型(enumeration)是 C 中的一种派生数据类型,它是由用户定义的若干枚举常量的集合。 ● 枚举元素作为常量,它们是有值的。C 编译时,依序对枚举元素赋整型值 0,1,2,3,…。 下面代…

Python数据分析十七

一、Python之判断运算符is和isnot 在Python中,我们可以使用is和is not运算符来判断两个对象是否相同或不相同。下面我将为你详细讲解is和is not运算符的用法,并给出相应的代码示例。 1.is运算符: is运算符用于检查两个对象是否引用同一个内…