大模型日报2024-06-02

大模型日报

 

2024-06-02

 

大模型资讯

 

  1. LLM360推出K2:开源大语言模型,计算效率超越Llama 2 70B

 

  • 摘要: LLM360发布了K2,一款完全可复现的开源大语言模型。K2在计算效率上超越了Llama 2 70B,使用的计算能力减少了35%。这一突破性的模型为大规模语言处理提供了更高效的解决方案。

 

  1. Uni-MoE: 多专家混合的统一多模态大语言模型扩展

 

  • 摘要: 最近,多模态大语言模型(MLLMs)在架构和性能方面的进展突显了其重要性。Uni-MoE通过多专家混合方法,进一步扩展了这些模型的能力,提升了多模态数据处理的效率和准确性。

 

  1. OpenAI正在训练GPT-5,三大升级亮点值得期待

 

  • 摘要: 尽管OpenAI最近推出的GPT-4o大幅提升了大型语言模型的标准,但该公司已经开始训练其继任者GPT-5。预计GPT-5将带来三大重要升级,进一步推动人工智能技术的发展。

 

  1. AutoCoder超越GPT-4 Turbo和GPT-4o在人类评估基准测试中取得领先

 

  • 摘要: AutoCoder成为首个在2024年4月的人类评估基准测试中以90.9%的pass@1成绩超越GPT-4 Turbo和GPT-4o的超大型语言模型。

 

  1. OpenAI推出面向大学的ChatGPT工具

 

  • 摘要: OpenAI发布了一款专为大学设计的ChatGPT工具,旨在更广泛地向学生及其校园社区推广人工智能应用。

 

  1. 从ChatGPT到Gemini:AI如何重塑互联网

 

  • 摘要: 大型科技公司如微软(Copilot)、谷歌(Gemini)和OpenAI(GPT-4o)正在推动AI聊天机器人技术的发展,这些技术以前仅限于测试阶段。

 

  1. EmbedAI漏洞可导致恶意数据混入LLM

 

  • 摘要: EmbedAI存在漏洞,可能允许恶意数据混入语言模型。此漏洞可被利用,诱使用户无意中上传和整合错误数据到应用程序的语言模型中,造成误导。

 

  1. Core42发布最新阿拉伯语大语言模型,现已在微软Azure上线

 

  • 摘要: G42旗下公司Core42宣布其最新的阿拉伯语大语言模型现已在微软Azure平台上线,为中东地区提供全面的AI赋能解决方案。这一发布标志着Core42在AI技术领域的又一重要进展。

 

  1. Meta将为部分AI产品引入水印功能

 

  • 摘要: Meta平台将在未来几周内为其文本生成图像产品Imagine添加不可见水印功能,并与Meta AI聊天机器人结合使用。

 

  1. 印度初创公司JiviAI声称其AI医疗语言模型优于谷歌和OpenAI

 

  • 摘要: 古尔冈的初创公司JiviAI表示,其基于AI的医疗语言模型在性能上超越了谷歌和OpenAI的同类产品。该公司在新德里宣布了这一消息,强调其技术的领先地位。

 

大模型产品

 

大模型论文

 

  1. 大语言模型在Web任务中的自我提升能力

 

  • 摘要: 研究大语言模型在复杂环境中作为代理的自我提升能力,通过在WebArena基准测试中自我改进,任务完成率提高31%。

 

  1. MotionLLM:多模态人类行为理解

 

  • 摘要: 本研究提出MotionLLM框架,结合视频和运动数据,提升人类行为理解、描述与推理能力,并引入MoVid数据集和MoVid-Bench评估基准。

 

  1. 通过参数空间对齐实现视觉感知

 

  • 摘要: 提出VLoRA,通过参数空间对齐减少输入序列长度,显著降低计算成本,同时保持多模态任务性能。

 

  1. RapVerse:从文本生成3D动作与歌唱

 

  • 摘要: 提出RapVerse,通过收集同步的说唱数据集,利用多模态变换器,实现从文本生成3D整体动作和歌唱声音。

 

  1. Xwin-LM:LLM对齐方法的强大实践

 

  • 摘要: Xwin-LM提供了一套全面的对齐方法,包括监督微调、奖励模型、拒绝采样微调和直接偏好优化,显著提升LLM性能。

 

  1. ParSEL: 自然语言驱动的3D形状编辑系统

 

  • 摘要: ParSEL系统通过自然语言实现高质量3D资产的可控编辑,利用LLM和AEP算法生成参数化编辑程序,精确控制形状变化。

 

  1. CausalQuest:自然因果问题数据集构建

 

  • 摘要: CausalQuest收集了13,500个自然因果问题,利用人工和大模型标注,训练高效分类器识别因果问题,F1评分达0.877。

 

  1. ANAH: 大语言模型幻觉的分析性注释

 

  • 摘要: ANAH是一个双语数据集,提供生成性问答中大语言模型幻觉的细粒度注释,包含约12k句子级注释。

 

  1. FoldFlow-2: 蛋白质骨架生成的序列增强SE(3)流匹配

 

  • 摘要: FoldFlow-2利用氨基酸序列的生物偏置,结合多模态融合和几何变换器,提升蛋白质结构生成的多样性和新颖性。

 

  1. PlausiVL: 真实世界中可行动作序列预测模型

 

  • 摘要: 介绍PlausiVL,一个大规模视频语言模型,通过引入两种目标函数,提升动作序列的合理性,改善未来动作预测。

 

大模型开源项目

 

  1. ChatTTS: 日常对话生成语音模型

 

  • 摘要: ChatTTS是一个用于日常对话的生成语音模型,采用Jupyter Notebook编写,适合生成自然对话的语音输出。

 

  1. ChatTTS本地网页语音合成工具

 

  • 摘要: 一个简洁的本地网页界面应用,使用ChatTTS将文字合成为语音,并支持API接口调用,基于Python开发。

 

  1. MusePose:虚拟人生成图像到视频框架

 

  • 摘要: MusePose使用姿态驱动技术,实现虚拟人从图像到视频的生成,基于Python语言开发。

 

  1. ToonCrafter:生成卡通插值研究

 

  • 摘要: ToonCrafter是一个用Python编写的项目,主要研究生成卡通插值技术。该项目通过生成模型实现卡通图像的平滑过渡。

 

  1. Fabric:增强人类的AI开源框架

 

  • 摘要: Fabric 是一个用Python编写的开源框架,通过众包AI提示解决特定问题,旨在增强人类能力。

 

  1. 腾讯AI实验室V-Express项目

 

  • 摘要: V-Express通过参考图像、音频和V-Kps图像序列生成可控的说话人视频,使用Python编写。

 

  1. 新模型超越GPT-4 Turbo代码生成

 

  • 摘要: 我们推出了一种新模型,用于代码生成任务。在HumanEval基准数据集上的测试准确性超过了GPT-4 Turbo(2024年4月)和GPT-4o。

 

  1. Novita AI动画实现

 

  • 摘要: Novitalabs项目提供了Novita AI的非官方实现,使用Python编写,可以为任何人生成动画效果。

 

  1. LLM应用集合:支持多种模型

 

  • 摘要: 收集了使用OpenAI、Anthropic、Gemini和开源模型的LLM应用,展示了RAG技术的实际应用,基于Python语言开发。

 

  1. Dify: 开源LLM应用开发平台

 

  • 摘要: Dify是一个开源LLM应用开发平台,提供AI工作流、RAG管道、代理功能、模型管理和可观测性等特性,助您快速从原型到生产。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/21252.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA: 抽象类和接口

Java中可以可以定义不含方法体的方法,方法的方法体由其所在类的子类根据实际需求去实现,这样的方法称为抽象方法(Abstract Method),包含抽象方法的类必须是抽象类(Abstract Class)。 抽象方法和…

【架构设计】Java如何利用AOP实现幂等操作,防止客户端重复操作

1实现方案详解 在Java中,使用AOP(面向切面编程)来实现幂等操作是一个常见的做法,特别是当你想在不修改业务代码的情况下添加一些横切关注点(如日志、事务管理、安全性等)时。幂等操作指的是无论执行多少次,结果都是相同的操作。 为了利用AOP实现幂等操作以防止客户端重…

基于STM32的水库预警系统的Proteus仿真

文章目录 一、水库预警系统1.题目要求2.思路2.1 OLED显示汉字2.2 水质传感器等等2.3 步进电机2.4 驱动水泵 3.仿真图3.1 未仿真时3.2 开始仿真,OLED开始显示3.3 提高水位,开启阀门和预警3.4 通过按键增大水位阈值,取消报警 4.仿真程序4.1 程序…

轻松拿捏C语言——【文件操作】

🥰欢迎关注 轻松拿捏C语言系列,来和 小哇 一起进步!✊ 🎉创作不易,请多多支持🎉 🌈感谢大家的阅读、点赞、收藏和关注💕 🌹如有问题,欢迎指正 目录 &#x1f…

关于模拟信道和数字信道根本区别的探讨

在学习过程中,了解到模拟信号、数字信号是什么,以及模拟信道只能传输模拟信号,数字信道只能传输数字信号,模拟信道要传输数字信号,需要经过调制解调器将数字信号调制成模拟信号再传输。也了解到,电话线是属…

谨以此文章记录我的蓝桥杯备赛过程

以国优秀结束了蓝桥杯cb组 鄙人来自电信学院,非科班出身,在寒假,大约2024年2月份,跟着黑马程序员将c基础语法学完了,因为过年,事情较多,没在学了。 最初就是抱着拿省三的态度去打这个比赛的&a…

C语言之旅:探索单链表

目录 一、前言 二、实现链表的功能: 打印 创建节点 尾插 尾删 头插 头删 查找 在指定位置之前插入数据 指定位置删除 在指定位置之后插入数据 打印 销毁 三、全部源码: 四、结语 一、前言 链表是一个强大且基础的数据结构。对于很多初…

禁用手机连接 - Win11

问题 Win11系统自带手机连接软件,会在后台自启,不适用于全部的手机型号,而且常规方法无法卸载。甚至任务管理器中,此软件的后台进程高达76个,如下图。下文以Win11系统为例,介绍如何禁用手机连接。 解决方…

考研数学:有些无穷小不能用等价无穷小的公式?

今天要给大家分享的笔记是:《有些无穷小虽然是无穷小,但却不能用无穷小的相关公式》:

Winform GDI+双缓冲绘图与GDI API双缓冲绘图

一、GDI双缓冲绘图 BufferedGraphicsContext GraphicsContext BufferedGraphicsManager.Current;BufferedGraphics myBuffer GraphicsContext.Allocate(e.Graphics, e.ClipRectangle);Graphics g myBuffer.Graphics;Bitmap bitmap bitmaps[index];g.DrawImage(bitmap, 0, 0…

来自大厂硬盘的降维打击!当希捷酷玩520 1TB SSD卷到369,请问阁下该怎么应对?

来自大厂硬盘的降维打击!当希捷酷玩520 1TB SSD卷到369,请问阁下该怎么应对? 哈喽小伙伴们好,我是Stark-C~ 今年4月份的时候因为电脑上的游戏盘突然挂掉,为了性价比选购了希捷酷玩520 1TB SSD,同时我也是…

vue3加axios配合element-plus实现图片等文件本地上传,并获取服务器返回的真实地址数据,前端写法

小白写法嘿嘿 开发工具和关键词 开发工具: vscode 关键词:vue3、element-plus、axios 后端 后端业务逻辑处理使用的是unicloud的云函数,大家可以看我上一篇文章。 思路 1、禁止element-plus的el-upload组件自动上传,变成手动上传…

装修10个容易被遗忘的开关插座位置

雅静说家里开关插座哪些最容易忘记了留?      一共10个,你看看有少的吗,我家水电师父就没有留够      来了又重新补的很麻烦,记得收藏      1,大门口上边留一个,后期可以安装监控      特别家里有老人和小孩,以及经常来快递的      2,弱电箱留…

7. MySQL 视图、索引

文章目录 【 1. 视图 View 】1.1 视图原理1.2 创建视图 CREATE VIEW1.2.1 创建基于单表的视图1.2.2 创建基于多表的视图 1.3 查看视图1.3.1 查看视图的内容1.3.2 查看视图的详细信息 1.4 修改视图 ALTER VIEW1.4.1 修改视图内容1.4.2 修改视图名称 1.5 删除视图 DORP VIEW 【 2…

961题库 北航计算机 计算机网络 附答案 选择题形式

有题目和答案,没有解析,不懂的题问大模型即可,无偿分享。 第1组 习题 OSI 参考模型的第 5 层( 自下而上 ) 完成的主要功能是 A. 差错控制 B. 路由选择 C. 会话管理 D. 数据表示转换 100BaseT 快速以太网使用的导向传输介质是 A. 双绞线 B. …

Gin的快速入门和搭建

文章目录 Go的工程工程架构技术选型 Gin入门 Go的工程 基于Go生态,构建一个支持内容管理,内容加工、内容分发的内容库系统。 内容管理:增删改查内容加工:例如内容审核、推荐等内容分发:将内容可以推到不同的业务线 …

linux进阶的一些操作以及知识点------习题集(实践)

请创建以你姓名全拼的用户luwenhua,将其设置为免密登录,切换到luwenhua用户,打开终端,完成以下操作 (一)bash脚本基础练习 1)第一题:请在终端里定义两个用户变量num120&#xff0c…

C# try catch异常捕获

异常捕获 执行过程:try中的代码没有出现异常,则catch里面不会自行,如果try中代码出现异常,则后面的代码都不执行,直接跳到catch中的代码执行。 // try catch 可以捕获多个错误, try...catch...catch.... …

【HarmonyOS】 多层嵌套对象通过@ObjectLink和@Observed实现渲染更新处理!

【HarmonyOS】 多层嵌套对象通过ObjectLink和Observed实现渲染更新处理! 一、问题背景: 上文讲过 (【HarmonyOS】List组件多层对象嵌套ForEach渲染更新的处理)对多层嵌套的简单处理,即:深拷贝item数据&…

C++一个StringBad类

设计一个字符串类,下面的代码是一个不好的设计,起名StringBad。 //stringbad.h #pragma once //一个设计有问题的string类 #include <iostream> using namespace std;class StringBad { public:StringBad();//默认构造函数StringBad(const char* s);//构造函数~StringBa…