AI日报|英伟达Nemotron-4 340B模型助力各行业数据生成,扣子发起匿名AI模型擂台赛!

文章推荐

AI日报|跃问App上架加入AI助理竞争!GPTZero获千万美元A轮融资,创始人不到30岁!

AI日报|Luma推出AI视频模型,又一Sora级选手登场?SD3 Medium发布,图中文效果改善明显

⭐️搜索“可信AI进展“关注公众号,获取当日最新AI资讯

今日热点

Nvidia推出“Nemotron-4 340B”模型,重新定义合成数据生成,可与GPT-4相媲美

NVIDIA近日推出一组开放模型Nemotron-4 340B,开发人员可以使用这些模型生成合成数据,以训练大型语言模型。

Nemotron-4 340B在训练中使用了多达9万亿个标记,拥有4,000个上下文窗口,并支持50多种自然语言和40种编程语言。

其表现远超其竞争对手,包括 Mistral的Mixtral-8x22B、Anthropic 的Claude-Sonnet、Meta 的Llama3-70B,甚至可以与GPT-4的性能相媲美。

Nemotron-4 340B对各行各业的潜在影响不容小觑。

  • 在医疗保健领域,生成高质量合成数据的能力可能带来药物研发、医学成像方面的突破。
  • 在金融领域,使用合成数据训练的定制LLM可以彻底改变欺诈检测、风险评估和客户服务。
  • 制造业和零售业也可以从特定领域的LLM中受益匪浅,从而实现预测性维护、供应链优化和个性化客户体验。

https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/

https://venturebeat.com/ai/nvidias-nemotron-4-340b-model-redefines-synthetic-data-generation-rivals-gpt-4/

聆心智能新一代超拟人大模型CharacterGLM Pro版正式对外提供服务

聆心智能推出新一代超拟人大模型CharacterGLM Pro版,已正式对外提供服务。

CharacterGLM Pro基于最新且门类更加丰富的数据进行训练,听取了真实产品和用户的反馈建议,使得回答更贴心,陪伴更有趣。

用户此后无需经历复杂的引导过程即可一键与贴心的陪伴伙伴聊天,获取情感支持和陪伴。

https://mp.weixin.qq.com/s/kYz4sdzYGOJKX8dUsTbNeg

软银宣布与Perplexity AI达成战略合作

日本软银今天宣布与Perplexity AI达成战略合作,将于6月19日向Softbank、Y-Mobile和LINEMO三大品牌的用户开放Perplexity Pro一年免费试用的申请。

Perplexity今年4月获得来自软银和德国电信6270万美元投资,公司估值超10亿美元。

https://baijiahao.baidu.com/s?id=1802095135725311075

日本AI初创公司Sakana AI获超1亿美元投资,估值超过10亿美元

参与洽谈的消息人士透露,由美国投资基金牵头的投资方,将向Sakana AI注资约200亿日元,也就是约1.28亿美元,Sakana AI的估值就将达到1800亿日元,折合约11.5亿美元,将成为AI领域新的独角兽。

Sakana AI成立还不到1年,1月16日,曾在官网宣布融资3000万美元,用于人工智能技术的研发。

https://www.fromgeek.com/ai/642214.html

字节跳动“扣子模型广场”正式上线,大模型可匿名PK

模型广场是扣子发布的在线大模型对比与评估系统。可通过模型对战与两个匿名模型实时对话,并根据模型的回答进行投票。

扣子会持续收集用户的匿名投票数据,根据Bradley-Terry模型对大模型进行评分。

扣子模型广场支持多种对战方式,适用于各种模型评估场景。

纯模型对战:忽略编排等各种Bot配置的影响,直接评估大模型的文本生成能力。

基于Bot的模型对战:使用扣子已正式发布的Bots,在各种多样化的场景中对比不同大模型的问答效果,评估真实业务场景下不同模型的文本生成、技能调用、知识调用等能力,帮助你为不同领域的Bot选择更合适的大模型。

https://www.coze.cn/model/arena?bid=6cqtlt2v87g1v&utm_source=lb

北京智源人工智能研究院公布一系列大模型“全家桶”和智算软件系统

北京智源人工智能研究院(以下简称智源研究院)公布一系列大模型“全家桶”和智算软件系统。

其中包括发布万亿参数的大语言模型进展,用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持8种芯片的智算操作系统FlagOS。

智源研究院院长王仲远表示,FlagOS是面向大模型、支持多种异构算力的智算集群软件栈。

目前,FlagOS已支持超过50个团队的大模型研发,支持8种芯片,管理超过4600个AI加速卡,稳定运行20个月,SLA(服务级别协议)超过99.5%。

其中,支持多元AI异构算力的并行训练框架FlagScale支持基于国产算力的8x16B千亿参数MoE语言大模型1024卡40天以上的稳定训练,全面帮助用户实现高效稳定的集群管理、资源优化、大模型研发。

https://www.tmtpost.com/7129429.html

国内大模型四小龙共同探讨:大模型在AGI发展中关键作用

国内大模型四小龙:百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海,在2024年智源大会上就“大模型是否是通往AGI之路的基石”的话题,分享了他们对大模型在AGI发展中关键作用的见解。

百川智能CEO王小川:大模型是通往AGI的基石,但仅靠Scaling Law无法实现AGI,还需进行范式转换,如数据算法算力的创新,以及探索新的学习范式和压缩模式。

智谱AI CEO张鹏:虽然目前无法确定大模型能否帮助人类达到AGI的顶峰,但在现阶段,大模型是有效的,并且Scaling Law在未来相当一段时间内仍然会发挥作用。他认为AGI是一个动态的概念,其内涵和外延会不断变化。

月之暗面CEO杨植麟:大模型是第一性原理,通过提升模型规模和进行更好的压缩,可以产生智能。但在数据稀缺或不存在的领域,需要解决数据问题。他认为AGI的定义重要,但短期内难以精确量化,需要对评估维度进行拆分,以更好地衡量AGI的开发进度。

面壁智能CEO李大海:大模型是通往AGI方向上当前所有技术中能走得最远的,但能否直接达到AGI还存在未知因素。他认为大模型目前主要处理人的大脑系统1“快思考”的工作,未来需要通过agent技术将系统的能力外部化或内化。

https://new.qq.com/rain/a/20240614A096WJ00

OpenAI CEO奥尔特曼:OpenAI正在考虑转变为一家营利性企业。OpenAI 回应:非营利组织是公司核心使命

OpenAI CEO奥特曼曾在前几日告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。

奥特曼表示,董事会正在考虑的一种方案是成立一家营利性福利公司,Anthropic和xAI等竞争对手正在采用这种方案。

据The Information报道,重组讨论仍在进行中,奥特曼和其他董事最终可能会决定采取不同的方式。

在回应路透社对该报道的询问时,OpenAI表示:“我们仍致力于打造让所有人受益的人工智能。非营利组织是我们使命的核心,并将继续存在。”

https://www.reuters.com/technology/artificial-intelligence/openai-ceo-says-company-could-become-benefit-corporation-information-2024-06-15/

https://www.ithome.com/0/775/637.ht

“可信 AI 进展 “ 公众号致力于最新可信人工智能技术的传播和开源技术的培育,覆盖大规模图学习,因果推理,知识图谱,大模型等技术领域,欢迎扫码关注,解锁更多 AI 资讯~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/29591.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Day41

Day41 文件的上传 浏览器底层是通过输入流读取文件,通过输出流传输到服务器,服务器通过输入流读取数据,通过输出流将文件保存在本地。注意:浏览器的表单不许用post请求,get请求会将数据显示在地址栏里。 上传头像 场景…

【数据结构与算法(C语言)】循环队列图解

目录 1. 前言1.1 普通循环队列假溢出1.1.1 初始化队列1.1.2 插满队列1.1.3 删除元素后,再插入元素 1.2 循环队列1.2.1 插入元素,队列已满1.2.2 将元素J1、J2出列,循环队列又空出两个空间1.2.3 元素J6可以继续入列 2. 存储结构和函数说明2.1 队…

vivado PIP or SITE_PIP、PKGPIN_BYTEGROUP

PIP是Xilinx部件上用于路由连接或网络的设备对象。PIP 称为ARC的连接多路复用器可以编程为将一根电线连接到 另一个,从而将节点连接在一起,以形成中特定NET所需的路由 设计。 SITE_PIP,也称为路由BEL,是SITE内部的连接多路复用器&…

android常用知识

透明activity样式: android:theme"android:style/Theme.Translucent.NoTitleBar.Fullscreen"这句代码,当你是建的empty activity project时,默认继承的是AppCompat这个类。所以在AndroidMifext.xml文件中用上述代码会导致程序错误&…

Qt | 简单的使用 QStyle 类(风格也称为样式)

01、前言 者在 pro 文件中已添加了正确的 QT+=widgets 语句 02、基础样式 1、QStyle 类继承自 QObject,该类是一个抽像类。 2、QStyle 类描述了 GUI 的界面外观,Qt 的内置部件使用该类执行几乎所有的绘制,以确保 使这些部件看起来与本地部件完全相同。 3、Qt 内置了一系…

制造业为什么需要ERP企业管理软件?

如今,传统的制造业管理方式逐渐变得力不从心~库存积压、生产效率低下、供应链混乱…想象一下,如果你的企业仍然依赖于手工记录订单、库存和财务数据,那么每当市场发生变动时,你就需要花费大量的时间和精力去重新调整生产计划、更新…

【深度学习驱动流体力学】VTK创建、处理和可视化流体数据

Visualization Toolkit(VTK)是一个强大的开源软件系统,用于处理和可视化三维数据。它提供了丰富的工具和算法,可以处理从简单的网格数据到复杂的流体动力学模拟数据等各种类型的数据。本文将完整介绍如何使用 VTK 创建、处理和可视…

Springboot + Mybatis 实现sql打印

参照这个视频:https://www.bilibili.com/video/BV1MS411N7mn/?vd_source90ebeef3261cec486646b6583e9f45f5 实现mybatis对外暴露的接口Interceptor 使用Intercepts接口,这里的写法参照mybatis-plus中的拦截器写法 Intercepts({Signature(type Executor.class, m…

BC153 [NOIP2010]数字统计

数字统计 一.题目描述二.输入描述:三.输出描述:四.数字范围五.题目思路六.代码实现 一.题目描述 请统计某个给定范围[L, R]的所有整数中,数字2出现的次数。 比如给定范围[2, 22],数字2在数2中出现了1次,在数12中出现1次…

如何恢复iPhone iCloud云盘资料删除?给出建议

🏆本文收录于「Bug调优」专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&…

【Java】已解决com.mysql.cj.jdbc.exceptions.CommunicationsException异常

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决com.mysql.cj.jdbc.exceptions.CommunicationsException异常 一、分析问题背景 com.mysql.cj.jdbc.exceptions.CommunicationsException是Java程序在使用MySQL Connector/J与…

目标检测—Fast RCNN

介绍Fast R-CNN之前先简单回顾一下R-CNN和SPP-net R-CNN(Regions with CNN) affine image wraping 解析 Bounding Box Regression(边界框回归) 如何回归? 问题1:为什么要使用相对坐标差? …

立创开源学习篇(一)

1.机壳地 外面包围的一圈是机壳地,和金属外壳相连与电路板的GND不相连:(大疆很多产品有此设计) 屏蔽和接地:通过在电路板周围打孔,并连接到机壳地,可以形成有效的电磁屏蔽层(形成金…

【C语言】回调函数 和 部分库函数的用法以及模拟实现

一、回调函数: 1、定义: 回调函数就是一个通过函数指针调用的函数。如果你把函数的指针(地址)作为参数传递给另一个函数,当这个指针被用来调用其所指向的函数时,我们就说这是回调函数。 2、qsort的模拟实现…

怎样打印微信文档文件?

在日常生活和工作中,我们经常需要打印微信中的文档文件,无论是工作资料、学习笔记还是其他重要信息。随着科技的发展,我们不再需要前往打印店进行繁琐的操作,而是可以通过一些便捷的在线打印平台轻松实现。今天,我们就…

echarts学习:通过图例事件实现选中后控制多条折线的显隐

1.问题描述 我在工作中遇到了这样一个需求:我们都知道点击echarts折线图的图例,是可以控制折线的显隐的。我现在希望点击某一个图例可以改变多条折线的显隐。 例如在下面这张图中,我将“xxx水位”和“yyy水位”分为一组;将“xxx…

SGPT论文阅读笔记

这是篇想要用GPT来提取sentence embedding的工作,提出了两个框架,一个是SGPT-BE,一个是SGPT-CE,分别代表了Bi-Encoder setting和Cross-Encoder setting。CE的意思是在做阅读理解任务时,document和query是一起送进去&am…

Maven 配置学习:存在两个本地私服如何配置

Maven 配置学习:存在两个本地私服如何配置 目录 Maven 配置学习:存在两个本地私服如何配置解释:1.本地仓库位置:2.Profiles 定义:3.Repositories 定义顺序:4.Active Profiles: 操作步骤&#xf…

在Pycharm使用Github Copilot

文章目录 1.GitHub Copilot 是什么2.注册GitHub Copilot3.官方使用文档4.安装 GitHub Copilot插件5.在Pycharm中使用6.相关功能键7.启用或禁用 GitHub Copilot 1.GitHub Copilot 是什么 GitHub Copilot 是一款 AI 编码助手,可帮助你更快、更省力地编写代码&#xff…

【MySQL进阶之路 | 高级篇】SQL执行过程

1. 客户端与服务器的连接 运行中的服务器程序与客户端程序本质上都是计算机的一个进程,所以客户端进程向服务器端进程发送请求并得到相应过程的本质就是一个进程间通信的过程. 我们可以使用TCP/IP网络通信协议,命名管道和共享内存等方式,实…