AI圈最近又发生了啥新鲜事?
该栏目以周更频率总结国内外前沿AI动态,是快速了解AI发展趋势一个不错的方式,感兴趣的可以点击订阅合集以及时收到最新推送
DeepSeek Coder V2开源发布,首超GPT4-Turbo的代码能力
全球首个在代码、数学能力上与GPT-4-Turbo争锋的模型,DeepSeek-Coder-V2,正式上线和开源。DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型结构,总参数 236B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间
https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf
阿里云推出首个 AI 程序员,具备架构师、开发/测试工程师等岗位技能
在阿里云上海 AI峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级"完成应用开发。据介绍,该AI 程序员是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与"通义灵码"有所不同
https://www.ithome.com/0/776/746.htm
阿里通义Qwen2成斯坦福大模型榜单最强开源模型
斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任PercyLiang发文表示,阿里通义千问Qwen2 72B模型成为排名最高的开源大模型,是前十榜单中唯一的开源大模型、唯一的中国大模型,成绩超过Meta的Llama3-70B模型
https://tech.huanqiu.com/article/4IHXl0Qfg9u
腾讯混元文生图大模型开源训练代码,发布LoRA与ControINet插件
腾讯混元文生图大模型宣布全面开源训练代码,同时对外开源混元DiT LORA 小规模数据集训练方案与可控制插件ControlNet。作为中文原生模型,用户在通过混元DiT的训练代码进行精调时,可以直接使用中文的数据与标签,无需再将数据翻译成英文
https://mp.weixin.qq.com/s/JFxRLvnTNzK3ByaqHEQSOg
华为云盘古大模型 5.0发布
在华为 HDC 2024 开发者大会上,华为常务董事、华为云 CE0 张平安宣布盘古大模型 5.0 正式发布,在全系列、多模态、强思维三个方面实现升级。全系列方面,盘古大模型 5.0 包括十亿级、百亿级、千亿级、万亿级等不同参数规模,提供盘古自然语言大模型、多模态大模型、视觉大模型、预测大模型、科学计算大模型等
https://www.ithome.com/0/776/805.htm
腾讯AI Lab联合腾讯TME天琴实验室推出AI音乐创作模型「琴乐大模型」
腾讯音乐娱乐集团(TME)天琴实验室和腾讯 AILab 联合研发 AI音乐大模型「琴乐大模型」,具备丰富的 AI 作曲和编曲能力。只需输入中英文关键词、描述性语句或音频,「琴乐大模型」就可直接生成音乐,也可为有后期编辑需求的音乐人,提供生成乐谱的能力
https://mp.weixin.qq.com/s/J5UGb4n4h1FNwaOPJfy2gA
B站开源轻量级 Index-1.9B 系列模型,基于 2.8T 训练数据
B站开源了轻量级 Index-1.98 系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。据介绍,该模型在预训练阶段使用了 2.8T规模的数据,中英比例为 4:5,代码占比 6%。目前,角色扮演模型内置了角色’三三”,用户也可以按需创建自己的角色
https://www.ithome.com/0/776/419.htm
首个AI高考全卷评测结果发布:最高分303,数学全不及格
在前不久高考结束后,上海人工智能实验室旗下司南评测体系0pencompass选取了7个大模型进行高考"语数外“全卷能力测试。6月19日,Opencompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾
https://www.yicai.com/news/102156889.html
中国气象局发布三个AI气象大模型系统:命名风清、风雷、风顺
中国气象局最新发布了三个AI气象大模型系统,分别是:"风清”、“风雷”、“风顺”。“风清"是人工智能全球中短期预报系统,“风雷“是人工智能临近预报系统,两个模型由中国气象局联合清华大学组建攻关团队构建。"风顺”是人工智能全球次季节一季节预测系统,由中国气象局联合复旦大学和上海科学智能研究院基于人工智能方法构建
https://news.mydrivers.com/1/986/986585.htm
Anthropic 发布全新大模型 Claude 3.5 Sonnet
Anthropic 发布了全新大模型 Claude 3.5 Sonnet,号称是迄今为止最智能的模型。据介绍,Claude 3.5 Sonnet 是Anthropic 即将推出的 Claude 3.5 系列的首个版本。该模型提高了整个领域的智能水平,在绝大多数基准评估中都超越了竞品大模型和自家前代最强 Claude3 Opus。与此同时,运行速度、成本与自家前代 Claude 3 sonnet 相当。目前,Claude 3.5 Sonnet 已经在 Claude.ai和 Claude iOS 应用程序上免费提供,而 claude Pro 和 Team 计划订户能够以更高的速率访问它
https://mp.weixin.qq.com/s/HnQ7D4iDVgWteZZdTJoadg
斯坦福发布HumanPlus人形机器人
继会烹饪、洗锅等家务活的Mobile ALOHA机器人后,斯坦福大学付子鹏等最近基于中国厂商宇树科技Unitree H1机器人平台开发了名为HumanPlus的"万能"人形机器人。HumanPlus身高1.75米,拥有33个自由度的活动能力。它可以通过模仿人类的动作来学习新技能,如弹钢琴、打拳击、打字等
https://www.chinastarmarket.cn/detail/1709381
Meta FAIR团队发布多款模型、研究和数据集
Meta FAIR(Fundamental Al Research)团队发布了多款模型、研究和数据集,包括
- Meta Chameleon:多模态模型,7B/34B
- Multi-Token Prediction:多词预测模型
- JASCO:文本生成音乐模型
- Audioseal:Al语音检测
- PRISM:AI反馈数据集
- DIGIn:人文地理差异评估方法
https://mp.weixin.qq.com/s/iZghbBw6SF3lHKucOS884w
OpenAl与Color Health合作打造辅助筛査/治疗癌症的AI工具
OpenAI公司宣布和 Color Health 合作,借助 AI开发造福癌症患者的新方法。双方探索使用 GPT-4o 模型创建 AI工具 Cancer Copilot,帮助医生根据患者数据(包括个人风险因素和家族史)制定筛査和治疗计划
https://www.ithome.com/0/776/160.htm
Runway 推出新的视频生成基础模型 Gen-3 Alpha
AI视频生成初创公司Runway推出了新的视频生成基础模型 Gen-3 Alpha。该模型可以创建具有复杂场景变化、多种电影风格和详细艺术指导的高精细视频。虽然生成的视频只有10秒左右,但在清晰度、细节、角色一致性等方面看起来可以匹敌现有一切视频生成模型
https://mp.weixin.qq.com/s/uuLub-ruJgYYrTOFoNJ5iw
微软首次推出可执行多种任务的视觉基础模型
Florence 2 可执行多种任务,如物体检测、字幕、视觉接地以及通过图像和文本提示进行视觉问题解答。该模型有 232M 和 771M 两种参数大小,采用sequence-to-sequence架构,可执行多种视觉任务,无需对特定任务的架构进行修改
https://www.microsoft.com/en-us/research/publication/florence-2-advancing-a-unified-representation-for-a-variety-of-vision-tasks/
马斯克回应黄仁勋:未来人形机器人普及将是汽车10倍
近日,黄仁勋在一次采访中表示,机器人技术将在2-3年内取得重大突破,并预言未来人形机器人将变得像今天的汽车一样普遍,他表示:“100年后人形机器人将无处不在,可能成为人类历史上产量最大的机器系统。"一位X用户分享了黄仁勋采访的视频片段,马斯克则对此称:“它们的普及程度将是汽车的10倍
https://news.mydrivers.com/1/986/986405.htm