AI技术前沿动态简报（2026.07.17）

发布时间：2026/8/2 18:11:06

第1条Thinking Machines Lab 发布开放权重多模态模型 Inkling核心内容由 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab 于 7 月 16 日发布首款通用基础模型 Inkling。该模型采用 MoE 架构总参数 9750 亿、激活参数 410 亿预训练数据约 45 万亿 token覆盖文本、图像、音频与视频最高支持 100 万 token 上下文窗口并以 Apache 2.0 协议开放 BF16 与 NVFP4 量化权重。官方测试显示Inkling 在 Terminal Bench 2.1 达到与英伟达 Nemotron 3 Ultra 相近成绩时生成 token 数量约为后者的三分之一其 MoE 架构借鉴了 DeepSeek-V3 设计后训练阶段使用了月之暗面 Kimi K2.5 生成的数据进行优化。为什么重要Inkling 将可定制、可部署、可控成本作为核心定位为企业用自有数据持续微调提供了开源底座反映出开放权重模型从追求榜单 SOTA转向平衡能力、成本与可改造性的产业趋势。信息来源智东西、AI前线 | 2026-07-16第2条商汤开源 SenseNova-Vision 统一视觉大模型核心内容商汤科技于 7 月 16 日发布并全面开源日日新 SenseNova-Vision 理解生成统一视觉大模型。该模型以单一架构覆盖结构化视觉理解、稠密几何预测、图像分割与多视角 3D 几何四大任务将检测、分割、深度估计、3D 重建等经典视觉任务统一表述为多模态生成问题在 Hugging Face Any-to-Any Leaderboard 登顶开源全模态模型榜首。商汤同步开放了模型、代码及包含 5000 万条样本的开源视觉语料库。为什么重要该模型尝试终结一任务一专家模型的割裂架构使视觉 AI 从诞生即具备空间理解能力降低了多任务视觉系统的工程复杂度也为社区提供了统一视觉研究的基准与数据。信息来源智东西 | 2026-07-16第3条英伟达发布 Jetson T2000/T3000 机器人模组与 Cosmos 3 Edge 轻量世界模型核心内容英伟达于 7 月 15 日晚至 16 日密集发布多款物理 AI 产品推出基于 Jetson AGX Thor 架构的机器人计算模组 T2000 与 T3000计划 2027 年第一季度上市。T3000 在 70 瓦功耗下提供 865 FP4 TFLOPS 算力体积约为 T5000 的一半T2000 提供 400 FP4 TFLOPS 与 16GB 内存面向入门级边缘 AI。同时英伟达拓展了 Cosmos 3 开源世界基础模型家族新增 40 亿参数的轻量级模型 Cosmos 3 Edge兼容 Thor 架构可在设备端辅助具身系统感知与动作预测。为什么重要新模组补齐了英伟达在视觉 AI 代理、自主移动机器人、工业机械臂等入门级边缘市场的算力布局使 Jetson 平台覆盖从 70 TOPS 到 2000 TFLOPS 的跨度轻量世界模型降低了具身智能在端侧部署的门槛。信息来源第一财经、智东西 | 2026-07-16第4条谷歌 Gemini 3.5 Pro 采用全量重训而非增量微调核心内容据 7 月 16 日的技术分析谷歌 Gemini 3.5 Pro 并非 Gemini 2.5 的增量升级而是放弃沿用旧基座、从零开始全量重新预训练。谷歌发现旧基座在前端代码、SVG 矢量图生成、基础数学推理等场景存在代际级短板增量微调已无法补齐因此在预训练阶段即以更高权重注入核心场景的高质量语料。结果显示Gemini 3.5 Pro 在前端代码与 SVG 矢量图生成上实现对竞品的代际超越基础事实类问题召回准确率较前代提升 30% 以上。为什么重要该案例为行业提供了基座迭代的新方法论当旧基座的历史噪声成为能力硬天花板时全量重训可能是比持续微调更短、更确定的路径避免路径依赖正成为头部厂商下一轮迭代的共识。信息来源今日头条技术深度分析 | 2026-07-16第5条字节跳动发布统一多模态模型 Lance核心内容字节跳动智能创作实验室ByteDance Research于 7 月 16 日发布原生统一多模态模型 Lance以 3B 激活参数、6B 总参数及最高 128-GPU 训练预算在单一原生框架内联合训练图像/视频理解、生成与编辑等多重任务。Lance 将 X2T、X2I、X2V 等任务放入同一模型协同训练在 VBench85.11、MVBench62.0、GenEval0.90、GEdit-Bench7.30等统一多模态基准上取得较强性能模型、代码与论文资源已开源并进入 Hugging Face Trending 前三。为什么重要Lance 以较小参数规模验证了任务覆盖更完整的统一模型更易涌现跨任务泛化的假设为学术开源生态提供了低成本、广覆盖的统一多模态研究范式。信息来源ByteDance Research | 2026-07-16

AI技术前沿动态简报（2026.07.17）

AI技术前沿动态简报（2026.07.17）

相关新闻

玩转物联网——FS-Dongle-F8X0M1 上电初体验，Windows/Linux 下 RNDIS 拨号上网全过程

公司制度靠“查纸质本“来审计？我用飞算JavaAI做了个合规巡检看板

C++控制台中文乱码：从编码原理到多IDE实战解决方案

最新新闻

如何在VMware ESXi上解锁macOS虚拟化：终极ESXi Unlocker完整指南

QModMaster：5分钟掌握工业自动化调试的终极免费Modbus工具

LangChain 从 Demo 到团队落地，真正卡壳的是哪一步？

AU-48八米拾音的信噪比衰减与降噪门限耦合分析

从提示词小白到AI内容架构师（20年技术老兵的6阶能力跃迁图谱，仅剩最后87个免费解读名额）

单片机毕设项目：基于嵌入式单片机的光照阈值可调窗帘系统 基于 STM32 的多功能居家智能窗帘调控装置开发（018201）

日新闻

完整指南：如何让2008-2017年老款Mac运行最新macOS系统

PyTorch入门指南：从环境搭建到自动求导的NLP学习实战

OptiScaler终极指南：跨GPU超分辨率与帧生成技术的全面解析

周新闻

最大流算法详解：从水管网络到Ford-Fulkerson与Dinic实战

基于Springboot的企业门户网站(源码+LW+调试文档+讲解)

MATLAB xcorr函数详解：从互相关原理到四大实战应用

月新闻

无损视频剪辑终极指南：如何实现快速高效的多媒体处理

AI辅助本科论文写作：8大工具评测与高效使用指南

如何快速配置大麦自动抢票系统：从零开始搭建Python抢票助手

单片机毕设项目：基于嵌入式单片机的光照阈值可调窗帘系统基于 STM32 的多功能居家智能窗帘调控装置开发（018201）