每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
据《The Information》报道,微软正致力于打造一个新的大规模 AI 语言模型,名为 MAI-1,有望与谷歌、Anthropic 和 OpenAI 等公司的最先进模型一较高下。这是微软自投资 OpenAI 10 亿美元获取其 AI 模型使用权以来首次自主开发如此规模的 AI 模型。OpenAI 的 GPT-4 不仅为 ChatGPT 提供动力,还驱动了微软的 Copilot 功能。
DeepMind 联合创始人 Mustafa Suleyman 将领导微软的新消费者 AI 部门。
该项目由前 Google AI 高层、曾担任 AI 创企 Inflection 首席执行官的 Mustafa Suleyman 负责。微软于 3 月以 6.5 亿美元的价格收购了该初创公司的大部分员工和知识产权。虽然 MAI-1 或许借鉴了 Inflection 团队带来的技术,但据两位了解项目的微软员工表示,MAI-1 是全新的大型语言模型(LLM)。
拥有大约 5000 亿参数的 MAI-1,将比微软以往的开源模型(如上个月报道的 Phi-3)规模更大,因而需要更多计算能力和训练数据。据报道,MAI-1 与传闻中拥有超过 1 万亿参数的 OpenAI GPT-4 规模相近,并远超 Meta 和 Mistral 的 700 亿参数模型。
MAI-1 的开发体现了微软对 AI 双管齐下的策略,一方面专注于适用于移动设备的小型本地语言模型,另一方面开发由云端驱动的大型最先进模型。苹果据称也在探索类似的策略。这也凸显出微软愿意独立于 OpenAI 进行 AI 开发,目前微软最雄心勃勃的生成式 AI 功能由 OpenAI 技术驱动,包括嵌入 Windows 的聊天机器人。
苹果发布了 8 款针对设备端使用的小型 AI 语言模型。
据消息人士透露,MAI-1 的具体用途尚未确定,其最佳应用将取决于模型的性能。为训练该模型,微软已经部署了一大批 Nvidia GPU 服务器,并从多种来源收集训练数据,包括 OpenAI GPT-4 生成的文本和公共互联网数据。
根据《The Information》援引的消息人士称,视项目进展情况,微软或许最早会在本月的 Build 开发者大会上展示 MAI-1。