AI大模型日报#0415：贾佳亚团队新作王炸、马斯克首款多模态大模型、ChatGPT to B

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。

标题: 融合ChatGPT+DALLE3，贾佳亚团队新作开源：识图推理生图一站解决

摘要: 贾佳亚团队推出了多模态模型Mini-Gemini，融合了ChatGPT和DALL-E 3的能力，可高精度理解图像、解析推理，并能结合图像推理和生成。该模型提供了不同规模的版本，最强版本在多个指标上与商业模型相当。Mini-Gemini已开源并受到广泛关注，网友认为其与商业模型相差不大。此外，团队还发布了Mini-Gemini线上Demo，引起网友热议。
网址: https://www.qbitai.com/2024/04/135548.html

标题: 北大字节开辟图像生成新范式！超越Sora核心组件DiT，不再预测下一个token

摘要: 北大和字节跳动合作提出了一种新的图像生成范式VAR，它不再预测下一个token，而是预测下一级分辨率。该方法在效果上超越了Sora的核心组件DiT，图像生成质量更高，推理速度提高了20+倍。VAR是首个在图像生成领域击败DiT的自回归模型，具有大语言模型同款的Scaling Laws和零样本任务泛化能力。该方法已开源并在GitHub上受到广泛关注。
网址: https://www.qbitai.com/2024/04/135638.html

标题: 专题综述 | 大语言模型中的知识生命周期

摘要: 本文聚焦于知识在大规模语言模型(LLMs)中的生命周期，将其划分为五个关键阶段，并系统性地回顾了各阶段的代表性研究。文章指出，尽管相关研究众多，但对于知识在语言模型中的完整生命周期仍缺乏整体性观点，这可能阻碍对各研究方向间联系和现有研究局限性的认识。文章总结了每个阶段的核心挑战和主要局限性，并讨论了未来潜在的发展方向。相关成果已发表于《机器智能研究(英文)》2024年第2期中。
网址: 专题综述 | 大语言模型中的知识生命周期 - 智源社区

标题: 马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

摘要: 自2023年11月首次亮相以来，马斯克的xAI在大模型领域迅速发展，向OpenAI等发起挑战。xAI的Grok-1.5V多模态模型不仅能理解文本，还能处理多种格式内容，且在多学科推理等领域与顶尖模型相媲美。xAI计划未来在图像、音频和视频等模态上继续提升模型能力。在RealWorldQA基准测试中，Grok展现出了在理解物理世界方面的优越表现。若Grok-1.5以类似Grok-1的开源许可证发布，将具有重大意义。
网址: 马斯克的首款多模态大模型来了，GPT-4V又被超越了一次 | 机器之心

标题: GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

摘要: 新一代视觉生成范式VAR（Visual Auto Regressive，视觉自回归）由北京大学和字节跳动的研究者提出，使GPT风格的自回归模型在图像生成上首次超越扩散模型，具备大语言模型相似的缩放定律和泛化能力。该工作登上GitHub和Paperwithcode热度榜单，引起广泛关注。体验网站、论文、代码、模型已公开。
网址: GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式 | 机器之心

标题: OpenAI推销ChatGPT to B业务，微软客户也是目标

摘要: OpenAI首席执行官山姆・奥特曼本月在旧金山、纽约和伦敦会见了数百名500强公司高管，推销了企业使用的人工智能服务，并与微软产品进行了比对。这些活动表明OpenAI正在通过ChatGPT寻求从全球企业增加新收入来源。奥特曼和OpenAI首席运营官进行了产品演示，包括ChatGPT Enterprise和API服务。此前未曝光的会议吸引了每个城市100多名高管参加。
网址: OpenAI推销ChatGPT to B业务，微软客户也是目标 | 机器之心

标题: 谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

摘要: 研究人员探索了大语言模型上的模型重编程，提出了高效重编程大语言模型进行通用时序预测的全新视角，实现了高精度时序预测，无需修改语言模型。这让大语言模型在处理跨模态时间序列数据时表现出色，有望彻底改变时序/时空数据挖掘方式，促进决策高效制定，并朝着更普遍的时序/时空分析智能形式迈进。大模型可重新调整用途，处理通用和专用领域应用中的时间序列和时空数据。
网址: 谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024 | 机器之心

标题: GPT-4整治学术不端！人大/浙大团队实测7000篇论文，撤稿预测与人类95%一致
摘要: 要点提炼：中国学者利用GPT-4预测论文撤稿情况，发现其预测结果与人类审稿人相似度高达95%。这一发现表明大模型在维护科研诚信方面具有潜力。传统方法如同行评审和读者反馈无法及时发现所有问题论文，而GPT-4能够快速识别并促进问题论文的撤稿。该研究为学术界提供了一个新的解决方案，有助于维护科研诚信和公众信任。
网址: GPT-4整治学术不端！人大/浙大团队实测7000篇论文，撤稿预测与人类95%一致|gpt-4|学术不端|学术论文|撤稿|浙大|科研论文_手机网易网

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/820222.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！