导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!
目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!
《AI大模型日报》今日要点:今日AI大模型领域的资讯涵盖了多个方面,从企业级应用到技术创新均有涉及。OpenAI平台主管的访谈聚焦于如何服务企业级金融,而字节跳动发布的Seed-TTS语音合成大模型则展现了语音生成技术的最新进展,能够生成与真人几乎一样的语音。在视觉生成方面,旷视科技开源的AI人像视频生成框架MegActor通过输入静态肖像图片即可生成表情丰富的视频。商汤绝影大模型与吉利集团子品牌翼真汽车的合作,则标志着AI大模型在智能座舱体验方面的新应用。 同时,在AI生成内容版权问题上,陈丹琦团队的研究提出了避免生成版权角色的策略。在硬件方面,Etched公司推出的首款大模型专用ASIC芯片Sohu,挑战了英伟达的市场地位。而新的大模型Benchmark的推出,则引发了对GPT-4等顶尖大模型推理能力的讨论。此外在生命科学领域,全新蛋白质大模型ESM3和清华大学团队发布的细胞大模型scFoundation,均体现了AI在模拟生物进化和细胞研究中的应用潜力。最后,面壁智能CEO李大海分享了对端侧模型的看法,强调了其在AI落地中的现实意义。这些进展共同展示了AI大模型在技术创新和应用拓展方面的活力。
标题: OpenAI如何服务企业级金融 | OpenAI平台主管1.5万字访谈 (全文+视频)
摘要: 这个链接可能存在安全风险,为了保护您的设备和数据安全,请避免访问此链接。
网址: OpenAI如何服务企业级金融 | OpenAI平台主管1.5万字访谈 (全文+视频)|aws|openai|人工智能|企业级金融|初创公司|大模型|谷歌_手机网易网
标题: 耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘
摘要: Seed-TTS是字节跳动豆包大模型团队发布的语音生成大模型,能生成与真人几乎一样的语音,包括发音瑕疵,且能模仿人类说话。它可以根据文本生成全新语音,并带上原素材的声音特征,实现音色定制,甚至可以根据小说情节和不同角色特质,呈现对应人物和情绪的“说书”。该模型已在C端产品上线,并获得用户好评。技术亮点包括细节建模、高自然度和稳定性、数据覆盖量级大、模型设计等,研究价值在于试图回答过去未解决的问题,如语音建模的适合性、语音表征设计等。此外,Seed-TTS同时提供了基于语言模型和扩散模型的两种技术方案。
网址: 耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘 | 机器之心
标题: 旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
摘要: 旷视科技发布了新的开源AI人像视频生成框架MegActor,只需输入静态肖像图片和视频文件,即可生成表情丰富、动作一致的AI人像视频。MegActor采用原始视频驱动方式,能够捕捉细致表情和运动信息,生成更加保真且动作一致的视频。该框架通过条件扩散模型、前景背景分割等技术解决了ID泄露和背景干扰问题。MegActor支持不同驱动视频和画风,训练数据全部来自公开可获取的开源数据集。目前,MegActor已完全开源,供开发者和用户使用。
网址: 旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包 | 机器之心
标题: 当AGI遇见「陆地空客」,商汤绝影大模型上车LEVC
摘要: 6月25日,吉利集团子品牌翼真汽车(LEVC)首款豪华纯电MPV翼真L380在浙江乌镇发布,被誉为“陆地空客”。该车依托AI大模型,提供创新的智能座舱体验,由中国智能座舱领军企业商汤绝影与LEVC联手打造。商汤“日日新5.0”大模型在多项评测中超越GPT-4,为翼真L380提供“AI闲聊”、“美图壁纸”和“童话绘本”等解决方案,将为用户带来全新智慧出行体验。此次上市标志着商汤“日日新5.0”首次正式量产上车,为百年英国高端汽车品牌注入通用人工智能(AGI)新活力。
网址: 当AGI遇见「陆地空客」,商汤绝影大模型上车LEVC | 机器之心
标题: 陈丹琦团队新作:教你避免成为任天堂的被告
摘要: 陈丹琦团队发布新研究,教如何避免AI生成版权角色。研究构建评估套件,包含50个流行版权角色,发现模型易生成版权角色,且间接锚定也可能触发版权内容生成。团队探讨几种策略,发现结合提示重写和负面提示最能减少版权角色生成风险,同时保持用户意图一致性。研究者提醒用户和模型部署者需警惕间接锚定,建议结合使用负面提示等技术。该研究由普林斯顿等多所大学共同完成,论文已发布。
网址: 陈丹琦团队新作:教你避免成为任天堂的被告 | 量子位
标题: 一张顶20张H100!首款大模型专用芯片挑战英伟达,哈佛辍学华人创办
摘要: 科技初创公司Etched推出首款大模型专用ASIC芯片Sohu,该芯片专门针对Transformer算法进行优化,实现每秒处理50万个tokens的高吞吐量,性能超越英伟达H100达20倍,且成本更低。Etched由两位哈佛辍学生创办,已完成1.2亿美元A轮融资,Peter Thiel等知名投资人参与。Sohu芯片的推出可能改变AI推理领域的竞争格局,尽管有质疑声音认为专用芯片可能面临架构过时的风险,但Etched团队认为专用化是提升性能和效率的关键。业界对此充满关注与讨论。
网址: 一张顶20张H100!首款大模型专用芯片挑战英伟达,哈佛辍学华人创办 | 量子位
标题: 大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
摘要: 科技新闻要点: 1. 新的大模型Benchmark在推特上引起热议,LeCun也转发并点赞。 2. GPT-4和Claude 3等顶尖大模型在面对逻辑学中的“动物过河”问题时均未能给出正确答案。 3. 网友定义新名词“劣效比率”来衡量模型表现,但更多是一种玩笑,不太能比较出模型能力。 4. 针对此Benchmark,12款国产大模型如文心一言、通义千问等也进行了测试,结果全军覆没。 5. 测试显示,大模型在推理能力方面仍有不足,且训练数据对模型输出有显著影响。 6. 模型未能仔细读题,导致无法识别问题中的变化,进一步证实了训练数据与输出的关系分析。
网址: 大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark | 量子位
标题: 模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
摘要: 继AlphaFold 3更新后,生命科学领域又迎来大模型ESM3。该模型由Evolutionary Scale AI初创公司开发,专注于蛋白质序列、结构和功能的推理,具有多模态能力,在27.8亿个蛋白质上训练,能模拟进化过程。ESM3已开源,并与AWS和英伟达合作,但模型权重尚未在HuggingFace公开。该模型训练参数达98B,使用了Andromeda集群。ESM3通过掩码语言模型训练,能实现「全对全」预测,有助于设计新蛋白质。其能力随规模增加涌现,可自我改进并与实验结果对齐。ESM3的开发是生物学可编程化的重要一步,旨在模拟5亿年的进化。
网址: 模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞|训练_新浪新闻
标题: 1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模
摘要: 近年来,大规模预训练模型在人工智能领域掀起新浪潮,通过从海量数据中提取深层规律,服务于不同领域的多样化任务。在生命科学领域,基于细胞的“语言”开发人工智能细胞大模型,有望为生命科学和医学提供全新的研究工具。然而,训练大规模单细胞数据面临诸多挑战,如数据库缺失、处理难度大等。清华大学张学工教授、马剑竹教授和百图生科宋乐博士合作研究,于2024年6月发表题为“Large-scale foundation model on single-cell transcriptomics”的论文,介绍了名为scFoundation的细胞大模型。该模型基于5千万个细胞的基因表达数据训练,能同时处理约2万个基因,采用非对称设计减少计算和内存挑战,为基因网络推断和转录因子识别提供了新的研究思路。此外,该模型在细胞测序深度增强、药物响应预测等任务中表现出卓越性能,提供了人工智能在单细胞研究中的新范式。研究人员还构建了全面的单细胞数据集,并设计了一种名为RDA的预训练任务,考虑了测序深度的高方差。该模型有望为生命科学和医学研究提供强大的新工具。
网址: 1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模 - 智源社区
标题: 对话面壁智能李大海:离用户更近的端侧模型,才是 AI 落地更现实的途径
摘要: 科技记者提炼要点: 2026年,面壁智能计划推出达到GPT-4水平的端侧模型,基于独特理解的Scaling Law,在8B模型上已实现多模态能力。在Google和Apple推出端侧模型后,该领域变得热门。面壁智能CEO李大海认为,端侧模型因离用户更近而更具现实意义。在AGI Playground 2024上,李大海分享了心路历程和对端侧模型的看法,强调了效率、隐私和环境互动的重要性。他相信,端侧模型将像私人管家一样,成为用户信任的伙伴。
网址: 对话面壁智能李大海:离用户更近的端侧模型,才是 AI 落地更现实的途径 | 极客公园