- B站:啥都会一点的研究生
- 公众号:啥都会一点的研究生
AI圈最近又发生了啥新鲜事?
该栏目以周更频率总结国内外前沿AI动态,感兴趣的可以点击订阅合集以及时收到最新推送
B站首秀世界人工智能大会,展示自研AI技术与AIGC创意
在2024年世界人工智能大会期间,B站展示了其自主研发的多项AI技术成果和AIGC多元创意。B站称每月有超过8000万用户观看AI相关视频,其中60%为00后,成为AI行业厂商首选的沟通平台。AI自研技术不仅提升了UP主的创作能力,还为用户提供更沉浸式的体验,如必剪Studio的1:1真人模型定制服务和AI动态漫技术。此外,B站首次展出了自研的Index-1.9B系列大语言模型,支持知识问答、文案创作等应用,赋能UP主创作并推动AI技术生态发展
https://tech.caijing.com.cn/20240705/5022474.shtml
支付宝发布国内首批多模态医疗大模型,支持千亿级视觉识别
在2024世界人工智能大会上,支付宝正式发布了其多模态医疗大模型,成为国内首批此类模型之一。该模型基于蚂蚁百灵的多模态技术,能直接理解并训练音频、视频、图像和文本等多类型数据,具备千亿级别参数的医疗视觉识别能力。在测试中,模型对诊疗报告、医学药品和毛发状况等的识别准确率达到90%以上,表现媲美甚至超越GPT4在中英文医疗考试及基准测试中的成绩
https://www.tmtpost.com/nictation/7156616.html
阿里达摩院发布“寻光”:一站式AI视频创作平台
在2024世界人工智能大会期间,阿里达摩院推出了一款名为“寻光”的一站式AI视频创作平台。该平台旨在简化视频创作流程,提高创作效率,集成了从剧本创作到分镜设计、再到视频素材编辑等关键步骤,使创作者能够在单一平台上完成从创意构思到成品视频的全过程。寻光平台的功能包括故事板生成、角色定制、视觉素材的自由创作和视频内容的可控编辑,支持对AI生成素材和实拍素材进行各种编辑操作
https://www.ithome.com/0/780/117.htm
李彦宏:没有应用,基础模型一文不值,商业化闭源模型最能打
百度创始人李彦宏在2024世界人工智能大会上表示,在激烈竞争的环境下,商业化的闭源模型因其性能优势更胜一筹。他强调,没有实际应用支撑的基础模型价值有限,呼吁业界应更重视AI应用的开发而非单纯追求模型的更新和升级。百度正转型为人工智能优先的企业,用文心大模型重构其To C和To B业务。李彦宏认为,AI应用应避免追求单一的“杀手级”应用,而应重视对产业和应用场景的增益
https://www.thepaper.cn/newsDetail_forward_27959166
傅盛:付费的闭源大模型才是智商税
猎豹移动董事长兼CEO、猎户星空董事长傅盛在2024世界人工智能大会期间,对“开源大模型是智商税”的说法提出了反驳。傅盛认为,大模型的开源与闭源并不是核心问题,真正的智商税体现在收取高昂的模型授权费和API费用的闭源大模型上。开源大模型在性能上已经足够优秀,许多企业都在免费使用,而那些需要用户每月支付数十元才能使用的闭源大模型才是在征收智商税。傅盛强调,要有效利用大模型,关键在于结合企业实际,实现应用层面的落地,单纯选择模型而不注重应用的开发,即便免费也无法发挥应有的效果
https://www.tmtpost.com/nictation/7158129.html
丘成桐:人工智能要重视上游的基础学科
在2024年世界人工智能大会暨人工智能全球治理高级别会议全体会议上,菲尔兹奖首位华人得主丘成桐强调了基础学科,尤其是数学,在人工智能领域的重要作用。丘成桐指出,人工智能的上游、中游、下游应同步发展,其中上游的基础学科需发挥领导作用,中下游则需提供支持。虽然上游工作短期内不易见到成果,但长远来看,美国近期在大模型上的突破正是多年持续投入基础研究的结果。丘成桐还强调,中国拥有优秀的数学学生,应在人工智能上游工作上充分利用这批人才资源,推动数学等基础学科与人工智能的深度融合
https://www.yicai.com/news/102178152.html
中国科学院院士王坚:美国AI发展的电力瓶颈在中国不成问题
在2024世界人工智能大会上,中国工程院院士、阿里云创始人王坚表示,电力供应不会成为中国AI发展的瓶颈,而这是美国AI发展中面临的一大短板。王坚指出,中国的年发电量远超美国、日本和俄罗斯三国总和,电力供应充足。他进一步提出,应用、模型、电力和算力之间存在着一种不等式关系,基于这一关系,当前AI领域从业者无需过分担忧电力与算力的瓶颈
https://news.mydrivers.com/1/989/989658.htm
特斯拉二代人形机器人Optimus在WAIC上亮相,行走速度提升30%
在2024世界人工智能大会上,特斯拉展示了其第二代人形机器人Optimus的最新进展。相较于前代,Optimus的行走速度提高了30%,展现出更为流畅和高效的移动能力。这一提升表明特斯拉在人形机器人技术领域持续取得突破,Optimus的性能正在逐步完善,朝着更加实用和高效的方向发展
https://www.cnstock.com/commonDetail/208386
商汤发布首个可控人物视频生成大模型Vimi
在2024年世界人工智能大会上,商汤推出首个面向消费者市场的可控人物视频生成大模型Vimi,荣获大会“镇馆之宝”称号。能够通过一张任意风格的照片生成与目标动作一致的人物视频,支持多样化驱动方式,如人物视频、动画、声音和文字。解决了市场上人物视频生成技术的多个痛点,如表情控制不精准、效果不稳定和视频时长受限等问题。该模型特别设计以满足女性用户和视频创作者的需求,提供多种风格和场景选择,如自拍、唱歌、舞蹈等
https://www.lieyunpro.com/archives/493614
商汤发布日日新5.5大模型体系
商汤发布日日新5.5大模型体系,包括6000亿参数基础模型日日新5.5,性能提升30%;流式多模态交互模型日日新5o,是国内首个所见即所得模型,可进行实时多模态交互和问答;日日新5.5Lite在端侧模型进行升级,模型精度提升10%、首包延迟降低40%,推理效率提升15%
https://www.cls.cn/detail/1724446
世界知识产权组织:过去十年中国生成式AI专利申请量居全球第一
世界知识产权组织发布《生成式人工智能专利态势报告》。报告显示,2014年至2023年,中国发明人申请的生成式人工智能专利数量最多,远超美日韩等国。2014年至2023年,全球生成式人工智能相关的发明电请量达54000件,其中超过25%是在去年一年出现的
https://news.cctv.com/2024/07/03/ARTIeCZeKCiTAjBHzSmxfDkS240703.shtml
微软 Copilot for Microsoft 365 将迎新功能,设计、写作全面赋能
微软近期公布了其备受关注的智能协助手 Copilot for Microsoft 365 的一系列即将于7月上线的新功能,进一步加强了该服务在微软旗下众多软件产品中的整合力度。备受期待的一项更新是将微软的人工智能艺术创作工具"设计器(Designer)"引入 Word 和 PowerPoint 应用。用户只需打开 Copilot 并通过文字指令描述需求,copilot 就能自动生成图像
https://www.ithome.com/0/778/676.htm
比尔·盖茨:Scaling Law快要走到尽头,超人AI还需新的突破
比尔·盖茨在一期 Next Big ldea 播客中讨论了人工智能的未来发展,强调其在医疗、教育和生产力中的重要性。他认为AI将深刻影响合成生物学和机器人技术,并预测个人智能体会通过耳机、眼镜等设备与人类交互。盖茨指出AI的真正进步在于实现更接近人类的元认知能力,而非仅扩大模型规模。他预期AI将提升生产率并改善生活质量但也提醒需警惕技术发展对社会的影响
https://mp.weixin.qq.com/s/lzX6JpBLUmF_FSwlwEIfjQ
苹果公开演示其“4M”人工智能模型
苹果与瑞士洛桑联邦理工学院(EPFL)在Hugging Face平台上发布了一款名为“4M”的人工智能模型的公开demo。该4M(大规模多模态掩码建模)模型能够跨多种模态处理和生成内容,例如从文本创建图像、识别物体,以及使用自然语言输入操纵三维场景
尽管微软和谷歌等公司因他们的人工智能合作和产品而频频占据新闻头条,但苹果一直在稳步提升其人工智能能力。4M模型的公开展示表明,苹果正将其自身定位为人工智能行业的重要参与者
https://venturebeat.com/ai/apple-just-launched-a-public-demo-of-its-4m-ai-model-heres-why-its-a-big-deal/