CVPR 2024盛况空前!上海科技大学夺得最佳学生论文奖,惊艳全场!
会议之眼 快讯
2024 年 CVPR (Computer Vision and Pattern Recogntion Conference) 即国际计算机视觉与模式识别会议,于6月17日至21日正在美国西雅图召开。CVPR是计算机视觉和模式识别领域的顶级会议之一。与ICCV和ECCV并称为计算机领域的的三大顶会。它是CCF(中国计算机协会)和CE(会议之眼)评级都为A类的会议。
CVPR 2024颁奖仪式
CVPR 2024颁奖仪式于美国西雅图时间6月19日上午8:30隆重开幕。
在这场备受瞩目的盛会上,主办方不仅分享了CVPR 2024的一系列关键数据,还隆重揭晓了备受期待的最佳论文奖和最佳学生论文奖。
本次CVPR大会以其空前的规模和参与度创造了历史新高,汇聚了来自全球72个国家/地区的约12,000名与会者,实际到场人数超过了9000人。其中中国(大陆地区)以1511名与会者的数量位居美国之外的首位,彰显了中国在计算机视觉领域的活跃度和参与热情。
在本届CVPR大会上,三个研究领域成为了焦点,它们是图像和视频合成与生成、三维重建和人体行为识别。这些领域的创新研究不仅吸引了广泛关注,也代表了计算机视觉技术在这些关键领域的最新进展和未来趋势。
CVPR 2024最佳论文揭晓
第一篇是由谷歌研究院发表的《Generative Image Dynamics 》,该研究通过提取视频中的运动,使用傅里叶域技术将静态图片转化为动态循环视频,并允许用户与图像中的对象互动。
第二篇是加州大学圣地亚哥分校、谷歌研究院、剑桥大学等 5 所机构共同发表的《Rich Human Feedback for Text-to-Image Generation 》,学者们通过优化训练数据和使用掩模修复技术,提升了生成图像的真实性、一致性和审美质量,并将这些改进应用于更广泛的模型。
CVPR 2024最佳学生论文揭晓
第一篇是上海科技大学、捷克理工大学、德国图宾根大学、图宾根人工智能中心共同发表的《Mip-Splatting: Alias-free 3D Gaussian Splatting》。值得注意的是,论文的一作、二作都是上海科技大学的在读或毕业生。文章提出了一种改进的3D高斯点染技术,通过引入3D平滑滤波器和2D Mip滤波器,解决了视角变换中的伪影问题,并在不同尺度的测试中验证了其有效性。
第二篇是颁发给了美国俄亥俄州立大学、微软研究院、加州大学欧文分校、伦斯勒理工学院共同发表的《BioCLlP: A Vision Foundation Model for the Tree of Life》。文章介绍到学者们创建了TreeOfLife-10M数据集,并开发了BioCLIP模型,利用其多样化的生物图像和结构化知识,在细粒度生物分类任务中表现出色,具有强大的泛化能力。
科技巨头前沿技术秀
Meta带来了一系列令人兴奋的技术展示:SceneScript AI 视觉模型、Ego-Exo4D数据集Relightable Gaussian Codec Avatars虚拟头像合成方法等技术,不仅展现了Meta在视觉计算领域的前沿探索,也激发了现场观众对未来科技的无限遐想。
OpenAI的工程师在大会上与GPT-4o进行了实时对话,赢得了观众的欢呼和掌声。尽管GPT-4o的语音模式原定几周后才会正式发布,但本次大会已经提前展示了这一令人期待的技术。
迪士尼的研究团队成功地将经典动画角色“瓦力”带入现实世界,其生动的复原效果让现场观众纷纷驻足,沉浸在这一奇妙的体验中。
CVPR 2024的科技盛宴仍在如火如荼地进行中,每一刻都在诞生新的发现和创新。随着会议的深入,更多的精彩内容和深度洞察正逐渐揭开帷幕。请继续跟随我们的报道,把握每一个精彩瞬间,探索科技如何开启新视野,引领我们走向更加激动人心的未来!