7 月 6 日,2023 世界人工智能大会(WAIC)在上海世博中心及世博展览馆开幕,并在浦东张江、徐汇西岸设分会场,同步在闵行等产业集聚区开展同期活动。本届大会由上海市人民政府和国家发改委、工信部、科技部、国家网信办、中国科学院、中国工程院、中国科协等七个部门共同主办,以“智联世界,生成未来”为主题,聚焦科学前沿和产业发展,围绕技术、产业、人文三大话题, 重点关注大模型、智能芯片、科学智能、机器人、类脑智能、元宇宙、自动驾驶、数据论坛、法治与安全、区块链等十大前沿风向,云集国内外领军学者、知名企业家、国际组织代表等 1400 余位重量级嘉宾,共同为跨时代之年写下注脚,共同展望后AI时代的全新图景。
今年,世界人工智能大会今年首次设立了无障碍领域的高峰论坛,联合深圳市信息无障碍研究会共同举办 WAIC 科技无障碍:AI 普惠数字未来高峰论坛, 邀请海内外人工智能领域、无障碍领域的专家、学者,共同分享最前沿的技术创新经验及成果,用AI技术推动中国无障碍建设的可持续发展。同时,论坛得到了世界人工智能大会组委会办公室的指导,以及中国老龄产业协会和 W3C 等单位的支持,并由 Jina AI、Ladies Who Tech、译迩科技和东浩兰生会展集团等作为协办方。 论坛还邀请了BCG、Jina AI、微软、Alango、小米、蚂蚁集团、商汤科技等多家企业和机构代表出席分享。
全国人大常委会委员、中国残疾人联合会副主席吕世明 通过视频致辞,他表示:“科技改变人生,科技创造未来。尤其要以科技的力量、科技的精神来促进无障碍的有效的实际转化。希望通过科技,我们得以听得见、看得到、站起来、走起来、跑起来、飞起来,助力我们国家创造科技智能化的新时代。”
图:全国人大常委会委员、中国残疾人联合会副主席吕世明为论坛致辞
中国老龄产业协会执行会长吴世民 莅临论坛现场并发表致辞:“AI技术应该在适老、助残等社会责任领域进行应用,助力无障碍社会建设,实现人工智能价值的最大化——服务于人。以科技创新之力、科技向善之心赋能无障碍信息建设,帮助老年人和残疾人更加平等融入社会。”
图:中国老龄产业协会执行会长吴世民为 WAIC「科技无障碍」论坛致辞
智联数字, 无障碍步入新征程
2023年是跨越时代的一年,全球大模型、生成式人工智能等技术带领我们从人工智能1.0时代进入2.0时代,引发了科技革命与产业革命的巨浪。2023也是无障碍产业加速发展的一年。6月28日,十四届全国人大常委会第三次会议表决通过了《无障碍环境建设法》,为无障碍人群与飞速发展的数字时代之间架起桥梁。WAIC科技无障碍的举办 恰逢其时。
当今,企业与大模型的应用加速融合,重塑了人与数据的交互方式,也实现了企业产能的提速。在“人工智能推进无障碍”主题分享中,BCG董事总经理陈果 提出:“我认为在3到5年内,人工智能的记忆模式基本上可以到具备实际生产性意义。因此我们非常希望能够与深圳市信息无障碍研究会以及在座的各位共同利用AI技术,创造更好的无障碍数字化环境。”
图:BCG 董事总经理陈果正在分享
视障者如何 “看见” 图像?Jina AI 通过提供开源软件、PaaS、SaaS 等为内容生产者、开发者和企业为多模态 AI 赋能,探讨了现有图像标注局限性的解决方案,并讨论对更先进、更可靠的工具来支持数字无障碍工作的需求。
Jina AI 的 CEO 肖涵 介绍,多模态大模型 SceneXplain 能够以复杂场景的细致描述、与图片实际的强相关度以及多语言 + 语音输出支持,为视障者构建出能够感知和 “看见” 的世界。肖涵表示:“SceneXplain 是专门为描述复杂场景而设计的,包括现实中的场景,非现实的人造场景等。我们希望SceneXplain算法能够帮助视觉障碍者理解复杂图片中的描述和背后的情感,打造更好的无障碍数字化的平权体验。
图:Jina AI 创始人兼 CEO 正在分享
SceneXplain 拓宽了图像描述的边界。它突破了传统图像描述算法的局限性,提供了简练专业、引人入胜的图像叙事体验。凭借 用户友好的界面、无缝 API 集成 和 强大的多语言支持,方便开发者轻松集成到他们的多模态应用中。
SceneXplain 生成的文本拓展了图片的表现力,不管是动漫,风景,商品,还是产品 UI,它都准确识别了图片中关键信息,理解了画面表达的气氛,并深入捕捉到了图片中的细节,并用流畅连贯的语言完成了描述。
🔗 上手体验:https://scenex.jina.ai
图:SceneXplain 的画面描述
在接下来的分享中,来自 联谛障碍用户研究院的张玲琳 指出当今大模型缺少包容性的现状及包容性对于无障碍的重要意义。她表示:“大模型的包容性改进需要政府、企业、高校及研究机构等各利益相关方共同努力,从障碍群体的视角出发,利用理论研究跟案例分析的方法构建一个在大模型的框架下的包容性理论。”
在无障碍数字化创新场景下,论坛邀请到小米集团技术委员会AI实验室语音专家工程师张俊博、蚂蚁集团大安全事业群机器智能部副总经理、资深算法专家李哲以及线上参会的Google无障碍工程师钟昱,与商汤科技AI专家何盈,以“AI如何驱动科技无障碍创新”为主题开展圆桌对话。
图:“AI 如何驱动科技无障碍创新”主题圆桌
圆桌上,商汤科技AI专家何盈 表示:“人工智能技术在无障碍领域的应用为实现了无障碍的创新场景,从而使到千万障碍群体获得了科技的普惠。”
小米集团技术委员会AI实验室语音专家工程师张俊博 提到:“借助AI技术,我们可以实现文本、图像、音频等任意转换,打通信息传递的全模态,实现真正的感知无障碍。”
蚂蚁集团大安全事业群机器智能部副总经理、资深算法专家李哲 表示:“ 将大模型与AI的深度学习的能力与基础学科形成交叉的学科,才有可能真正带来无障碍的蜕变。”
Google无障碍工程师钟昱 提出:“我们积极尝试将AI等新技术应用到无障碍场景当中,例如利用机器学习和计算机视觉实时地捕捉信息,让用户可以独立完成更多日常事务。”
生成未来,人工智能赋能新图景
微软(中国)首席产品经理冯浩 分享了微软在障碍人士的日常交流、娱乐、工作等各方面所做出的努力,冯浩表示:“微软在孤立词手语识别、连续手语识别、手语翻译、手语检索以及手语基础模型等领域上处于领先地位,并且我们仍在努力。”
图:微软(中国)首席产品经理冯浩
除了科技软实力,智能硬件也是无障碍通往数字化的重要途径之一。Alango CEO Alexander Goldin 在分享中提到:“结合消费电子芯片组和声学原件的最新技术,应用机器学习方法进行数字信号处理来增强听力,最终可以引发一场听力健康领域的革命。”
同样在听力无障碍方面,音书科技创始人兼CEO石城川 分享了他个人作为听障人士,如何利用AI技术为上百万听障人士提供在就业、学习等场景下的助力。他表示:“音书App通过积累大量听障用户的精准数据,训练专业的辅助听障人士的AI算法。相信在大家的共同努力之下,全世界的听障人士一定都能够看见声音,拥抱梦想。”
在无障碍出行领域,奥博铁克总经理李麟青 通过自己亲身经历,分析肢体障碍人士在不同场景下的出行痛点,无障碍地图App的案例,为无障碍出行的难点提供可复制范式。
在上海玛娜数据科技发展基金会秘书长陈纯的主持下,北京聋协信息无障碍推进委员会副主任朱轶琳、中国电子工程设计院有限公司健康与养老研究所副所长韩涵、深圳市信息无障碍研究会无障碍专家刘彪,以“AI 助力无障碍新场景的畅想”为主题进行了圆桌对话,探讨AI如何助力生成无障碍的未来场景。
图:“AI 如何驱动科技无障碍创新”主题圆桌
在讨论中, 上海玛娜数据科技发展基金会秘书长陈纯 借助AI的回答,描述理想中未来无障碍社区的样子:“信息无障碍社区会致力于打破障碍和提供平等机会,使每个人都能够充分参与社会生活,充分享受信息技术带来的便利。在理想的社区中,人们都在共同努力,为实现一个包容平等和无障碍的社会而奋斗。”
北京聋协信息无障碍推进委员会副主任朱轶琳 提到:“现有的AI技术帮助我们在获取信息的这条道路上,不用耗费太多精力和资源就能平等掌握同样的信息,可以体验更高效、更愉悦的交流感受,这就是AI技术对我们最大的意义。希望未来可以真正实现交流沟通无障碍。”
中国电子工程设计院有限公司健康与养老研究所副所长韩涵 表示:“相信在不久的将来,最初是为少数障碍人士而设计的无障碍产品、设施及环境,能够惠及到更多的人,终将使每一个人都能从中受益。”
深圳市信息无障碍研究会无障碍专家刘彪 提出:“大模型和人工智能为障碍人士创造了更多就业机会,保证了障碍人士的就业质量,他们得以更广泛、深入地参与社会生活。”
值得一提的是,高峰论坛现场和线上直播中还设置了实时字幕、无障碍坡道、手语翻译、志愿者辅助等一系列无障碍措施,使障碍群体也可以便利、顺畅参会。
至此,WAIC科技无障碍:AI普惠数字未来高峰论坛 的成功举办,吸引了来自社会各界、各行业的关注。站在数字化建设的转折点,大家运用AI等新科技手段加速推动无障碍发展,各显身手,勇攀科技高峰,共同谱写科技无障碍的未来篇章。
图:WAIC 科技无障碍:AI 普惠数字未来高峰论坛现场