大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

在人工智能时代,设计师与产品经理比以往更加需要关注一个事实:那就是如何利用人工智能和数据分析技术,打造让用户心动的信息交互产品和用户体验,释放人-机协同共创的巨大潜能,是决定设计产能和竞争力的关键。

图片

在产业的巨变之下,北京邮电大学侯文军教授联合百度飞桨团队,共同设计了《从情节到交互:UX+AI,打造多模态信息交互产品》特色工作坊,在这个为期一周的工作坊中,在飞桨Jungle老师团队的带领下,同学们通过学习多模态数据分析与大模型技术,以影视片为多模态信息源,逐步从图像、声音和文本中开展数据驱动的设计分析,最终将电影的多模态信息转化为引人入胜的多通道交互产品,产出真实项目。

课程培养目标

多模态人工智能技术理解与应用能力

了解多模态人工智能技术的原理、算法和应用,掌握如何利用这些AI技术来分析电影中的文本、图像和声音等多模态信息,并结合飞桨和大模型工具,转化为交互式应用的设计素材与流程。

数据分析与创新思维

学会使用多样化的数据分析工具和方法,从电影数据中提取有价值的信息和洞见。培养创新思维和以用户为中心的设计理念,发掘电影的被动式观赏与主动式交互应用之间的结合点,从电影情节中,策划产品的独特功能价值和交互流程。

交互设计能力

利用多模态的设计能力,在视觉、听觉和触觉等方面,设计直观且吸引人的多感官界面,将电影元素与界面设计相结合,创造出令人印象深刻的交互式应用设计,提供良好用户体验,有效和舒适地传达信息和故事。

团队协作与项目管理能力

与其他参与者组成团队,共同合作开发一个电影交互式APP原型。学会有效的团队协作,包括任务分配、沟通和协调。获得项目管理的实践经验,学会规划、执行和监控项目进展。

部分课程内容

  • 小学期主题及实践任务解析
  • 人工智能技术现状、多模态人工智能技术与设计的结合
  • 多模态与智能交互设计融合系列课程
  • 项目课题:基于电影多模态信息的多通道交互产品设计

部分项目成果

为期5天的工作坊,时间十分紧张。在这么短的时间内,要求同学们不仅要学习和消化全部的课程内容,还需要高质量完成课题项目——这对他们的学习力、创造力,特别是爆发力,都提出了巨大的考验。工作坊的57名大三同学,均来自享誉全国的北邮智能交互设计专业,该专业依托北京邮电大学的信息科技优势,立足“新工科”培养理念,培养“人工智能+交互设计”的复合型精英人才。57名同学,通过相互组队,最终产出了25个内容丰满的项目。

项目示例一

杨闪、孙沛然和车皓远同学,选取电影《爱乐之城》开展多模态信息挖掘与产品设计。他们通过 K-Means 聚类方法,分析和提取了象征不同季节和情感阶段的主题色,以及代表不同情绪风格的音效,将其作为交互产品的设计素材。

图片

图片

在影片中,男女主角载歌载舞,洋溢着活力与优雅,此时此刻,三位同学提出了一个问题:对不会跳舞的人,他们如何能享受歌舞所带来的快乐?借助 PP-TinyPose,产品可以将特定的用户照片,转化为电影中经典舞蹈的视频进行复刻,让用户也能像电影中的角色,载歌载舞!

图片

项目示例二

朱芃宇、范星兰和程力昊同学,探索的电影是《天使爱美丽》。他们基于故事情节、画面和声音等多模态信息,打造了全新的照片社交产品——Moment。

图片

该产品旨在驱动身在不同时空的用户,为彼此拍摄一张将实体明信片与周围环境进行合影的照片,使用户感到明信片与周围风景,都是专门为他们而拍摄的。以此通过强调该照片的独特性和定制性,让用户在收到照片时感受到被特别重视和关注,并从此与陌生人建立一种美妙的时空关联。

图片

借助文心跨模态大模型 ERNIE-ViLG 的参考图模式,用户照片可以被产品进行风格化,这样既避免了个人信息的泄露,又得到了更多的艺术可能性;在社交网络数据提取及用户匹配方面,团队选择 ERNIE-UIE 模型,能更精准地提取和匹配地理位置、机构、建筑等信息,辅助用户找到“远方的朋友”;在明信片内容辅助生产方面,产品则是利用飞桨版 SAM,从摄影照片得到语义内容,并作为 ERNIE-BOT 的文本提示词,从而帮助用户更快地产出明信片设计与文字稿。

图片

相关链接

  • “分割一切”大模型SAM、超轻量PP-MobileSeg、工业质检工具、全景分割方案,PaddleSeg全新版本等你来体验!
  • 通用信息抽取技术UIE发布!

项目示例三

侯家祺、徐瑞宁和秦一硕同学,选取的电影是《佛罗里达乐园》。通过图像与音频聚类,提取主题色和具有代表性的音效,而这些梦幻的色调和热闹的声音,准确反映了孩子们视听世界的特征。

图片

图片

三位同学的产品定位,则是通过 AR 交互式虚拟恶作剧,来帮助用户进入到《弗罗里达乐园》的世界,以第一视角体验各类恶作剧,获得解压。

图片

这款多模态 AR 实景交互 AR 游戏,具有极强的电影内容关联性,借助 PaddleSeg 的能力,许多现实元素能够被自动分离和提取,并融入到剧情,在用户与其交互过程中,产生更深层次的剧情体验。

图片

项目示例四

徐茗和陳珮雯同学,则是基于电影《浪矢解忧杂货店》多模态信息,打造了一款现实版 AI 浪矢爷爷。他们将电影海报中的“杂货店”,通过 ERINE-ViLG 进行了“翻新”;并提取了浪矢爷爷的回信文本,作为小样本数据集,在 AI Studio 大模型社区打造了相同“话风”、同样能够进行回信的“AI浪矢爷爷”。

图片

图片

项目示例五

杨若望、杜尧和刘先胜同学,从电影《阿凡达》中,提取了“冥想”的设计理念和独特的色彩模式。利用文心跨模态大模型 ERNIE-ViLG ,团队的三位男生,通过简单的 prompt,就能为自己生成特定主题且具有一定连续性的系列设计素材,成为自己产品中的关键元素加速了产品的创意表达。

图片

由于篇幅有限,还有很多同样优秀精彩的团队项目没有介绍,相信在未来,我们将有更多的机会和场合进行分享。

图片

北京邮电大学侯文军教授表示,大模型正在真真切切地驱动企业与产品的代际变革,并在实际落地的过程中,产生真实的价值。大模型+设计,将带来企业与产品变革的全新势能,这次校企融合的实践课程,让同学们开展前沿科技的应用探索,产生丰硕的成果,大家都获益匪浅。当前面向新一轮产业变革,更多的任何学科和产业,都将在大模型技术的推动下,迎来自己的“iPhone”时刻。

期待你的加入! 刚才的项目,和“创意”很相关。说起“创意”,这里,我们要明显地做一个广告了:欢迎创意无限的你,带着梦想与技术,参加中国高校计算机大赛人工智能创意赛!

报名链接
https://aistudio.baidu.com/aistudio/competition/detail/1026/0/introduction

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/363.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RabbitMQ ---- 消息队列

RabbitMQ ---- 消息队列 1. MQ 的相关概念1.1 什么是 MQ1.2 为什么要用 MQ1.3 MQ 的分类1.4 MQ 的选择 2. RabbitMQ2.1 RabbitMQ 的概念2.2 四大核心概念2.3 RabbitMQ 核心部分2.4 各个名词介绍2.5 安装 1. MQ 的相关概念 1.1 什么是 MQ MQ(message queue),从字面…

爬虫之Scrapy

一 介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测试等领域&#x…

什么是Docker

容器技术和虚拟机 虚拟机 和一个单纯的应用程序相比,操作系统是一个很重的程序,刚装好的系统还什么都没有部署,单纯的操作系统其磁盘占用至少几十G起步,内存要几个G起步。 在这台机器上开启三个虚拟机,每个虚拟机上…

PSI算法经典论文算法概述

文章目录 什么是隐私求交PSIPSI协议分类PSI算法的分类基于哈希函数的PSI算法基于不经意传输(OT)的 PSI算法基于GC的PSI算法基于公钥加密的PSI算法基于DH的PSI算法基于RSA盲签名的PSI算法基于同态加密的PSI算法 基于差分隐私的PSI算法 总结参考文献 什么是…

为了实现上网自由,我做了一个多功能串口服务器

项目作者:小华的物联网嵌入式之旅 介绍:从事电气自动化行业,多次获得物联网设计竞赛,爱好嵌入式设计开发,物联网开发。 设计方案思路的由来,是因为我们现在的开发板基本需要通过串口与WIFI模组或以太网模…

[Linux] 最基础简单的线程池 及其 单例模式的实现

本篇文章主要用到线程相关内容, 下面是博主关于线程相关内容的文章: [Linux] 线程同步分析:什么是条件变量?生产者消费者模型是什么?POSIX信号量怎么用?阻塞队列和环形队列模拟生产者消费者模型 [Linux] 线程互斥分析: 多线程的问…

华为、阿里巴巴、字节跳动 100+ Python 面试问题总结(一)

系列文章目录 个人简介:机电专业在读研究生,CSDN内容合伙人,博主个人首页 Python面试专栏:《Python面试》此专栏面向准备面试的2024届毕业生。欢迎阅读,一起进步!🌟🌟🌟 …

华为发布大模型时代AI存储新品

7月14日,华为发布大模型时代AI存储新品,为基础模型训练、行业模型训练,细分场景模型训练推理提供存储最优解,释放AI新动能。 企业在开发及实施大模型应用过程中,面临四大挑战: 首先,数据准备时…

剑指offer刷题笔记--Num41-50

1--数据流中的中位数(41) 主要思路: 维护两个优先队列,Q1大数优先,存储比中位数小的数;Q2小数优先,存储比中位数大的数; 当存储的数为偶数时,Q1.size() Q2.size(), 中位…

解决github无法拉取submodule子模块的问题

引言 当使用git clone --recursive url 拉取一个配置了子模块的仓库后,会卡住。 同时在使用git clone 拉去https的url时,同样可能会出现一直卡在cloning int reposity...本文提供一个简单的脚本来解决该问题。 前置准备 需要配置好git的相关配置&…

快速配置 Rust 开发环境并编写一个小应用

安装: curl --proto https --tlsv1.2 -sSf https://sh.rustup.rs | sh 更新: Rust 的升级非常频繁. 如果安装 Rustup 后已有一段时间,那么很可能 Rust 版本已经过时, 运行 rustup update 获取最新版本的 Rust rustc:编译Rust程序 rustc只适合简单的Rust程序&#xf…

qt和vue的交互

1、首先在vue项目中引入qwebchannel /******************************************************************************** Copyright (C) 2016 The Qt Company Ltd.** Copyright (C) 2016 Klarlvdalens Datakonsult AB, a KDAB Group company, infokdab.com, author Milian …

记录--再也不用手动改package.json的版本号

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 本文的起因是有在代码仓库发包后,同事问我“为什么package.json 里的版本还是原来的,有没有更新?”,这个时候我意识到,我们完全没有必要在每…

阿里云无影云电脑具体价格_云桌面不同配置1元报价

阿里云无影云电脑配置费用,4核8G企业办公型云电脑可以免费使用3个月,无影云电脑地域不同费用不同,无影云电脑是由云桌面配置、云盘、互联网访问带宽、AD Connector、桌面组共用桌面session等费用组成,阿里云百科分享阿里云无影云电…

什么是分布式软件系统

:什么是分布式软件系统?分布式软件系统是什么意思? 分布式软件系统(Distributed Software Systems)是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。它包括分布式操作系统、分布式程序设计语言及其编译(解释)系统、分…

Unity 2D骨骼动画+IK反向动力学

本文言简意赅的完成这个流程,废话不多说!干! 等等,先看看效果 第一步:导入2D Animation包 当前环境:Unity3D 2021(不需要完全一样也可以) 进入unity后点击Window->PackageManager打开如下界面 按Insta…

LangChain 联合创始人下场揭秘:如何用 LangChain 和向量数据库搞定语义搜索?

近期,关于 ChatGPT 的访问量有所下降的消息引发激烈讨论,不过这并不意味着开发者对于 AIGC 的热情有所减弱,例如素有【2023 最潮大语言模型 Web 开发框架】之称的大网红 LangChain 的热度就只增不减。 原因在于 LangChain 作为大模型能力“B2…

Vue3_简介、CompositionVPI、新的组件

文章目录 Vue3快速上手1.Vue3简介2.Vue3带来了什么1.性能的提升2.源码的升级3.拥抱TypeScript4.新的特性 一、创建Vue3.0工程1.使用 vue-cli 创建2.使用 vite 创建 二、常用 Composition API1.拉开序幕的setup2.ref函数3.reactive函数4.Vue3.0中的响应式原理vue2.x的响应式Vue3…

万字长文 | Hadoop 上云: 存算分离架构设计与迁移实践

一面数据原有的技术架构是在线下机房中使用 CDH 构建的大数据集群。自公司成立以来,每年都保持着高速增长,业务的增长带来了数据量的剧增。 在过去几年中,我们按照每 1 到 2 年的规划扩容硬件,但往往在半年之后就不得不再次扩容。…

《Redis 核心技术与实战》课程学习笔记(八)

String 类型为什么不好用了? String 类型可以保存二进制字节流,只要把数据转成二进制字节数组,就可以保存了。String 类型并不是适用于所有场合的,它有一个明显的短板,就是它保存数据时所消耗的内存空间较多。 为什么…