飞桨开发者技术专家(PPDE)谢杰航研究方向为AI城市规划、景观设计、生态环境及农业等领域的应用落地。他在此前Wave Summit 2023深度学习开发者大会上为大家带来了主题为《大模型时代的开发者:从飞桨PPDE到文心布道师》的演讲。本次演讲共分为三个部分:从文科生到人工智能从业者、从深度学习到大模型和大模型与风景园林的深度融合。
从文科生到人工智能从业者
谢杰航最大的标签是文科生,非科班出身。2019年,在没有任何基础的情况下,他系统学习了《百度架构师手把手教深度学习》《机器学习的思考故事》等课程,打下了坚实的基础。对他来说,2020年是求知探索的一年,也是学习最痛苦的一年,一路打怪升级,深度学习《高层API助你快速上手深度学习》《七天训练营》等一系列课程,从一名新手小白成长为行家里手。2021年开始,陆续为飞桨的开源社区做一些产业级的解决方案,包括并行化识别、无人机环境巡航等的开源项目。最后,在2021年9月,谢杰航成为了飞桨开发者技术专家。
在开源社区,谢杰航不仅参加了开发者大会、飞桨开发者等丰富多彩的线下活动,在线上,他还创作精选项目、加入飞桨兴趣小组,与飞桨社区共同成长。
不论工程优化或者前沿算法多么复杂,都可以在飞桨解决端到端的问题,不需要用户到处去找开源库,去攒自己的方案。百度飞桨在2021年就发布了业界首创的4D混合并行技术,并且依赖这套技术数次在国际权威的Benchmark MLPerf Training上做到了世界范围的性能第一。
目前,PPDE已经成为国内AI领域最活跃的荣誉体系之一,主要有3个特点:
1、覆盖区域广泛,分布于33个省级行政区,已有超过三百位成员。
2、活动形式多元,定期组织活动形式多元的活动,例如社团市集、极客沙龙、AI体验、技术讲座等活动。
3、开源贡献丰富,飞桨开发者技术专家,从算子、底层代码、产业及案例等方面,为飞桨开发者社区做了很多开源的贡献。
从深度学习到大模型
今年,由于大模型的快速发展,对开发者来说,既是一次机遇又是一次挑战。从普通的开发者变成大模型的开发者,所有的开发项目都围绕大模型进行。然而,从以前的传统方式到现在的大模型方式,需要一个转变的历程。
传统人工智能应用开发方式,首先要有明确的业务需求,然后根据业务需求去寻找数据或者标准数据,进行大量的数据公测;其次,要有模型开发,模型训练,模型评估,模型压缩,模型加密,模型部署;最后,将模型结合一些工程的开发变成一个应用。
基于文心大模型应用开发的范式是截然不同的。同样是从业务需求开始,但是从数据工程环节之后却有很大变化。大模型最大的改变就是模型层面,现在很少有开发者研究模型,因为所有的开发都是基于大模型基座进行。就像文心一言一样,调参、微调训练、评估、部署、运维,都实现了一体化全自动。之前做AI应用,特别是大模型应用的时候,谢杰航总担心服务会不会挂掉。现在,交给文心大模型背后的运维团队后,只需要关注业务就行。
所以大模型时代,在建模方面不需要做过多努力,可直接利用API做应用。API结合Prompt模板管理优化或者使用流行的插件库,然后融入工作流(业务流),就能快速产生一个业务应用。
人工智能到大模型转向,其开发核心没有改变,依然是模型、算力和数据三要素,真正改变的是开发思维。
在模型方面,通常很少去调整大模型结构,因为一旦调整,就要重新训练所有参数,一般开发者无法承受这样的训练成本压力,所以会选择大模型基座。
在算力方面,由于硬件成本无法改变,所以把着重点放在推理加速、模型量化、压缩等技术上,这样就能用更少资源和算力把大模型运行起来,这是一个普通开发者需要关注的方向。
在数据方面,只要把更多时间和资金投入到现在高质量、多模态数据的标注上,就能改变大模型生成结果,这是开发者能最大限度改动调优的部分。
因此,要做好全面储备拥抱大模型的趋势,深入了解前沿知识,快速提升技术能力,积极实践参加比赛,全面拓宽认知。
大模型与风景园林的深度融合
一个大模型的技术落地到业务,需要关注以下3个方向。
解构业务,找准需求
由于大模型的推理成本很高,必须要在业务流中弄清楚,哪些适用大模型,哪些适用普通模型、小模型;然后通过对业务流的解构,进而找到对应的需求,最后决定用大模型去开发哪些应用。
社区资源支持,为项目实现保驾护航
开源社区提供飞桨大模型开发套件、社区精选大模型开源项目、大模型开发课程等等资源。飞桨AI Studio星河社区提供GPU算力支持,开发者可以直接一键Fork这些项目,调换好数据,就能生成自己的项目。
落地案例
基于文心大模型和飞桨AI Studio星河社区,谢杰航完成了景观效果图生成器、仙人掌 Cactus、城市规划法规标准查询助手三个案例,因为有充足的算力、数据、模型基座和开发套件,三个案例应用落地时间平均不到两天。其中,景观效果图生成器是最难的案例,用了整整两天时间。其他两个案例都是基于PaddleNLP的一些基座模型进行微调,开发速度非常快。
成为文心布道师后,谢杰航在线上、广州、上海进行应用分享,探索出了开发者的发展路径,最大的感受是:
同频共振,快速成长。通过布道去推动自己主动追踪学习和掌握当下最新开源技术,紧跟国际技术变化趋势,才不会落后于时代,才能与时代同频共振。
开放交流,开源共建。与开源社区的开发者保持密切的交流和信息互通,了解行业对大模型的落地需求,共同探索、攻克行业大模型落地的难点,与开源社区共建大模型生态。
技术融合,全栈能力。与以往基于云计算、大数据的开发技术栈不同,大模型开发落地需要更强的计算能力、更灵活的资源调度和管理能力以及弹性容错机制,大模型开发者除了需要掌握开发技术栈以外,还需要对数据工程和运维管理技术有所了解,才能保证大模型应用顺利落地。
本篇文章根据WAVE SUMMIT 2023深度学习开发者大会讲稿整理而成
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~