构建企业级大语言模型应用的秘诀:GitHub Copilot 的实践之路

GitHub Copilot 是目前最成功的大语言模型应用之一,可以帮程序员自动生成可用的代码,已经有超过一百万付费用户。

GitHub Copilot 开发团队分享了构建这个产品时的经验教训。整个产品的开发历时三年,尽力了三个阶段:发现、实现和扩展。这三个阶段对于其他产品的研发也非常具有借鉴价值。

一、发现阶段:确定大语言模型应用可以解决的最核心的问题

这个阶段最难的其实是聚焦,就是确定并缩小问题的范围。我们很多人做产品,犯得最大的错误不是没想法,而是想法太多,什么都想做,最后都做不好。而 Copilot 一开始就是专注于软件开发生命周期中的一个特定环节——在集成开发环境(IDE)中编写函数。

二、实现阶段:通过迭代创造流畅的 AI 产品体验

产品开发另一个常犯的错误就是一次憋个大的,很长时间才能发布一个可用版本。GitHub Copilot 在产品开发过程中则是通过快速迭代,让团队迅速从失败中学习和成长。并且他们使用 A/B 测试快速验证新功能。

团队的成员都会”吃自己的狗粮“,也就是每天都使用自己做的产品,这样自己在用的过程中就能发现很多问题。比如他们最开始是做的网页界面,后来发现网页界面上操作需要频繁的在编辑器和界面之间切换,特别不方便,所以他们改成了将 GitHub Copilot 集成至到编辑器中后台运行,这样体验好了很多。

产品开发还有一个常见的错误就是过于在意沉没成本,也就是在某个项目或者方向上已经投入巨大,却因为不愿意放弃而继续坚持,哪怕明显转变方向更有利的情况。团队在最开始的时候,就投入了巨大精力为每个编程语言训练 AI 模型,后来发现大语言模型变强了后,一个模型就可以处理多种语言和任务,于是马上调整方向切换到大语言模型,而不纠结与在单一编程语言上训练消耗的沉没成本。

三、扩展阶段:优化 AI 的质量、可用性和负责任使用,助力产品达到正式发布 (GA)

当功能开发出来后,还需要考虑到投入生产环境大量用户使用的情况。GitHub Copilot 团队采取了一些有效手段来保障产品的发布和扩展。

他们通过 waiting list 的方式逐步放开测试,并且在测试过程中收集反馈并及时调整。

由于大语言模型是基于概率预测的,这意味着它们并不总能产生一致、可预测的结果。所以它们做了缓存,以及调整了参数降低随机性。另外还有很重要的一点是他们建立了数据监测机制,通过明确了产品的关键绩效指标,如代码的接受率和代码保留率(这是衡量开发者对原始代码建议的保留或编辑程度的指标),这样在发布测试或者新版本时,就能通过数据监测来及时了解版本的质量是否符合预期,出现问题可以及时回滚或者调整。

除此之外,他们也做了很多优化在不降低质量的前提下降低成本,比如前面提到的缓存,还有一个有一的案例,就是最开始他们在 AI 建议代码的时候,会生成 10 条建议结果(如果你用过早期版本应该记得),但是发现这样成本很高但大部分用户只会选择第一个,所以他们优化为只显示 1 个结果。

最后把他们的关键经验总结一下:

  • 缩小范围,聚焦在特定的问题,并深入分析 AI 的潜在应用场景。这样做可以帮助应用程序产生更大的影响,并更快地推向市场。

  • 在设计时就考虑到如何快速测试功能和收集数据反馈,因为对于大模型来说输出结果具有不确定性,而且绝大部分用户还在学习如何与 AI 互动。

  • 在扩大规模时,持续收集用户反馈,考虑用户需求,确保能够提供真正有价值的功能。

原文:How to build an enterprise LLM application: Lessons from GitHub Copilot How to build an enterprise LLM application: Lessons from GitHub Copilot - The GitHub Blog 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/342482.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LoRa技术在地质灾害预警上的应用

LoRa扩频技术具有超远距离通信,功率密度集中,抗干扰能力强的优势。成都亿佰特电子科技有限公司推出了几款适用于监测应用的DTU如 E90-DTU系列,E800-DTU系列,E32-DTU系列等。该系列相比同类进口的数传电台,具有功能先进…

[渝粤教育] 哈尔滨工业大学 大学计算机—计算思维导论 参考 资料

教育 -大学计算机—计算思维导论-章节资料考试资料-哈尔滨工业大学【】 第1讲之模拟练习题 1、【单选题】计算之树中,通用计算环境的演化思维是怎样概括的?。 A、程序执行环境—由CPU-内存环境,到CPU-存储体系环境,到多CPU-多存储…

飞畅科技教你如何快速选择工业网管poe交换机?

不管你是工程商还是渠道商,面对市面上品牌繁多,类型复杂,质量和价格也参差不齐的工业级网管交换机您是如何选择的?是否需要电源冗余、网络冗余,以及多样化的网管功能、平台化集中管理、防护、防雷等级又是多少、故障了…

亿佰特串口服务器接入阿里云物模型使用教程

在之前的文章中我们了解到虚拟串口软件作为TCP客户端来结合串口服务器使用,这一期我们来看一下串口服务器怎样接入阿里云物模型。 步骤详尽,一文读懂。 硬件准备 ME31-AXAX4040网络IO联网模块一台; MCGS的TPC7062组态屏一台; …

spring 异常捕获异常_跟踪异常–第5部分–使用Spring进行计划

spring 异常捕获异常看来我终于快要结束本系列有关使用Spring进行错误跟踪的博客了,对于那些还没有阅读该系列博客的人,我正在编写一个简单但几乎具有工业实力的Spring应用程序,扫描日志文件中的异常,然后生成报告。 在本系列的第…

亿佰特串口服务器接入阿里云MQTT协议的软件配置教程

在之前的文章中我们了解到虚拟串口软件作为TCP客户端来结合串口服务器使用,这一期我们来看一下串口服务器怎样接入阿里云物模型。 步骤详尽,一文读懂。 1.阿里云MQTT环境配置 ③点击“创建产品”,配置产品名称,选择“自定义品类…

三种安防监控摄像机供电方式,如何合理选择?

目前,监控摄像机的供电方式主要有以下三种:独立供电模式、集中供电模式、POE供电模式,其中POE供电模式又分为四种情况。那么,你对安防监控摄像机的这三种供电方式是否有所了解呢?接下来就由飞畅科技的小编来为大家详细…

串口服务器NB114产品MQTT协议软件配置教程

串口服务器(NB114)配置 串口服务器连接MQTT服务器方法参考“串口服务器用户手册”,不再重复说明。 3.设备驱动添加与处理 本次例程需要使用到TPC的两路串口以及两种收发协议,详细说明如下: ①在MCGS官网下载“MCGS_…

使用Spring Boot和Kubernetes构建微服务架构

“我喜欢编写身份验证和授权代码。” 〜从来没有Java开发人员。 厌倦了一次又一次地建立相同的登录屏幕? 尝试使用Okta API进行托管身份验证,授权和多因素身份验证。 在本教程中,您将使用Kubernetes将Spring Boot微服务架构部署到Google Clo…

渝粤教育,我是客服,2022重返王者荣耀,再露凶残,欢迎约战

渝粤教育,我是客服,2022重返王者荣耀,再露凶残,欢迎约战

物联网串口服务器的功能和作用

一、串口服务器是什么? 串口服务器提供串口转网络功能,能够将RS-232/485/422串口转换成TCP/IP网络接口,实现RS-232/485/422串口与TCP/IP网络接口的数据双向透明传输。使得串口设备能够立即具备TCP/IP网络接口功能,连接网络进行数据通信,极大的扩展串口设…

[渝粤教育] 三峡大学 电力电子技术(Ⅱ) 参考 资料

教育 -电力电子技术(Ⅱ)-章节资料考试资料-三峡大学【】 第一章 单元测试 1、【单选题】整流是以下哪两种电能形式之间的转换? A、AC-AC B、AC-DC C、DC-AC D、DC-DC 参考资料【 】 2、【单选题】充电宝在给手机锂电池充电的时候采用了以下哪…

为什么说无线数传电台和增益天线是相辅相成关系?

最近我司数传电台客户在使用超宽频(410-493MHz)25W数传电台和433MHz天线的过程中遇到模块失配天线的问题,下面我们不妨再来聊聊这个话题。 问题:客户在使用这个数传电台的时候,配备某些天线的时候不能够正常工作&#…

什么是安防工业交换机,其光口、电口,如何实现电、光转化

对于从事安防传输设备行业的朋友们来说,相信大家对安防工业交换机应该都不陌生吧。我们深知安防工程要的不仅是交换机产品,更需要的是匹配应用需求特点的高性价比。而客户在购买工业交换机时,很多客户都会要几光几电的交换机,那么…

[渝粤教育] 三峡大学 自动控制理论 参考 资料

教育 -自动控制理论-章节资料考试资料-三峡大学【】 第1周作业 第一章综合测验 1、【单选题】通过测量输出量,产生一个与输出信号存在确定函数比例关系值的元件称为( ) A、比较元件 B、给定元件 C、反馈元件 D、放大元件 参考资料【 】 2、【单选题】如果被调量随着…

433M数传电台窄带无线通讯技术手册

一、模块介绍 1.1特点介绍 E3A-DTU-500 是 一款 频率 433M 无 线数传电 台 ( 同时 具有RS232/RS485 接口),透明传输方式,工作在 425~450.5MHz 频段(默认433MHz),工作电压范围 8V~28V。 模块具有…

[渝粤教育] 三江学院 大学生创新基础课程 参考 资料

教育 -大学生创新基础课程-章节资料考试资料-三江学院【】 引言1 单元测验 1、【单选题】本课程《创青春——大学生创新基础课程》的学分为( )分,和后续开设的( )共同组成为4个学分的创新创业基础课程。 A、1&#xff…

使用Spring Cloud HystrixCommands的功能Hystrix

Spring的WebClient提供了一个非阻塞客户端来进行服务调用。 Hystrix虽然现在处于维护模式,但已通过防止级联故障,为慢速或故障上游服务的呼叫提供断路器来保护服务对服务的呼叫。 在本文中,我将探讨Spring Cloud如何提供一种更新的功能方法&…

串口服务器端口配置及调试的6大技巧

1、如何配置串行服务器? 在使用终端串口服务器之前,必须在连接和使用系统之前根据自己的操作环境和应用程序要求配置参数。这些参数主要包括网络参数,每个串行端口的操作模式,打印服务以及设备本身的管理信息和其他内容。 2、如…

飞畅科技告诉你什么是集成串口服务器POE交换机?

飞畅科技FCM系列工业POE交换机,提供7个百兆自适应RJ45端口3个千兆SFP上联光口插槽1路RS-485数据端口1路RS232数据端口,其中1-7口支持IEEE 802.3af/at标准PoE供电,单端口PoE功率达30W,整机最大PoE输出功率为240W。该系列产品是针对…