Baidu Comate帮开发者“代码搬砖”,2天搞定原先3周工作量

日常项目基础工作耗费大量时间、紧急任务一连“肝”几个大夜……对于一个计算机相关专业研究生来说,几乎是家常便饭。随着大模型能力赋能编码工具,被开发者们戏称的“代码搬砖”生活有了起色。

从去年开始,PPDE 飞桨开发者技术专家、澳门理工大学研二学生王荣胜,和他的实验室伙伴们用上了智能代码助手 Baidu Comate,用于协助解决基础重复的代码编写工作,推进实验室的医学影像数据处理项目提效。原本处理150G的医学影像数据,需要3个人花一周时间才能完成数据处理的代码编写工作。使用 Baidu Comate “实时续写”、“注释生成代码”、“代码生成注释”、“私域知识增强”等功能后,只需要1个人花2天时间就可以完成,项目整体的团队协作效率也获得了提升。

图片

△PPDE 飞桨开发者技术专家、澳门理工大学学生 王荣胜

01 用 AI 写代码 项目提效9倍以上

王荣胜已有六年 Python 学习和开发经验。如同每个热爱编程研究的开发者,王荣胜非常享受在开发过程中沉浸地思考如何实现某个功能、如何更顺滑地构建代码间的逻辑与架构。但攻坚的成就感之外,是60%-70%左右的基础代码和重复代码编写工作。

直到去年一次行业大会中,王荣胜了解到“Baidu Comate”。Baidu Comate 是百度基于文心大模型研发的智能代码助手,精通100+编程语言,以插件的形式深度集成在 VS Code、JetBrains 全系列、Xcode 等主流 IDE 中,借助文心大模型底层能力,把代码理解、生成、优化等能力无缝集成到研发流程的各个环节,为开发者提供了一个7*24小时的 AI 编码助手。

图片

“回到学校后,我第一时间叫上实验室的伙伴们试用体验。”之所以如此兴奋,是因为当时实验室正被“大批量同质化数据处理”问题所困扰。

去年底,实验室接手了一个医学图像与 AI 能力相结合的应用项目,数据处理是其中一个重要环节。这个项目中,合作医院每送来一批数据就是150G左右的文件包,其中全都是医学扫描影像 DICOM 格式文件,存储着患者的患处扫描图像信息、扫描设备信息、患者个人信息等内容,小则几十兆大则几百兆,难以被直接用于模型训练。因此打头阵的难题就是,通过系列编码批量化将 DICOM 医学影像格式转换为 PNG 图片格式,保留每张影像可用信息的同时根据像素间距调整其大小。而这个过程,需要实验室3个人一起连轴转一周时间,调整大量基础简单的重复代码,才能处理完毕。

王荣胜和实验室伙伴们在尝试使用 Baidu Comate 后,困难迎刃而解。一方面,团队可以使用 Baidu Comate 的“实时续写”功能,让其通过分析上下文逻辑关系,智能生成方法、函数、判断、循环体等完整的代码块,提升代码产出速度。另一方面,“还可以在 Baidu Comate 中通过自然语言指令来输出代码,只要提示词准确,生成代码一般都可以直接使用。”

王荣胜通过如下一段自然语言指令,就能让 Baidu Comate 快速进行批量数据处理工作:

“使用 python 读取 image 文件夹下的所有医学影像图片,以窗口大小为512×512对整个图片进行划分,窗口可以有重合,你必须要保证可以很好的进行窗口分割,对分割的窗口信息进行记录,记录在 json 文件中,保证使用该 json 可以将图片进行恢复。使用相同的窗口分割方式对 label 文件夹下的标注图片进行同样的窗口划分,最终将结果保存在 image_output 和 label_output 文件夹中。”

图片

△医学影像数据处理的代码生成演示

除此之外,Baidu Comate 还帮助王荣胜实验室同学们能够更快响应合作方新增需求。在早期对医学标注数据的处理中,实验室通常采用二值图像对标注区域进行记录。可在数据交付后,合作方指出医院工作站的机器只能处理标准的 JSON 格式数据,需要进一步修改代码。原始处理方式是人工读取每张影像的二值标注图,找到其标注轮廓,再记录下所有轮廓的坐标点( x 和 y 值),最终保存到 JSON 文件中。而使用 Baidu Comate “注释生成代码”功能,则只需通过自然语言描述需求,就能在原有代码基础上自动添加生成新的代码函数,从而进一步生成标注轮廓的 x 和 y 值,并将其保存在 JSON 文件中,交付给院方使用。

最终,在 Baidu Comate 的帮助下,原本3个人要花一周时间才能处理完的150G医学影像数据,通过提升代码编写效率,如今只需要1个人花2天时间就可以完成,提效9倍以上。

图片

△王荣胜与实验室伙伴使用 Baidu Comate 解决医学影像项目数据处理代码开发需求

02 代码生成注释、私域知识增强

Baidu Comate 助力团队丝滑协作

在使用 Baidu Comate 之前,王荣胜和实验室同学们做过一轮对市面上编码工具的体验测试,最终还是选择了使用 Baidu Comate 。“我们对这类工具的要求主要是两个,一是实时续写的生成速度要快,二是推荐的代码质量要高,得是我所需要的。综合看下来,同学们都觉得 Baidu Comate 产出的代码品质和速度更优,各类功能更为丰富,综合效果最佳。而且他的很多功能对于我们团队协作也有明显的提效作用。”王荣胜解释道

据王荣胜介绍,实验室项目中最常见的场景便是协同配合,一串代码要经多人之手。这个过程中,代码注释就成为沟通桥梁。但不同人的注释习惯难免不同,且时常出现有人漏写忘写注释的情况,这就影响了团队协作。通过 Baidu Comate “代码生成注释”功能,只需“点击一下”就可以直接生成规范的代码行间注释,快速补充漏写的注释,提升代码阅读效率,对实验室的协同开发流程起到了很明显的提效作用。

图片

△生成注释功能演示

在最近一次升级中,Baidu Comate 还发布了“Comate 开放平台”功能,在满足“定制化需求”上更近一步,帮助团队实现提效。

“Comate 开放平台”功能,是指 Baidu Comate 对第三方开发者工具、在线服务进行开放,支持知识扩展与能力扩展,让开发团队可以将自有或第三方能力、服务连接到编程现场,助力开发团队打造自己的定制化能力,建设更适合自己团队的研发助手。这对王荣胜来说,正好充分利用自己长期积累的“代码小仓库”,让其最大程度发挥价值。

以往大多数开发者在处理同质性的代码需求时,往往会去开发者社区搜索可用代码、或根据之前备份的个人常用代码来复制粘贴后调整使用。王荣胜根据多年项目积累,也整理了自己的“代码小仓库”,存储分类了六七十个文件夹,用于日常工作提效。即便如此,“我这个人不太注意文件命名,找代码就比较费劲。”王荣胜说,每当需要使用时,要先回忆代码所在位置,甚至挨个儿去文件夹翻找。

而有了 Comate 开放平台,王荣胜可以将自己的“代码小仓库”直接接入 Baidu Comate,通过私域知识增强能力让 Comate 可以学习掌握之前的代码知识,快速产出符合要求的代码。不仅省去了团队所有同学学习和人工翻找的过程,代码生成准确率还提升了10%-20%。

图片

△使用 Comate 开放平台实现私域知识增强

今年5月,王荣胜顺利从澳门理工大学硕士毕业,未来他打算继续深造读博,攻坚更多 AI 与行业交叉融合的研究方向,“我希望未来 AI 能真正的走进各行各业,帮助人们更好地生活,也期待 Baidu Comate 能持续优化迭代,变得更加智能。在未来,我们只需要画好应用的图纸,剩下的砖,AI 替我们搬!”

——————END——————

推荐阅读

用 Baidu Comate 实现研发提效,百度营销服务团队打造“轻舸”加速营销智能化

从0到1:广告营销多智能体架构落地全攻略

基于afx透明视频的视觉增强前端方案

百度一站式数据自助分析平台(TDA)建设

浅析如何加速商业业务实时化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/847486.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CV每日论文---2024.6.3

1、Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis 中文标题:Video-MME:视频分析领域首个多模态法学硕士综合评估基准 简介:Video-MME 是一个全面评估多模态大语言模型(M…

MAX7219(模拟SPI)驱动灯环的简单应用

文章目录 一、MAX7219是什么?二、使用步骤1.硬件1.1 引脚说明1.2 应用电路1.2.1 驱动数码管1.2.2 驱动点阵 2.软件2.1 时序2.2 寄存器2.2.1 掉电寄存器2.2.2 译码模式寄存器2.2.3 亮度寄存器2.2.4 扫描寄存器2.2.5 显示测试寄存器 2.3 初始化2.4 控制左侧灯环特定位…

大厂起诉了,协商拿了2N,整理点经验心得给大家,关于离职时如何让自己利益最大化!...

离职时,如何让自己的利益最大化? 一位跟大厂仲裁,并通过协商拿到2n的网友分享了自己的经验心得,干货满满,下面是要点总结: 1.大部分裁员都是违法裁员,应该给2n,但公司不会承认&…

【代码随想录——贪心算法——二周目】

1.买卖股票的最佳时间② 思路:构建每两天之间的利润之差,如果是正数则一直累加即可。 体现出来场景是,如果理论一直为正,则说明我们需要一直持有股票。当出现负数时,代表我们应该在前一天卖出。当出现正数时我们应该在…

【耗时十个小时】程序员最趁手的SVM算法,学完你会哭着感谢努力的自己!

❤ 纯 干 货 ❤ 在这之前咱们已经接触了 各个算法的优缺点的总结,以及8个回归类算法、7个正则化算法的总结、5 个集成算法模型的全部总结! 感兴趣的可以翻到之前看看~ 咱们今天就大概一起学习一下关于SVM的方方面面。 线性支持向量机 非线性支持向量…

【全开源】Java同城服务同城信息同城任务发布平台小程序APP公众号源码

📢 连接你我,让任务触手可及 🌟 引言 在快节奏的现代生活中,我们时常需要寻找一些便捷的方式来处理生活中的琐事。同城任务发布平台系统应运而生,它为我们提供了一个高效、便捷的平台,让我们能够轻松发布…

ATA-2081高压放大器选型时注意事项是什么

高压放大器是一类特殊设计的放大器,用于放大高电压信号。在选择高压放大器时,需要考虑多个因素,以确保所选设备符合应用需求并能够提供稳定、可靠的性能。下面安泰电子官网将详细介绍在高压放大器选型过程中需要注意的关键事项。 一、电压范围…

【机器学习数据挖掘】基于自回归积分滑动平均模型的疫情分析报告 附完整python代码

资源地址:Python数据分析大作业 2000字 图文分析文档 疫情分析完整python代码 数据分析 数据来自法国疫情数据 数据预处理 建立模型 模型预测 资源地址:Python数据分析大作业 2000字 图文分析文档 疫情分析完整python代码 代码详解 完整代码文件 主…

luckysheet的使用

前言 公司新需求要一个在线的excel编辑器 一、luckysheet是什么? LuckySheet是一款基于Web的在线表格组件,一款纯前端类似excel的在线表格,功能强大、配置简单、完全开源结合Vue3可以实现数据的动态展示和编辑,为用户提供良好的…

2024年澳大利亚科学院新增院士名单和两位华人学者简介

近日,澳大利亚科学院公布了2024年新当选的24位院士名单,他们也是访问学者、博士后及联合培养博士们关注的目标导师。为此知识人网小编推出该文,以飨读者。 5月 23 日,2024年澳大利亚科学院(the Australian Academy of…

【企业开发】大屏的响应式处理

【企业开发】大屏的响应式处理 如图: 响应式工具封装 // 等比缩放方式屏幕适配 export function screenAdaptive(designWidth 1920, designHeight 1080) {const screenWidth document.documentElement.clientWidth || document.body.clientWidthconst screenHeig…

【数据结构】 排序算法总结,直接选择排序详解!

文章目录 1. 排序几个重点概念的理解2. 排序算法的分析🐧3.直接选择排序 1. 排序几个重点概念的理解 2. 排序算法的分析🐧 3.直接选择排序 🐧 begin 有可能就是 maxi ,所以交换的时候,要及时更新 maxi 🍎…

java同步

Java中的同步是指在多线程编程中,用来控制多个线程对共享资源的访问,以避免数据不一致的问题。Java提供了多种同步机制来确保线程安全。以下是Java同步的详细讲解: 1. synchronized关键字 synchronized关键字是Java中最常见的同步机制&…

计算机专业本科就业还是考研?考研有哪些热门方向?

考研并不是一个逃避就业的避难所,也不是一个简单的提升待遇的手段。考研是提升自我的途径,特别是对于那些对特定技术领域有浓厚兴趣并愿意深入研究的人来说 一个本科生能够认真学三年,那么他们所掌握的技能和知识不应该逊色于那些通过短期培…

Solidworks 提取模型中的零件,并组合成一个新的零件,放入特征库

对方发来一个STP文件,其中有模型的部分零件想为我所用。 Shift键鼠标左键 选取需要的零件 在选好零件上右键,选择“孤立” 左边找到部件,ctrl左键选中,选择“插入到新零件” 点 绿色 勾 就选择保存类型,完成 。 打开这…

Pyinstaller安装与使用

一、Pyinstaller简介 PyInstaller将Python应用程序冻结(打包)独立可执行文件中。它可以构建较小的可执行文件,它是完全多平台的,并且使用OS支持来加载动态库,从而确保完全兼容。 二、Pyinstaller安装 1、下载安装 首先安装“pip install pywin32” 其次“pip install …

设备维修管理系统

设备维修管理系统是一个集故障处理、巡检处理、设备管理、维修管理、系统管理以及手机客户端功能等六大功能于一体的信息化管理系统。该系统旨在实现设备管理的科学化、规范化和网络化,通过整合设备维修的各个环节和流程,提高设备维修的效率和质量&#…

网络安全||信息加解密技术以及密钥管理技术

一、信息加解密技术 对称加密 对称加密(又称为私人密钥加密/共享密钥加密):加密与解密使用同一密钥。特点:加密强度不高,但效率高;密钥分发困难。(大量明文为了保证加密效率一般使用对称加密&…

GAT1399协议分析(二)--注册流程分析

一、官方流程说明 二、官方流程解析 1 : 发起方向接收方发送注册 HTTP POST 请求/VIID/System/Register。 2: 接收方向发送方发送响应401 Unauthorized, 并在响应的消息头 WWW-Authenticate 字段中给 出适合发送方的认证机制和参数。 3: 发起方重新向接收方发送注册 HTTP POST…

单实例11.2.0.4迁移到11.2.0.4RAC_使用rman异机恢复

保命法则:先备份再操作,磁盘空间紧张无法备份就让满足,给自己留退路。 场景说明: 1.本文档的环境为同平台、不同版本(操作系统版本可以不同,数据库版本相同),源机器和目标机器部分…