边学边赛拿冠军!北邮学子勇夺昇腾AI原生创新算子挑战赛金奖

导读

如何从零开始学习算子开发?昇腾AI原生创新算子挑战赛冠军“法宝”大揭秘。

“0xCCCCCCCC团队夺冠!”

2024年5月9日,在首届昇腾AI原生创新算子挑战赛S1赛季决赛现场,来自北京邮电大学0xCCCCCCCC团队的孙明志和梁昊骞以总分第一的成绩夺得冠军,并赢得了5万元奖金。

每年,昇腾AI都会针对高校开发者举办各种类型的开发者大赛。2024年发布的昇腾AI原生创新算子挑战赛是昇腾AI创新大赛的全新子赛事,该赛事旨在培养一批精通Ascend C算子开发的开发者,鼓励开发者基于CANN的基础能力进行深度创新与实践,加速AI与行业融合,促进开发者能力提升。

Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,最大化匹配用户开发习惯。通过多层接口抽象、自动并行计算、孪生调试等关键技术,助力AI开发者低成本完成算子开发和模型调优部署。

孙明志和梁昊骞目前是北邮计算机学院研究生二年级的学生。初赛时,他们仅用一周时间就以总分第一的成绩从数百支参赛队伍中脱颖而出。决赛时,又以满分的成绩提前锁定冠军。

然而,仅仅2个月前在报名大赛时,孙明志和梁昊骞还从来没有接触过Ascend C编程语言和算子开发。这么短的时间内,团队是如何从零开始学习算子开发,并夺得全国总决赛冠军的?如果非要说这支冠军团队有什么秘籍,优秀的算法基础和“边学边赛”就是两位同学的法宝。

北京邮电大学0xCCCCCCCC团队

从零开始,边学边赛渐入佳境

在实践中解决问题,是最好的学习方式。孙明志和梁昊骞自身的参赛经历,也是“以赛促学”的榜样。

孙明志和梁昊骞都是典型的计算机学霸成长路径。他们小学时就自学编程,初高中时已经在全国信息学竞赛中崭露头角。2018年考入北京邮电大学后,对程序设计大赛的热情让他们走到了一起,成为配合默契的参赛队友。

“我们都比较喜欢也比较擅长打比赛。队名是来致敬C++中的undefined behavior。”从极具极客元素的队名,就能看出两位同学对编程的热爱。

本科期间,0xCCCCCCCC团队在国际大学生程序设计竞赛(ICPC)亚洲区域赛及中国大学生程序设计竞赛(CCPC)分站赛中共获得8次金奖,6次银奖,是目前北邮最强ACM战队。研究生期间,团队多次参加华为举办的各类大赛,先后获得2023 华为嵌入式软件大赛算法组总决赛冠军、2023 华为算法大赛算法未来之星等荣誉。(0xCCCCCCCC团队由孙明志、梁昊骞、林麒三名同学组成,孙明志和梁昊骞参加了首届昇腾AI原生创新算子挑战赛S1赛季)

虽然拿过很多算法大赛的冠军,但在算子开发领域,孙明志、梁昊骞还是小白。“之前我们打的竞赛都全是算法类的,想换一种类型的竞赛试试,挑战一下之前完全没有接触过的领域。”孙明志表示。

昇腾AI开发者 孙明志

首届昇腾AI原生创新算子挑战赛采用初赛+决赛的赛制。初赛为线上比赛,共12道题目,难度循序渐进。决赛是线下比赛,共2道题目。初赛+决赛总分最高者为冠军。

组委会给定的初赛时间是1个半月,学业紧张的孙明志、梁昊骞直到最后一周才开始学习课程、做初赛题目。两人采用每人每天一道算子的分工,遇到难题就互相讨论,一举拿下初赛总分最高的成绩。

这背后,昇腾社区《Ascend C算子开发》(入门-进阶-高级)等一系列视频课程,提供了很好的入门教材。即使完全没有接触过算子开发的开发者,也可以轻松入门。

“进阶课程还有考试题目,动手实现Sinh算子,只要这个考试过关就算入门了。”孙明志和梁昊骞都是仅用一天时间就完成了入门、进阶课程的学习,并完成了Sinh算子开发。当然,团队的飞速成长也离不开两位同学优秀的算法基础。

“算子优化的过程比较考验对计算机底层的理解,以及算法优化经验。如果C++编程不够熟练,学起来会非常吃力。我们之前的算法基础比较好,两个人也花了挺长时间一起交流才得到满分,还是有一定挑战的。“ 孙明志表示。

勇夺冠军,在实战中加速成长

接下来,从入门到进阶,昇腾社区的官方文档和代码仓库既是进阶学习资料,也可以具体指导算子开发。

“入门之后,阅读文档非常重要。初赛每一道题都会接触到不同的函数,对照函数去看文档,就会越来越熟。如果最后一天去做第一天的题我们可能只要两小时就能写完了。“梁昊骞表示。

“对于初学者,代码仓库也是非常好的学习资料。里面有很多从简单到难的各种算子,一下子就能明白整个过程。初赛最后做InstanceNorm算子优化时,我们也是参考了仓库里的代码。“孙明志表示。

就这样,孙明志和梁昊骞凭借一步步自学+动手实践,顺利打入决赛,与来自全国各地其他9支开发者团队齐聚北京,展开巅峰对决。决赛既是对团队整体算子优化能力的大考,也考验着团队配合与临场发挥。

“非常享受和高手在一起打比赛的过程。”“比赛整体体验还是挺不错的。我打比赛有点上瘾的感觉,所以整个过程都算比较兴奋的状态。”对于孙明志和梁昊骞,线下竞赛恰恰是他们的优势。

昇腾AI开发者 梁昊骞

决赛中,0xCCCCCCCC团队一度被第二名追到只差2分,但凭借沉稳的心态和丰富的比赛经验,团队对算子进一步调优,终于获得了满分。两位同学认为,在荣誉和奖金之外,能够学习全新的算子开发能力是参赛最有成就感的事。

“这次大赛最吸引人的地方是从理论到实践。算子竞赛就是一个真真实实的实践过程。之前自己只会调用算子也就是‘调包侠’,只知道这个东西怎么用,不知道它的原理。对算子开发原理有了更深入的理解后,未来的开发会站在更高的层次,考虑更多底层的问题,这对于自己能力和视野的拓展都非常有帮助。”孙明志表示。

“ Ascend C算子开发主要用来加速AI大模型训练和推理,未来将会有非常广的应用前景。现在AI大模型参数规模越来越大,对加速计算的需求一定会越来越高的。在底层流水线上即使只是优化加速一点,在大模型高频训练迭代时带来的效率提升一定非常可观。”梁昊骞表示。

值得一提的是,目前昇腾AI原生创新算子挑战赛(S1赛季)的作品都已在昇腾社区开源开放,供更多开发者学习交流。

寄语学子:不断挑战,积极拥抱AI新技术

目前,昇腾AI已经与360多家高校院所合作,每年培养超过5万名专业AI人才,昇腾开发者突破300万人。

在孙明志和梁昊骞的身边,接触过或对昇腾感兴趣的同学也越来越多。梁昊骞此前曾在一个项目中接触过昇腾AI基础软硬件,他认为昇腾的表现超出预期。

“第一次接触到昇腾设备的时候,我觉得算力能力已经超出预期了。当时项目对时延的要求是70毫秒,最后借助昇腾设备已经优化到40毫秒,完全没有想到能做到这种程度。我觉得大家可以积极尝试一下昇腾。”梁昊骞表示。

随着昇腾AI生态的不断完善,以昇腾AI创新大赛、昇腾AI原生创新算子挑战赛为代表的赛事,也给了更多高校开发者更大的舞台。越来越多年轻开发者在一次次备战大赛中,不断挑战自我,用算法解决真实世界的难题。

“打比赛最有成就感的,就是当自己的算法具备碾压性优势、或者与别的高手旗鼓相当时,感觉自己的努力都是值得的。通过比赛,学到了很多一般书籍或课程都学不到的东西,而且把过程中锻炼的开发能力变成了自己的看家本领。”孙明志表示。

结语

通过以赛促学、边学边赛,孙明志和梁昊骞将自身对编程的热爱变成了实实在在的本领,也找到了最适合自己的成长之路。

目前,昇腾AI原生创新算子挑战赛(S2赛季)已经启动报名(报名截止时间:2024年8月31日),奖金池达到百万元,已经有全国各地高校的数十个团队报名参赛。

如果你有一定的算法开发基础,又对更底层的算子开发感兴趣,不妨加入昇腾AI原生创新算子挑战赛。在昇腾社区,来自全国的高校开发者将与你一起,解锁更多AI新技能!

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/30227.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

金蝶BI方案与奥威BI:智能、高效的数据分析组合

在当今数据驱动的时代,企业对于快速、准确、全面的数据分析需求日益增长。金蝶BI方案和奥威BI SaaS平台正是为满足这一需求而精心打造的智能数据分析工具。 方案见效快 金蝶BI方案以其高效的数据处理能力,能够快速地将海量数据转化为有价值的信息。通过…

uniapp 微信小程序自定义分享图片

场景&#xff1a;微信小程序用户&#xff0c;点击小程序里商品的分享按钮时&#xff0c;想要不同的商品展示不用的分享内容&#xff0c;比如分享图片上展示商品的图片、价格等信息。分享的UI图如下&#xff1a; 实现方法&#xff1a; 1. 分享按钮&#xff1a;<button open-…

计算机顶级会议和顶级期刊

顶级会议 国际计算机设计会议&#xff08;ICCD&#xff09;&#xff1a;由国际电气与电子工程师协会&#xff08;IEEE&#xff09;主办&#xff0c;是计算机体系结构领域的国际顶级会议之一&#xff0c;已经成功举办四十余届。 NeurIPS&#xff1a;全称神经信息处理系统大会&a…

电感(线圈)具有哪些基本特性

首先&#xff0c;电感&#xff08;线圈&#xff09;具有以下基本特性&#xff0c;称之为“电感的感性电抗” ?①直流基本上直接流过。 ?②对于交流&#xff0c;起到类似电阻的作用。 ?③频率越高越难通过。 下面是表示电感的频率和阻抗特性的示意图。 在理想电感器中&#…

centos7安装FTP服务器

目录 实验背景 一、配置yum源 1、本地yum 2、阿里云yum 二、安装vsftpd 1、安装vsftp服务 2、启动服务并设置开机自启动 3、开放防火墙和SELinux 三、创建用户和FTP目录 1、创建文件目录并配置权限 2、创建ftp组以及用户 四、修改vsftpd.conf文件 1、备份 vsftpd.c…

C/C++ vector模拟实现

模拟实现&#xff1a; 框架 namespace yx {template<class T>class vector{public:typedef T* iterator;private:iterator _start;iterator _finish;iterator _end_of_storage;}; } 这里我们声明定义不分离 reverse() 新开一个空间&#xff0c;拷贝数据&#xff0c;然…

HTML星空特效

目录 写在前面 完整代码 代码分析 运行效果 系列文章 写在后面 写在前面 100行代码实现HTML星空特效。 完整代码 全部代码如下。 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"&g…

【Redis】基于Redission实现分布式锁(代码实现)

目录 基于Redission实现分布式锁解决商品秒杀超卖的场景&#xff1a; 1.引入依赖&#xff1a; 2.加上redis的配置&#xff1a; 3.添加配置类&#xff1a; 4.编写代码实现&#xff1a; 5.模拟服务器分布式集群的情况&#xff1a; 1.右键点击Copy Configuration 2.点击Modi…

怎么投资中证全指证券公司指数?

中证全指证券公司指数的代码是399975&#xff0c;有50只成分股&#xff0c;几乎包含了市场上所有主要的证券公司&#xff0c;算是指数基金中投资证券行业的不二选择。 根据天天基金的数据显示&#xff0c;市面上有31只跟踪该指数的基金&#xff0c;规模最大的是南方中证全指证…

【Java面试】二十二、JVM篇(下):JVM参数调优与排查

文章目录 1、JVM的参数在哪里设置2、常见的JVM调优参数有哪些3、常见的JVM调优工具有哪些4、Java内存泄漏的排查思路5、CPU飙高的排查思路 1、JVM的参数在哪里设置 war包部署&#xff0c;在tomcat中设置&#xff0c;修改TOMCAT_HOME/bin/catalina.sh 文件 jar包启动&#xff0…

jpg格式图片无法打开可以修复吗?有哪些方法?

JPG的图片打不开怎么办呢&#xff1f;当JPG图片打不开的时候&#xff0c;我们需要先了解下具体的原因&#xff0c;是因为格式不支持&#xff0c;还是因为图片文件损坏。不同的原因&#xff0c;解决的方法也会不同&#xff0c;比如图片损坏&#xff0c;我们就需要对图片修复处理…

web爬虫笔记:js逆向案例九(某多多 anti_content参数)补环境流程

web爬虫笔记:js逆向案例九(某多多 anti_content参数)补环境流程 一、目标网站:aHR0cHM6Ly9tb2JpbGUueWFuZ2tlZHVvLmNvbS8= 二、接口分析 1、快速定位加密位置(通过搜索/cells/hub/v3快速定位到加密js文件) 2、通过分析可知&#

双系统下,如何隐藏另一个系统分区?

前言 最近有小伙伴在公众号下留言&#xff1a; 小伙伴说&#xff1a;“双系统时&#xff0c;非当前系统的系统盘能不能屏蔽&#xff1f;&#xff01;比如Win7的系统盘在Win10系统时&#xff0c;盘符成了D盘&#xff0c;安装应用软件时&#xff0c;有些文件就到了D盘&#xff0…

DuDuTalk:智能电子录音工牌在销售场景的应用价值

在快速变化的市场环境中&#xff0c;销售团队面临着日益激烈的竞争和不断变化的客户需求。为了提升销售效率、优化客户体验并加强团队协作&#xff0c;越来越多的企业开始采用智能电子录音工牌作为销售场景中的关键工具。本文将从多个方面探讨智能电子录音工牌在销售场景中的应…

一图读懂腾讯云EdgeOne Open Edge平台

为了鼓励更多开发者参与、共同构建和改进边缘应用&#xff0c;腾讯云EdgeOne面向广大开发者&#xff0c;打造了技术开放共创平台——OpenEdge&#xff0c;该平台是国内首个全免费的边缘应用平台&#xff0c;不仅进一步开放了腾讯云遍布世界各地的边缘节点能力&#xff0c;还可以…

Ollama(docker)+ Open Webui(docker)+Comfyui

Windows 系统可以安装docker desktop 相对比较好用一点&#xff0c;其他的应该也可以 比如rancher desktop podman desktop 安装需要windows WSL 安装ollama docker docker run -d --gpusall -v D:\ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama 这里…

微服务必备容器化技术

文章目录 docker介绍与安装及上手应用什么是容器化技术&#xff1f;为什么需要学习docker&#xff1f;如何理解dockerdocker下载与安装docker的基础组成docker体验 dockerfile介绍并创建go-zero环境容器docker的基础组成从容器构建属于go环境的容器基于dockerfile构建go容器镜像…

最新技术:跨境电商源码,应对多国市场需求,让您轻松开展全球业务!

随着全球化进程的不断推进&#xff0c;跨境电商已成为企业拓展国际市场的重要途径。为了满足不同国家和地区消费者不断增长的需求&#xff0c;跨境电商源码应运而生&#xff0c;为企业提供了便捷高效的全球化业务发展方案。 一、全球化运营的关键 跨境电商源码的核心功能在于…

基本循环神经网络(RNN)

RNN背景&#xff1a;RNN与FNN 在前馈神经网络中&#xff0c;信息的传递是单向的&#xff0c;这种限制虽然使得网络变得更容易学习&#xff0c;但在一定程度上也减弱了神经网络模型的能力。 在生物神经网络中&#xff0c;神经元之间的连接关系要复杂的多。前馈神经网络可以看着…

PySide(PyQt)的特殊按钮(互锁、自锁、独占模式)

界面图: Qt Designer中创建窗口,放置一个QGroupBox,命名为btnStation,这就是自定义的按钮站,按钮站里放置6个按钮。自锁按钮相当于电器中的自锁功能的按钮,每按一次状态反转并保持不变。独占按钮也是自锁功能的按钮,不同的是当独占按钮为ON时,其余所有按钮均被置为OFF…