GPT4O给Qwen2生成的高考作文打分56分,从“小白”进阶技术大神的开发者基于国产GPU推理模型效果可还行?

OpenI启智社区上线的【芯动开源】首场活动-天数智芯挑战专场即将迎来最后一周的冲刺阶段,自2024年5月27日上线以来,这期间,我们见证了天数智芯通用GPU加速卡在适配AI模型方面的无限可能与开发者们开源精神的璀璨光辉。

在短短的两周时间里,我们收到了累计超过300次基于天数智芯天垓100(BI-V100)和智铠100(MR-V100)的模型适配和跑通结果的提交。这些成果不仅展现了开发者们深厚的技术功底和出色的创新能力,也充分验证了天垓100和智铠100两款高性能通用GPU芯片在模型适配和运行方面的卓越性能。

值得一提的是,除了天数智芯开源的DeepSparkInference推理模型示例库中包含的50余款模型外,许多开发者还基于智铠100自适配了多款国内外热门的AI模型,如GLM-4-9B、Qwen2-7B、Telechat-7B等等。这些大模型的适配成功,不仅拓宽了AI技术的应用场景,也为开发者们提供了更多实践和创新的机会。

技术先锋荣登榜首,实力与热情铸就荣耀之巅

在这场技术的较量中,一位开发者凭借其出色的技术实力和敏锐的洞察力脱颖而出。他便是我们今天要重点介绍的开源人物——周辉

他不仅及时关注业界新兴的大模型并将其从其他开源平台导入贡献至OpenI启智社区,还充分利用智铠100的强大性能完成了多个国内最新发布的大模型的适配和高效运行。本着对大模型迁移活动的满腔热情和卓越的技术实力,周辉成功拿下了第2周活动的第一名,获得了价值300元京东卡和300算力积分

周辉所迁移和适配的模型中,不乏像智谱AI于2024年6月5日推出的GLM-4-9B-Chat模型和阿里通义千问团队于2024年6月7日推出的Qwen2-7B-Instruct、Qwen2-72B-Instruct-GPTQ-Int4(量化版)模型这样的业界翘楚。这些最新推出的国产大模型以出色的对话生成能力、指令理解能力和广泛的知识覆盖,成为了众多开发者关注的焦点。

在深度学习领域,模型的适配和迁移是一项极具挑战性的任务。这不仅需要开发者对硬件性能有深入的理解,对模型工作原理有透彻的研究,还需要具备丰富的实践经验和创新思维。周辉正是凭借这些能力以及对启智平台功能与各算力资源性能的熟练掌握,成功地将这三款模型与智铠100进行了适配和迁移。

为了将这一过程中的点滴体会和宝贵经验传递给更多的开发者们,周辉将它们凝结成了一篇篇详细的教程发布在启智论坛。这些教程不仅涵盖了模型适配的各个环节,如创建任务、选择算力资源、安装依赖包、编写推理程序等等,还深入剖析了其中的技术难点和解决方案,为其他开发者提供了宝贵的参考,更为推动自主通用GPU加速卡的优化与发展注入了新的动力。

在周辉的教程中,他巧妙地融入了一些既实用又充满趣味的案例。比如,他利用智铠100调试Qwen2-72B-Instruct-GPTQ-Int4模型时的一个独特尝试,运用这个强大的模型来生成一篇模拟的今年高考作文,命题是“随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少”。随后他又将生成的作文交由ChatGPT4-O进行评分,作文竟然获得了高达56分(满分60)的优异成绩。

除了图文教程,周辉还会将模型适配的过程和经验制作成系列视频,发布在自媒体视频号(周辉6344)上。

介绍了这么多,那周辉究竟是何方神圣

周辉坦言,尽管自己已走出校园多年,且并非人工智能领域从业者,甚至曾是一名对人工智能知之甚少的“小白”,但正是借助了OpenI启智社区所提供的丰富算力资源、技术支持以及详尽的教程,他才得以逐步深入,不断进阶。在此过程中,他深感自己受益匪浅,并乐于将自己的学习心得和实践成果分享给更多的开发者,希望能为大家带来启发和帮助。

“在平凡的日子里也要泛着光”,这句话用来描述周辉再合适不过。他并非一开始就站在技术的巅峰,但他凭借对技术的热爱和不懈追求,一步步走进了我们聚焦的画面。他用自己的实际行动诠释了什么是真正的开源精神——分享、协作、共同进步。这种精神不仅激励着开发者们不断前行,也吸引着越来越多的人加入到OpenI启智社区这个开源大家庭中来。

让我们为周辉和所有在OpenI启智社区默默做出开源贡献的开发者们点赞

收官在即,邀你来战

最后,活动已步入最后一周的冲刺阶段,如果你也跃跃欲试的话,可以参考学习大家在启智论坛贡献的教程,来启智AI协作平台使用天数智芯GPGPU算力资源体验大模型迁移的快感。我们对每周表现优异的小伙伴们都准备了京东卡奖品和算力积分奖励,也期待更多的开发者能够加入到这场挑战中来,共同探索天数智芯自主通用GPU在模型适配方面的更多可能性和潜力。

天数智芯专场活动链接

基于智铠100调试最新的通义千问Qwen2-7B-Instruct模型教程

基于智铠100调试最新的智谱清言GLM-4-9B-chat模型教程

利用天数智芯MR-V100使用KAN-TTS将文字转语音教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/852481.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录算法训练营第二十三天|669. 修剪二叉搜索树、 108.将有序数组转换为二叉搜索树、 538.把二叉搜索树转换为累加树

669. 修剪二叉搜索树 题目链接:669. 修剪二叉搜索树 文档讲解:代码随想录 状态:还可以 思路: 如果节点的值在[low, high]之间,则递归修剪它的左子树和右子树。 节点值小于low:如果节点的值小于low&#xff…

智慧工厂自动装车解决方案:H13三维轮廓扫描激光雷达

激光雷达在智慧工厂自动装车的应用场景在智慧工厂的自动装车场景中,激光雷达的应用显得尤为关键。这种技术以其精确的测量和定位能力,助力自动化装车的每一个环节,大大提高了装车的效率和准确性。 首先,激光雷达在车辆定位方面发挥…

[next.js] svgr/webpack

nextjs如何配置svg文件,使其像react组件一样导入? 当前next.js 开发环境我使用了--turbo 来开启turbopack加速文件构建,所以之前的一些webpack loader之类的无法正常工作。通过搜索发现一般都是使用svgr/webpack来处理svg,打开svgr官网发现…

vscode 连接 GitHub

文章目录 连接 GitHub一、通过 SSH 连接 github二、通过 HTTPS 连接 github 连接 GitHub 在 vscode 中首次使用 git push 命令时会要求输入 github 账户的 username 和 password,这种基本身份验证在 2021.8.13 以前还是可以的,之后的话,就会…

Luma AI 推出梦幻机:据说吊打Sora和快手可灵(KLING)|TodayAI

近日,美国初创公司 Luma AI 宣布推出其最新的文本生成视频工具——梦幻机(Dream Machine)。这一消息发布的时间正好在中国科技公司快手推出其文本生成视频模型可灵(KLING)几天之后,标志着视频生成领域的又一…

Android Compose 十一:常用组件列表 compose自己个的 下拉刷新

列表下拉刷新 material3 还没有下拉刷新功能material:1.3.0 之后 swiperefresh 被弃用 被PullRefresh替代使用PullRefresh 需要添加依赖 implementation ‘androidx.compose.material:material:1.6.8’ 先上代码 var refreshing by remember {mutableStateOf(false)} val…

线性代数|机器学习-P12Ax=b条件下x最小值问题

文章目录 1. Axb下的最值问题-图形转换2. Gram-Schmidt 标准形3. 迭代法-Krylov子空间法 1. Axb下的最值问题-图形转换 假设我们有一个直线方程如下: 3 x 1 4 x 2 1 \begin{equation} 3x_14x_21 \end{equation} 3x1​4x2​1​​ 在二维平面上,各个范…

集成学习 #数据挖掘 #Python

集成学习是一种机器学习方法,它通过结合多个模型的预测结果来提高整体性能和稳定性。这种方法的主要思想是“集合智慧”,通过将多个模型(比如决策树、随机森林、梯度提升机等)的预测集成起来,可以减少单个模型的过拟合…

C# WPF入门学习主线篇(三十一)—— MVVM模式简介

C# WPF入门学习主线篇(三十一)—— MVVM模式简介 MVVM(Model-View-ViewModel)模式是WPF开发中的一种重要架构模式。它通过将用户界面(View)与业务逻辑和数据(Model)分离,…

【文献阅读】一种多波束阵列重构导航抗干扰算法

引言 针对导航信号在近地表的信号十分微弱、抗干扰能力差的问题,文章提出了自适应波束形成技术。 自适应波束形成技术可以分为调零抗干扰算法和多波束抗干扰算法。 调零抗干扰算法主要应用功率倒置技术,充分利用导航信号功率低于环境噪声功率的特点&…

三个pdf工具和浏览软件(pdftk,muppdf,epdfview)

安装pdftk pdftk是一款功能强大的PDF处理工具,主要用于对PDF文件进行各种操作。它提供了丰富的功能,包括但不限于合并、拆分、旋转、加密、解密、添加水印、从PDF文档中解出附件等。pdftk分为图形界面版本和命令行版本,适用于不同的用户需求…

使用ant-design/cssinjs向plasmo浏览器插件的内容脚本content中注入antd的ui组件样式

之前写过一篇文章用来向content内容脚本注入antd的ui:https://xiaoshen.blog.csdn.net/article/details/136418199,但是方法就是比较繁琐,需要将antd的样式拷贝出来,然后贴到一个单独的css样式文件中,然后引入到内容脚…

活动会议发布平台,让你我的距离再近点

随着科技、经济的不断发展,生活水平的不断提高,人们不仅在工作中追求快捷高效的工作工具,生活中对参加各项活动的热情也不断提升。活动会议发布平台以其便捷、高效的使用方式被越来越多人采用。 一. 活动会议发布平台的用户画像 …

博物馆藏品管理的重要性

博物馆是人们了解历史文化、传承文明的重要场所。而博物馆的藏品管理是博物馆的核心工作之一,对于展现博物馆的魅力、吸引观众的眼球有着至关重要的影响。并且博物馆藏品管理是一项复杂且专业的工作,它涉及到多个方面,包括但不限于藏品的收集…

租房项目之并发缺失数据问题

前奏:本项目是一个基于django的租房信息获取项目。本次博客牵扯到两个版本,集中式分布以及分布式部署(两个版本的ui不同,集中式用的是老版ui,分布式使用的是新版ui); 项目链接:http…

Linux2-系统自有服务防火墙与计划任务

一、什么是防火墙 防火墙主要用于防范网络攻击,防火墙一般分为软件防火墙、硬件防火墙 1、Windows中的防护墙设置 2、防火墙的作用 3、Linux中的防火墙分类 Centos6、Centos6>防火墙>iptables防火墙 防火墙系统管理工具 Centos7>防火墙>firewalld防火…

基于STM32的简易智能家居设计(嘉立创支持)

一、项目功能概述 1、OLED显示温湿度、空气质量,并可以设置报警阈值 2、设置4个继电器开关,分别控制灯、空调、开关、风扇 3、设计一个离线语音识别系统,可以语音控制打开指定开关、并且可以显示识别命令词到OLED屏上 4、OLED实时显示&#…

Github 2024-06-14 开源项目日报Top10

根据Github Trendings的统计,今日(2024-06-14统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量JavaScript项目2Python项目2非开发语言项目2TypeScript项目1Dart项目1Rust项目1Lua项目1Java项目1Jupyter Notebook项目1从零开始构建你喜爱的技…

大模型Prompt-Tuning技术入门

Prompt-Tuning方法 1 NLP任务四种范式 目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式: 第一范式:基于「传统机器学习模型」的范式,如TF-IDF特征朴素贝叶斯等机器算法;第二范式:基于「深度学习模…

解决CentOS的yum命令失效的问题

近日笔者对一台装有 CentOS 7.9 系统的服务器反复折腾,玩到最后发现 yum 命令用不了,总是报下面的错误信息: There was a problem importing one of the Python modules required to run yum. The error leading to this problem was:/usr/l…