【前沿技术】严重事故!实习生删除字节跳动所有轻量级机器学习模型

来源:智能研究院

昨晚脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型!

什么是lite模型?该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。

当晚全公司通报,直接被列入 P0 事故等级(严重事故):

据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:

大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:

所以说一定要稳住别慌,问题不大。

网友热议

有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。

还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。

我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。

而别的对手就权限不一了。

到底删除了多少模型?根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。

又有字节的工程师网友表示删除的都是离线数据,影响不大。该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。

2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。

字节 AI

字节都有什么出名的机器学习产品?

字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。

据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。

据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。

LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:1. 高性能;2. 支持模型功能多;3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。

最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484439.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人行业研究报告:智能化造就新时代,自动化生产成刚需

来源:东莞证券作者:黄秀瑜核心观点智能转型时代,机器人前景可期。智能化时代到来,工业机器人和服务 机器人逐渐普及。疫情后制造业走出低迷,中国工业机器人月产量创新 高。全球老龄化问题日益严重,中国作为…

bzoj 1596 电话网络

Description Farmer John决定为他的所有奶牛都配备手机&#xff0c;以此鼓励她们互相交流。不过&#xff0c;为此FJ必须在奶牛们居住的N(1 < N < 10,000)块草地中选一些建上无线电通讯塔&#xff0c;来保证任意两块草地间都存在手机信号。所有的N块草地按1..N 顺次编号。…

指甲盖大小塞了500亿晶体管!领先台积电,IBM打造世界首款2纳米芯片!能耗仅为7纳米的1/4!...

文章来源&#xff1a;EETOP我们知道在2014年IBM已将其Microelectronics部门出售给GlobalFoundries时&#xff0c;IBM就已经宣告退出芯片代工业务。但这几年来&#xff0c;尽管IBM退出了代工业务&#xff0c;不过好像IBM在半导体先进工艺研发上一直没有放弃&#xff0c;时不时会…

人工智能浪潮褪去,冲刺IPO成AI企业生存关键?

来源&#xff1a; 大作此前&#xff0c;AI四小龙持续亏损、登科受阻&#xff0c;投影出“AI估值泡沫&#xff0c;风口浪潮已褪”的现实。反观AI四小龙同期的独角兽格灵深瞳&#xff0c;6月22日科创板IPO受理&#xff0c;拟募资10亿元用于AI算法平台升级、创新应用研发等项目。前…

【开源】iTest教学辅助系统源代码

iTest教学辅助系统 2020.10.16第一次更新 重置了下载链接 2020.12.21第二次更新 重置了下载链接 2021.05.07第三次更新 重置了下载链接 1.关于iTest教学辅助系统 i实验辅助教学平台是基于局域网开发&#xff0c;力求为教师和学生用户提供实验课堂辅助教学环境的计算机系统&…

KnockoutJS-与服务端交互

几乎所有Web应用程序都要和服务器端交换数据&#xff0c;交换数据时最方便的就是使用JSON格式。Knockout可以实现很复杂的客户端交互&#xff0c;对于前后端交互使用的技术最为基本且常用的是Ajax&#xff0c;本次利用Ajax和ko的双向绑定完成一些简单的功能&#xff0c;可以快速…

神经网络无法区分异同,而且这个缺陷是本质性的

来源&#xff1a;混沌巡洋舰1969年《芝麻街》的第一集中有一个片段叫做“这些东西中的一个与众不同”。观众们被要求考虑一张展示三个2和一个 w 的海报&#xff0c;然后一边跟着游戏的同名广告歌唱&#xff0c;一边决定哪个符号不属于这个标志。《芝麻街》中的很多集重复了这个…

matlab计算级数和

级数(series)是指将数列的项依次用加号连接起来的函数。典型的级数有正项级数、交错级数、幂级数、傅里叶级数等。 —百度百科 matlab提供了直接计算级数的两个方法&#xff0c;symsum的两种形式&#xff08;做题刚开始以为是重载&#xff0c;直接导致了上一篇帖子的产生 &…

北国风光

转载于:https://www.cnblogs.com/ssyfj/p/10214328.html

“期待已久的UFO报告”公布了

来源&#xff1a;环球网 作者&#xff1a;张晓雅多家美媒表示&#xff0c;调查没有得出确切结论。包括美国有线电视新闻网&#xff08;CNN&#xff09;、美联社、美国哥伦比亚广播公司&#xff08;CBS&#xff09;在内多家美媒最新消息&#xff0c;美国政府当地时间25日发布报告…

Bmp格式与编程读取解析

Bmp格式 DigitalImage图像类设计 图像加载函数,通过bmp图片路径&#xff0c;加载图像数据&#xff0c;通过类构造函数来实现。 DigitalImage::DigitalImage(LPCTSTR lpszPath) {StrCpy(m_FilePath, lpszPath);CFile RdBmp;if (!RdBmp.Open(m_FilePath, CFile::modeRead | CFil…

关于奈氏准则和香农公式

对于带宽固定的信道&#xff0c;提高信息传输速率有两种方式&#xff1a; 提高码元在信道中的传输速率&#xff1b;提高信噪比&#xff1b; 我们以高速公路的例子来理解&#xff1a; 码元相当于车辆&#xff0c;信道相当于公路&#xff0c;所有的汽车都在运输相同的货物&…

五角大楼公布UFO报告,不明飞行物到底是什么?(全文)

来源&#xff1a;大数据实验室五角大楼周五发布的一份有关不明飞行物的重要报告称&#xff0c;国防和情报分析人员缺乏足够的数据来确定军事飞行员观察到的神秘飞行物体的性质&#xff0c;包括它们是先进的地球技术、大气层还是外星天体。这份报告提交国会并向公众公布&#xf…

python 词云小demo

词云小demo jiebawordcloud一 什么是词云&#xff1f; 由词汇组成类似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出&#xff0c;形成“关键词云层”或“关键词渲染”&#xff0c;从而过滤掉大量的文本信息&#xff0c;使浏览网页者只要一眼…

python--类与GUI编程框架

类属性 类的数据属性&#xff08;静态成员&#xff09;&#xff1a;仅仅是定义的类变量在类创建后被使用可以由类的方法来更新&#xff0c;也可以在主程序中更新类属性和实例无关&#xff0c;修改类属性需要使用类名 class Dog(object):counter0def __init__(self,name):self.…

信道复用技术之码分复用

2020730第一次修改&#xff1a;提升了图片的清晰度 1. 首先来说说什么是信道复用 信道复用&#xff0c;顾名思义&#xff0c;就是把多个用户使用的信道合并在一条信道&#xff0c;即一条信道承载着多个用户传输数据的任务&#xff1b; ps&#xff1a;信道&#xff1a;数据信息传…

《新一代城市大脑建设与发展》专家研讨会在京举办

2021年6月26日&#xff0c;新一代城市大脑建设与发展专家研讨会在京举办&#xff0c;本次活动由城市大脑全球标准研究组主办&#xff0c;远望智库承办。20多位专家参与本次研讨会&#xff0c;对城市大脑、智慧城市的发展趋势&#xff0c;存在的问题&#xff0c;产生的新成果等方…