没有“好的”数据,AI就没有未来?听听云测数据怎么说

AI的崛起离不开“好的”数据作为地基,这也是云测数据成立的初衷所在。

算力、模型和数据构成了人工智能的三要素,过去,我们过多的把目光聚焦于算力和模型上,殊不知,随着人工智能的深入,好的算法和模型已不再是稀有物种,反而那些被标注好的优质数据成为时下最为稀缺的“黑金”。

“公司的壁垒不再是算法,而是数据。让算法利用足够的数据,使得产品运行起来。”人工智能和机器学习领域国际的权威学者吴恩达在发表以“AI is the new electricity”为主题的演讲时,就重点强调了数据的重要性。无独有偶,李开复在清华大学“清华学堂计算机科学实验班”题为《人工智能的黄金时代》的演讲中也讲到了此类观点,“如果你有垄断性的大数据,你就会有很大的优势。”

以上种种,都表明着一件事,即AI的崛起离不开“好的”数据作为地基,这也是云测数据成立的初衷所在。

溯源云测数据的AI数据服务之路

“自2011年切入企服市场以来,Testin云测不断致力于助力产业智能化,除了测试业务我们已经成为专业领域的垄断品牌,专注于AI数据服务的云测数据也成为数据领域的标杆品牌。目前我们整个数据服务团队规模已超过1000人,通过标审分离的流程化作业模式和数据安全机制,更好的保证数据的高质量产出和数据隐私性,从而更好地为人工智能落地提供定制化‘数据养料’。”在接受钛媒体专访时,云测数据总经理贾宇航如是说。

AI数据服务作为一个非标领域,往往需要根据不同行业领域、不同的需求进行特定化的场景定制,而数据标注的过程,规范化、标准化以及可机读性又不可或缺,这就意味着云测数据所从事的领域,并没有捷径可以走。

早期的数据标注服务门槛并不高,几个人、几台电脑便可展开操作,导致了行业鱼龙混杂、同质化竞争等现象,而这时的人工智能也处在初期发展阶段。但当人工智能驶入深水区,“应用人智能”声势逐渐火热,相对应的算法对数据的精准程度和质量要求也水涨船高,就要求着作为AI数据服务的提供者,要为人工智能提供定制化的、还原应用场景的优质数据。

针对于此,贾宇航告诉钛媒体,“以人脸关键点识别为例,早先的相关数据标注往往用一句话便可描述完它的任务需求,到了现在,已经发展到几百个关键点。通常数量级的人脸数据标注任务,有时候4张A4纸都未必能写完这些需求,而人脸的数据标注只是众多领域的任务需求之一。”

庞大数据标注任务量级之下,是当下业内需求端对精准和高质数据的普遍共识。

这就要求着数据服务要在数据标注和采集上下足功夫,而小团队的能力范围则显得捉襟见肘。回归到数据标注面向多领域这件事的本质时,你又会发现,光靠人多或者说采用“众包”模式往往只能解决量的需求,数据标注人员是否能统一化协同管理以及是否具备相关领域知识,才是决定某项数据任务完成质量的好坏。

同时,这也是云测数据当下正专注的事情。正如医生可以标注得好ct诊疗片,而云测数据团队在进行自动驾驶车外环境数据标注时发现,那些能够快速、精准进行数据标注的人员往往拥有驾驶经验。

云测数据快速成长的秘诀是什么?

至此,我们还需要思考一个问题,为什么云测数据能做到且做好AI数据服务?

通过观察Testin云测的发展历史,我们便能找到答案。

自2011年Testin云测成立到现在,已经为全球超过百万的企业及开发者提供服务,积累了丰富且完善的技术能力和流程化管理能力。而云测数据AI数据服务正式开展于2017年,换句换说,Testin云测的数据业务线从一出生便拥有7年企业服务所积攒的经验,并继承了行业独立第三方的角色,天然的“以客户为中心”的企服基因是云测数据区别于同行的最大护城河,而客户最为关键的诉求则是“降本增效”。

“与企业服务在美国环境更侧重标准不同的是,中国更重服务,通过这么多年的观察我们发现,是否能切实满足用户的真实需求,其实是一个非常重要的点,并不是说企业一定要做出一个平台或者一个工具,更多是从企业或行业需求出发,构建对应的服务模式。”贾宇航对钛媒体补充到。

以新零售门店巡检为例,通常来说,每个门店每月都要巡检一次,门店巡检模式是让一个人拿着调研表去盘点,随着人工成本的增加,而门店数越来越多现实情况,已经让这成为一笔不小的开销。通过引入AI数据服务,现在工作人员可以拿一个手机APP直接巡检,物品的数量、sku的数量以及对应的sq数量,都能一目了然。

 “从不同客户反馈得知,通过我们云测数据的数据标注服务而落地AI产品的企业,可为企业减少大概1/3的人工成本。”贾宇航如是说。

门店巡检只是案例之一,就目前来说,云测数据主要关注智能驾驶、智慧城市、智慧金融和智能家居几大方向,这也是当下市场需求最大的几个领域。面对不同的数据领域,云测数据通过流水化作业,将各个环节打造成不同模块,并配合自己的流程管理工具,优化人员管理、数据采集、数据清洗和数据标注的各个环节流程,确保内部的持续高效能运转,最终保证AI数据高质产出。

根据IDC调查显示,目前中国大数据发展处于应用落地阶段,整个市场预计未来五年将保持持续增长的趋势,年复合增长率将达到17.3%。而得益于人工智能、5G、区块链、边缘计算的发展,未来多方技术融合,数据增长必然呈现井喷态势,数据采集和标准业务作为其伴生体,必然有较大的增长空间。

得益于对AI趋势的判断,Testin云测认为,“人工智能正在逐渐往应用人工智能”方向发展,因而云测数据在成立之初,就确定了定制化“精准高质、独立安全”业务方针。本着这张“王牌”,云测数据部门迅速扩充,在以往企业服务经验的完美嫁接之下,最终让云测数据成为AI数据服务领域的头部企业。”

“云测数据业务规模量每年都在以倍数的规模增长,这也与我们所处赛道的市场深度息息相关,在我看来,整个市场仍然呈现非线性的几何增长态势,还有很多机会蕴含其中,有待挖掘。”谈及云测数据业务线发展状态时,贾宇航如是说。

“安全”是AI数据服务

提供商绕不开的命题

机会之下,企业端在提供优质数据的同时,也要注意数据服务过程中的规范和安全。

在这方面,云测数据通过自建数据采集实验室和自建数据标注基地的方式,规范管理专职数据服务团队。这种措施除了保证标注数据的质量和效率,也最大限度地保证了数据产出的安全隐私性。

贾宇航对钛媒体强调到,云测数据自伊始便将数据安全放在首位,集中表现在以下几个方面:

第一,不滥用数据,数据交付后清毁数据不留底,绝不二次使用;

第二,不侵犯隐私,与所有数据采集的用户都签订数据授权协议,确保AI企业用于训练的数据合法合规;

第三,建立相关的数据保障机制,如从防火墙的设置、内部信息系统的管护、乃至标准化的流程作业体系等。

Testin云测CMO张鹏飞也强调“从整体看来,AI数据行业关于安全、隐私等方面并没有统一的标准和强调重视。但从我们长远角度出发,一直在隐私和安全防护角度下大力气服务行业、树立数据质量标杆,只有以这种负责的态度来服务客户,我们的行业才能‘良币驱除劣币’,真正让人工智能成为新一轮技术革命,改变整个社会和人类进程”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea中event log_【JavaScript 教程】事件——Event 对象

作者 | 阮一峰概述事件发生以后,会产生一个事件对象,作为参数传给监听函数。浏览器原生提供一个Event对象,所有的事件都是这个对象的实例,或者说继承了Event.prototype对象。Event对象本身就是一个构造函数,可以用来生…

谷歌新智能体Dreamer将亮相NeurIPS 2019,数据效率比前身PlaNet快8个小时

来源:雷锋网在具有挑战性的环境中,一些人工智能系统通过利用过去经验所提供的世界表象来实现目标。研究人员将这些应用推广到新的情况,使它们能够在以前从未遇到过的环境中完成任务。事实证明,强化学习——一种使用奖励来推动软件…

mysql 游标总条数_mysql 游标的使用总结

一、游标的基本概念游标:游标是一个存储在Mysql服务器上的数据库查询,它不是一条select语句,而是被该语句检索出来的结果集。本人,学习游标中,曾遇到一个问题,循环总是最后多执行一次。下面分析程序&#x…

AR行业成本拆解解析

来源:三极光电科技一、AR 产业简介(一)AR 定义AR 技术(AugmentedReality,AR)是借助光电显示技术、交互技术、多种传感技术和计算机图形与多媒体技术将计算机生成的虚拟环境与用户周围的真实环境融为一体&am…

mimo雷达信号处理_雷达学术入门脉冲雷达信号处理概述

Reviewed by :甜草莓 Robert Zhou;前置知识:概率论与统计学。面向人群:本科生、研究生/信号处理博士。 编者:对于信号处理来说,雷达和通信一直是一体两面,从MIMO通信到MIMO雷达,从OF…

人类历史十大经典物理实验,有些实验就在你身边为何你没注意到?

来源:数学职业家实验是科学研究的基本方法之一,也是人类认识自然现象、自然性质、自然规律的途径。现代实验技术的发展,不断地揭示和发现各种新的物理现象,日益加深人们对客观世界规律的正确认识,从而推动物理学的向前…

一、linux搭建jenkins+github详细步骤

事情缘由: 现在在做的主要工作是通过jenkinspostman实现api的自动化测试,想要达到的效果是,api自动化测试定时跑脚本的同时,github有新的代码提交,jenkins会自动检测部署新提交的代码,并且再次将api自动化脚…

matlab插值与拟合例题_MATLAB中数据插值和数据拟合的用法

一、数据插值:插值是在一组已知数据点的范围内添加新数据点的技术。可以使用插值来填充缺失的数据、对现有数据进行平滑处理以及进行预测等。MATLAB 中的插值技术可分为适用于网格上的数据点和散点数据点。从数学上来说,数据插值是一种函数逼近的方法。数…

半导体行业深度报告:从应用到行业的全面复苏

来源:国金证券一、2020-2021年全球半导体市场投资展望多种因素导致全球半导体市场于 2019 年同比下跌近 13%到 4,102 亿美元,而存储器行业同比下跌超过 30%,逻辑半导体同比下跌近 2%。存储器市场占全球半导体市场达到近三年低点的 27%。但受惠…

mysql 8 修改root密码忘记_忘记mysql8或者mariadb5及以上 的root密码如何更改

实验环境操作系统:lsb_release -aNo LSB modules are available.Distributor ID:UbuntuDescription:Ubuntu 20.04.1 LTSRelease:20.04Codename:focalmysql数据库版本:mysql基本信息具体步骤1. 停止mysql (sudo service mysqld stop 或者 kill -TERM mysq…

配置tomcat_Tomcat 配置必备的 10 个小技巧,让你轻松玩转Tomcat

现在开发Java Web应用,建立和部署Web内容是一件很简单的工作。使用Jakarta Tomcat作为Servlet和JSP容器的人已经遍及全世界。Tomcat具有免费、跨平台等诸多特性,并且更新得很快,现在非常的流行。你所需要做的就是:按照你的需求配置…

卫星移动通信现状与未来发展

来源:电子万花筒摘要:卫星移动通信系统具有覆盖范围广,对地面情况不敏感等优势,已经成为地面移动通信领域重要的组成部分,尤其是在空中、海洋、荒漠戈壁等地面无线网络难以覆盖的地方。随着科学技术的不断进步&#xf…

mysql load data infile 重写_mysql load data infile 命令的数据导入

文章介绍了mysql load data infile 命令的数据导入,该方式比直接的insert的效率要高,按照官方的说法是要比insert语句快上20倍,有需要的朋友可参考。使用方式如下:代码如下复制代码mysql>load data local infile "D:/ab.txt" in…

DARPA发布战略框架文件旨在 为美国国家安全创建突破性新技术能力

来源:ARPA网站/图片来自互联网12月4日,DARPA公开了于今年8月份完成的2019年度战略框架文件《面向国家安全创建技术突破和新能力》,阐述了该机构面临的威胁环境,并提出了未来几年的发展计划。1应关注的重点该框架文件指出&#xff…

rust矿洞绳子怎么爬下_rust矿洞绳子怎么爬下_打工小伙爬冰救人,每动一下都能听到冰面碎裂声...

近日,在辽宁沈阳鲁迅公园,一男子掉进湖中冰窟窿,露出脑袋不停地呼救。生死时刻,一位正在附近找零活的小伙,不顾冰面碎裂发出的咔咔声,一步步爬冰救人,最终在岸上众人帮助下,成功救出…

Python爬虫入门四之Urllib库的高级用法

1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性。 首先,打开我们的浏览器,调试浏览器F…

Magic Leap 价值 20 多亿美元的 AR 幻梦,现在醒了

来源:传感器技术那个用特效来吹出 AR 神话的 Magic Leap,终于有了新动静。 当地时间 12 月 10 日,增强现实(AR)领域的“知名”公司 Magic Leap 宣布,将 Magic Leap One Creator Edition 改名为 Magic Leap …

mysql约束_不是吧,阿Sir,MySQL约束你竟然还不懂!

以前写的太乱了,翻出来重新整理下系列目录:MySQL入门,问题不大【增删改查极速上手】(一) 引入约束(1) 约束出现在哪里? 想要讲解约束,就要知道约束用在哪里,用来干嘛?SQL 语言通过定义一个关系所…

dc持久内存与mysql_Calypso Systems推出测试软件和服务器测试傲腾数据中心级持久内存...

Calypso Systems测试Optane DCPMM(DC Persistent Memory Module 数据中心级持久性内存模块)的性能,带宽超过36500MB/s(顺序读写速度128000MB/s),每秒读写速度为3240万IOPS(顺序读取速度5000),平均响应时间达到0.11微秒。Calypso PM(持久性内存…

计算机行业研究及2020年策略:聚焦主赛道,投资真成长(84页)

来源:国元证券1、行业涨幅位居前列,个股表现精彩纷呈……2、IT 产业大变革,新机遇不断涌现近年来,以 5G、物联网、云计算、大数据、人工智能、区块链等技术为代表的信息 科技行业快速发展,新兴技术不断涌现&#xff0c…