做CV和做NLP,是否都有光明的未来?

本文授权转载自公众号“算法圈的小破事”,点击以上卡片进行关注

大家好,我是在互联网危险边缘疯狂试探的皮皮虾。

最近有点忙,拖更了,不知道有没有读者惦记皮皮虾推文呢(目测没有TT)。

首先祭出新华字典的老图镇文:

edf34f1c76809a2463ce3756e40cb0eb.png

事情是这样的,最近有个大四的读者加了皮皮虾微信,说自己在困惑读研方向选择的问题:“导师是做CV的,但自己看了知乎的一些回答后又想做NLP了。”问皮皮虾有没有必要尝试换方向换导师。

皮皮虾知乎刷的不太多,但也听说了知乎劝入搜推广,硕士选择NLP就是半只脚踏进了搜推广,云云。皮皮虾觉得这其实是比较片面的观点。所以今天就来谈一谈,做CV和做NLP,是否都有光明的未来?

140aeef7d5ba5973655195a6029d222c.png

从学术研究的角度来说,其实两者都没有问题。

但近两年在工业界搞科研是越来越不受待见了,学术大牛出走AI lab已经不是什么大新闻了。如果对CV或NLP技术抱有很大的技术热忱,一心只想搞研究,皮皮虾还是比较建议读博后去混学术界。

不过对大部分人来说,硕士期间选择CV或NLP只是暂时的,毕业后大都要进互联网做业务的。这就引申出来一个问题:我们在互联网行业都有光明的未来吗?如果放在多年前,我觉得这个问题还真不一定。当时CV的对口互联网场景特别少,甚至流传CV人去互联网就是去做美图秀秀的夸张说法。

而NLP技术与互联网的搜索、推荐业务关联比较大,容易进入互联网的核心赛道。近些年来,无论是CV还是NLP技术,对口的业务赛道都比几年前丰富了很多。互联网的生意模式整体上可以分为:

  1. 面向终端消费者(To Customer,ToC)

  2. 面向企业客户(To Business,ToB)

  3. 面向政府客户(To Government,ToG)

我们所熟知的电商、搜索、信息流、短视频、游戏、社交等,就是典型的ToC业务。而云计算、AI类的业务,则同时涵盖了ToB和ToG。

先来说说ToC。不少人吹NLP就是因为NLP技术能轻松切入到主流的ToC业务赛道。比如NLP中的文本匹配、标题理解、内容理解技术,在电商搜索、电商推荐、商品理解、搜索相关性、网页/信息流内容理解等场景十分适用,甚至常常作为支撑技术。

而对CV来说,早些年对口的互联网生意主要聚焦在ToB和ToG上。ToC则主要应用在图像处理软件如美图秀秀,相机类应用中。在搜索、推荐、广告场景,CV技术也有应用,例如图像搜索、广告图片OCR等,但对于业务全局来说,往往特征的权重比较低,影响范围比较有限。

6af36cf0c85660b0b3b6916a3b2989bf.png

而皮皮虾开头说过,CV技术ToC的事情放在2022年,就不一样了。

近年来,随着新能源产业的强势崛起,自动驾驶成为热门赛道,大量资本、巨头涌入。而从计算机视觉技术进入这个新兴赛道无疑是水到渠成的。

若这块业务和技术能持续稳定发展,若干年后切实落地,那一个新的万亿规模的赛道便诞生了。

即便不用等到自动驾驶全面落地开花,哪怕是当下,就在搜推广传统业务内卷的叫苦不迭的时候,自动驾驶赛道的算法人才不仅薪资水涨船高,而且稀缺,距离饱和、内卷还有一段距离。

从个体的角度出发,这也是CV人择业的一个时代优势。当然,既然是新业务,自然也有出意外的可能。那便是技术始终无法满足体验的预期,也始终没有找到一个折中的退路,凉了。这便谁也说不准了。不过目前来看,无论国家政策、资本信心还是技术的更新换代,都还在持续向着好的方向发展,实现真·自动驾驶也是全人类的一个美好愿景,我们还是选择相信明天吧。

除了自动驾驶外,像最近比较火的视频搜索、元宇宙/VR应用、体感游戏等新场景,CV技术也将发挥出重要价值,甚至成为其中的核心技术。

2fb7ec2f1356100df5fbd0c3bfbcec87.png

再来说说ToB和ToG。

在这方面,CV不仅商业化空间比NLP要大,而且更重要的是容易做到标品化。例如安防领域,火车站、机场的闸机人脸识别,物流、快递面单OCR识别等,都属于量大、传统行业难以投入研发且AI技术企业相对容易做标品化。

标品化就意味着一套解决方案可以在多家重复应用,边际成本可以控制的很低,这是ToB和ToG能够赚大钱的前提。

而NLP在ToB和ToG方面推进阻力比较大,最大的问题就是同样一个NLP任务,在不同的业务方手里往往有不同的产品定义。

例如同样是智能客服,在银行业的客服跟在航空公司的客服,显然业务逻辑有着相当大的差别,从运营的产品概念实体到对话逻辑,都需要做差异化的定制。

即,基本不可能打造出一套通用的对话系统,哪怕同面向银行客户,建设银行跟农业银行的产品逻辑都无法平行复制。

无法标品化,就意味着只能让算法RD一个订单一个订单的啃,边际成本始终降不下来,赚不到大钱。

归根结底,CV、Speech是感知层面的任务,有一套大自然定义的客观标准,而NLP是认知层面的任务,由人去创造的标准,自然就会千变万化难以客观统一。

联想到近些年NLP领域“小样本”的研究越来越火,皮皮虾盲猜也跟企业AI ToB对标品化、边际成本控制的疯狂渴望有关。

最后总结一下。

无论CV还是NLP,2022年的业务出口都相对几年前宽敞了很多。NLP的ToC出口大,赛道核心,比较稳定,但ToB/ToG的空间目前还比较有限;CV的ToC出口小,赛道新,风险与机遇同在,但ToB/ToG的天花板更高。

一句话:我们都有光明的未来。

最后留个尾巴,皮皮虾近期想写一篇“ToC和ToB业务对个体职业生涯的影响”,感兴趣的读者请把1打在评论区~

本文授权转载自公众号“算法圈的小破事”,点击以上卡片进行关注~

eaada73f04e55289fb71ca9c333c36af.png后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

9a449dcedb9f10b144e0d08eacc7daa8.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477576.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | 知识表示、多模态融合、搜索匹配三大方向探索——360人工智能研究院知识图谱算法团队...

转载公众号 | 老刘说NLP当前以促进技术发展、提升模型指标,探究模型天花板的竞赛越来越多,也逐步成为各大研究机构、互联网大厂竞相角逐的主战场。自2022年以来,在组员的共同努力下,团队(360人工智能研究院知识图谱算法团队)&…

Spring Cloud Zuul重试机制探秘

简介 本文章对应spring cloud的版本为(Dalston.SR4),具体内容如下: 开启Zuul功能通过源码了解Zuul的一次转发怎么开启zuul的重试机制Edgware.RC1版本的优化 开启Zuul的功能 首先如何使用spring cloud zuul完成路由转发的功能,这个问题很简…

论文浅尝 | PASSLEAF: 一个用于不确定知识图谱嵌入的基于样本池的半监督学习框架...

笔记整理:杨露露,天津大学硕士链接:https://ojs.aaai.org/index.php/AAAI/article/view/16522/16329动机在不确定知识图谱的嵌入中,实体之间的每个关系都有一个置信度。鉴于现有的嵌入方法可能会丢弃不确定性信息,或只…

LeetCode 60. 第k个排列(回溯 康托展开)

文章目录1. 题目2. 解题2.1 回溯2.2 数学-康托展开1. 题目 给出集合 [1,2,3,…,n],其所有元素共有 n! 种排列。 按大小顺序列出所有排列情况,并一一标记,当 n 3 时, 所有排列如下: “123” “132” “213” “231” “312” “…

我在谷歌实习时发现了一个模型 bug,于是有了这篇 ACL

文 | AlbertYang编 | 小轶表格的自动理解与检索已经成为 NLP 以及多模态任务中重要的一环。如果我们给模型一个冬奥会的奖牌榜并且问,“哪个国家的金牌最多?”,现有的模型已经可以毫不费力地输出正确的答案(通常都是表格首行的国家…

Spring Cloud Zuul的fallback优化

如何在Zuul中使用fallback功能 我们在项目中使用Spring cloud zuul的时候,有一种这样的需求,就是当我们的zuul进行路由分发时,如果后端服务没有启动,或者调用超时,这时候我们希望Zuul提供一种降级功能,而不…

技术动态 | 「新一代知识图谱关键技术」最新2022进展综述

转载公众号 | 专知链接:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20210829近年来,国内外在新一代知识图谱的关键技术和理论方面取得了一定进展,以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手…

LeetCode 397. 整数替换(递归 贪心)

文章目录1. 题目2. 解题2.1 递归2.2 记忆化递归2.3 贪心1. 题目 给定一个正整数 n,你可以做如下操作: 如果 n 是偶数,则用 n / 2替换 n。如果 n 是奇数,则可以用 n 1或n - 1替换 n。 n 变为 1 所需的最小替换次数是多少&#…

搭配对比学习,万能的 prompt 还能做可控文本生成

文 | ZenMoore编 | 小轶可控文本生成,旨在让语言模型的输出带有我们想要的某种属性。比如情感、主题、三元组等。一般我们习惯采用 CTRL[1] 或者 PPLM[2] 等方式。但是,CTRL 是对整个语言模型进行 Finetuning, PPLM 因为需要在生成的过程中迭代更新 hidd…

Eureka Client注册到Eureka Server的秘密

前言 我们知道Eureka分为两部分,Eureka Server和Eureka Client。Eureka Server充当注册中心的角色,Eureka Client相对于Eureka Server来说是客户端,需要将自身信息注册到注册中心。本文主要介绍的就是在Eureka Client注册到Eureka Server时R…

论文浅尝-综述 | 基于强化学习的知识图谱综述

转载公众号 | 人工智能前沿讲习论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264摘要:知识图谱是一种用图结构建模事物及事物间联系的数据表示形式,是实现认知智能的重要基础,得到了学术界和工业界的广泛关注.…

AI当下要破局,不能没有知识图谱!

AI或AI赋能已是传统行业智能化升级和转型的基本模式。近年来越来越多的传统行业的核心战略转移到人工智能领域,但随着大数据红利的消失殆尽,以深度学习为代表的感知智能水平日益接近其“天花板”(来自肖仰华老师分享)。数据驱动的…

LeetCode 495. 提莫攻击

1. 题目 在《英雄联盟》的世界中,有一个叫 “提莫” 的英雄,他的攻击可以让敌方英雄艾希(编者注:寒冰射手)进入中毒状态。现在,给出提莫对艾希的攻击时间序列和提莫攻击的中毒持续时间,你需要输…

Spring Cloud Config的配置中心获取不到最新配置信息的问题

本篇源于Spring Cloud Config的一个问题,但这个问题并非所有人都会遇到。如果您遇到了,那必须得看看这篇,如果没有遇到您也应该看看,防患于未然! 问题描述 之前有朋友提出Spring Cloud Config的配置中心在运行一段时间…

图谱实战 | 京东基于时序知识图谱的问答系统

转载公众号 | DataFunSummit分享嘉宾:商超博士 京东硅谷研究院 研究员编辑整理:张存旺 北航杭州创新研究院出品平台:DataFunTalk导读:本文将分享Temporal Knowledge Graphs方向的一个最新尝试,如何在时序知识图谱上去做…

请不要吸开源的血

文 | 琴梨梨源 | 知乎今天无聊刷GitHub看到一个让我血压上来的项目乍一看,2.4k star,应该不像是什么小项目应该是比较有用的项目,但接下来的事情属实是让我气的很对于开源项目我是不喜欢下载预构建的成品的,我更喜欢自己动手从源代…

LeetCode 357. 计算各个位数不同的数字个数(DP)

1. 题目 给定一个非负整数 n&#xff0c;计算各位数字都不同的数字 x 的个数&#xff0c;其中 0 ≤ x < 10n。 示例: 输入: 2 输出: 91 解释: 答案应为除去 11,22,33,44,55,66,77,88,99 外&#xff0c;在 [0,100) 区间内的所有数字。来源&#xff1a;力扣&#xff08;Lee…

SpringCloud实战小贴士:Zuul的路径匹配

路径匹配 不论是使用传统路由的配置方式还是服务路由的配置方式&#xff0c;我们都需要为每个路由规则定义匹配表达式&#xff0c;也就是上面所说的path参数。在Zuul中&#xff0c;路由匹配的路径表达式采用了Ant风格定义。 Ant风格的路径表达式使用起来非常简单&#xff0c;…

技术动态 | 一文读懂事件知识图谱

转载公众号 | 普适极客文章来源 | 中国科学院网络数据重点实验室【导读】随着事件这类动态知识得到越来越多的关注&#xff0c;学术界涌现出许多事件知识图谱相关的概念。但究竟事件知识图谱是怎么发展而来的&#xff1f;什么是事件知识图谱&#xff1f;它和其他相关概念之间有…

华为开源CTR Benchmark,学术界SOTAs的照妖镜?

文 | 卖萌酱大家好&#xff0c;我是卖萌酱。众所周知&#xff0c;与CV、NLP不同&#xff0c;搜索、广告、推荐领域的学术界paper在很多问题上喜欢各玩各的&#xff0c;缺乏一个统一可比的benchmark。就推荐/广告中核心的CTR预估问题来讲&#xff0c;从传统的LR、FM到Wide&D…