打破 Google 破坏性的搜索垄断

作者:Ryan Cooper

译者:Sambodhi

策划:刘燕

近来,Google 在搜索算法方面的垄断地位,频繁引起美国和欧洲的反垄断关注。

Google 在网络搜索方面有绝对的优势。近来,Google 在搜索算法方面的垄断地位,也就是搜索引擎将 Google 自己的内容放在搜索结果的首位,自然引起了美国和欧洲的反垄断关注。

但是,Google 搜索业务的垄断并非唯一。由于拥有目前为止最大最好的在线索引,Google 的地位受到了保护。

Daisuke Wakabayashi 在《纽约时报》(The New York Times)上写道,软件工程师 Zack Maril 成立了一个名为 “Knucklehead Club”(傻瓜俱乐部)的组织(因为只有傻瓜才会挑战如此有钱有势的公司)来研究并唤起人们对这一事实的关注。

基于结构上的原因,我将在下面解释,为了建立这样一个索引而 “抓取”网络的行为是自然的垄断行为,而且由于 Google 的低调行为,没有人会对其主导地位提出真正的挑战。“一般来说,人们不会谈论这个问题,因为人们对它知之甚少。” Maril 在接受采访时告诉《周刊报道》(The Week)。世界各国政府都应该从公共利益的角度出发,对这家公司进行监管,或者干脆接管。

首先,让我解释一下机制。在经济学术语中,自然垄断指的是高固定成本和低边际成本的市场。电力就是一个典型的例子,它需要巨大的初始投资来建造发电厂,并将电线拉到每家每户,此后,每增加 1 度电的成本几乎为零。一家公司一旦建立了这样的网络,刚刚起步的新公司就几乎不可能与之竞争了。

Google 的网络爬虫也基本上处于相似的位置。原因如下:要运行搜索引擎,你需要对互联网建立一个索引,这样就可以搜索到东西了(就像图书馆里的卡片目录一样)。这样的话,就必须定期抓取互联网,尽可能多地复制网页,这样索引就能尽可能地广泛和最新。

这就给竞争设置了两个障碍。第一点,也是最明显的,互联网是巨大的,因此要建立一个能看到其中哪怕一小部分的爬虫,都需要巨大的投资。很长时间以来,Google 一直遥遥领先,以至于另一个科技巨头微软才开始参与竞争。

第二点,更为微妙的是,网站所有者有限制所有非 Google 爬虫的动机。创建一种互联网规模的爬虫可能很昂贵,但是创建一种只会抓取少量网站的爬虫是很便宜的,人们之所以这样做是有很多原因的。网站带宽是要花钱的,而爬虫的自动操作会消耗大量的带宽。

因此,很多管理员禁止所有类似爬虫的活动,但 Google 却获得了豁免,因为 Google 的搜索结果显示对流量有很大影响。(Knucklehead Club 的研究还表明,Google 从许多网站 获得的利益甚至比这更多)。

以上两点意味着,任何新公司都不可能对 Google 网络索引的统治地位构成严重威胁。大多数网站都会禁止任何新的主要爬虫,因为它占用了网站的流量,并且带来的回报很小,但是新的搜索引擎也不能增加流量,正因为它不能开发合适的索引来吸引用户。

甚至微软,在它的搜索引擎必应花了几年时间,耗费了几十亿美元,但还是远远落后于他们。正因为它不能开发合适的索引来吸引用户。甚至微软,在它的搜索引擎 Bing(必应)花了几年时间,花了几十亿美元,但还是远远落后于他们。

对于外行人来说,这也许没什么大不了的。毕竟,Google 很不错,所以我们大概不需要创建更多的网络索引,或者迫使 Google 让其他人使用它的索引,对吗?甚至在搜索方面,人们对此也不太清楚。

举例来说,Google 在某些领域变得极端糟糕,如产品评论,其 搜索结果常常被大量腐败的、算法博弈的垃圾内容或其自身的广告弄得乱七八糟。假如其它公司也能参与竞争,我们就可以看到它们在一些特定的任务,甚至仅仅是在普通搜索方面打败 Google 的搜索引擎。

但更深层次的问题是,控制唯一优秀的互联网索引有很大的优势。Maril 告诉《周刊报道》,这个庞大的数据宝库让 Google “在机器学习和人工智能方面难以置信的优势”。举例来说,机器翻译,“只有当你达到数据的临界点时,它才会起作用”。

同样的道理,从其他网站的角度来考虑,确保能够被 Google 抓取,看起来不像是某种恩惠,而更像是必须缴纳的 “Google 税”,他说。任何拥有网站的人,只需花点时间和金钱,就可以让 Google 索引他们的网页,以免他们无法被网民发现。这些数据将给公司带来越来越难以逾越的竞争优势。

正如我 之前所论述 的那样,Google 之所以如此强大,如此有利可图,很大程度上是因为先发优势和网络效应。它在正确的时间,出现在正确的地方,用一个比其他人更好的搜索引擎,这种优势滚雪球般地成为了对唯一存在的,或者说能够存在的(至少在目前的现状下)良好的网络索引的私有控制。

只有 Google 才有权使用这些数据,这是不公平的,但是也不清楚有多少商业和研究想法会因为没人能得到他们的数据而被扼杀在萌芽状态。垄断企业容易变得肥胖和懒惰。

那么该怎么办呢?传统的处理自然垄断的方法不是国有化就是管制。但是,这些方法 可能并不适合,因为与过去所有的自然垄断不同,互联网覆盖了全球。

举例来说,如果 Google 的网络索引由联邦政府拥有,他们可能会试图将其用作某种疯狂的帝国主义活动的一部分。比如,美国和欧盟同意一项国际条约,该条约要求 Google 支付象征性费用许可其索引内容,或许更为明智。另一种方法是,各国只需建立自己的公共互联网索引,供所有人免费使用。

但是,在有人提出解决方案之前,我们必须仔细研究一下这个问题。幸好,众议院一直在关注这一问题,甚至特朗普的司法部也提出诉讼,指控 Google 违反反垄断法。那只是国家努力的开始,需要建立一个人人平等的互联网。

 作者介绍:

Ryan Cooper,《周刊报道》(The Week)的全国记者。他在《华盛顿月刊》(Washington Monthly)、《新共和》(The New Republic)和《华盛顿邮报》(Washington Post)发表文章。

原文链接:

https://theweek.com/articles/955074/bust-googles-destructive-search-monopoly

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485274.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【剑指offer】面试题49:丑数

我们把只包含因子 2、3 和 5 的数称作丑数(Ugly Number)。求按从小到大的顺序的第 n 个丑数。 示例: 输入: n 10 输出: 12 解释: 1, 2, 3, 4, 5, 6, 8, 9, 10, 12 是前 10 个丑数。 说明: 1 是丑数。 n 不超过1690。 代码: class Solu…

修改maven打包名字

仅需在pom.xml添加下列配置 build><finalName>userapi</finalName></build>转载于:https://www.cnblogs.com/zhao-shan/p/9520010.html

计算机网络——时延、时延带宽积、往返时间、利用率

计算机网络——时延、时延带宽积、往返时间、利用率 推荐课程&#xff1a;https://www.bilibili.com/video/BV19E411D78Q/?p4 1.时延 时延&#xff08;delay或latency&#xff09;是指数据&#xff08;报文、分组、比特&#xff09;从网络&#xff08;或链路&#xff09;的…

一文读懂虚拟现实产业最新发展趋势

来源&#xff1a; 中国电子报作者&#xff1a;赛迪智库虚拟现实产业形势分析课题组2020年以来&#xff0c;5G商用化进程的加速和新冠肺炎疫情背景下“非接触式”经济的新需求为虚拟现实产业发展带来了新的机遇。虚拟现实、增强现实技术在支撑服务疫情防控、加快企业复工复产、强…

【剑指offer】面试题50:第一个只出现一次的字符(java)

在字符串 s 中找出第一个只出现一次的字符。如果没有&#xff0c;返回一个单空格。 示例: s "abaccdeff" 返回 "b" s "" 返回 " " 限制&#xff1a; 0 < s 的长度 < 50000 代码&#xff1a; class Solution { publi…

log4net日志文件的应用

日志作为快速定位程序问题的主要手段&#xff0c;日志几乎是所有程序都必须拥有的一部分&#xff0c;下面我们就看下怎么使用log4net.dll文件&#xff1a; 1.下载log4net.dll文件 2.创建自己的项目 3.在自己项目下的引用log4net.dll文件 4.在app.config配置文件里添加配置信息&…

CSMA/CD协议分析笔记

CSMA/CD协议分析笔记 CSMA/CD(carrier sense multiple access with collision detection) 文章目录CSMA/CD协议分析笔记前言一、解读CS MA / CDCS——“载波监听”MA——“多点接入”CD——“碰撞(冲突)检测”二、传播时延对载波监听的影响为什么先听后发还是会产生冲突&#…

【剑指offer】面试题52:两个链表的第一个公共节点(java)

输入两个链表&#xff0c;找出它们的第一个公共节点。 如下面的两个链表&#xff1a; 在节点 c1 开始相交。 示例 1&#xff1a; 输入&#xff1a;intersectVal 8, listA [4,1,8,4,5], listB [5,0,1,8,4,5], skipA 2, skipB 3 输出&#xff1a;Reference of the node wit…

城市大脑全球标准研究1:城市大脑产生的时代背景是什么?

来源&#xff1a;城市大脑全球标准研究组20世纪10年代以来&#xff0c;IT科技领域出现了很多“大脑”“神经系统”概念&#xff0c;如互联网大脑、谷歌大脑、百度大脑、360安全大脑、华为城市神经系统等等&#xff0c;城市大脑是其中一个。这是一个有趣的现象&#xff0c;为什么…

【剑指offer】面试题53 - 1:在排序数组中查找数字 I(java)

统计一个数字在排序数组中出现的次数。 示例 1: 输入: nums [5,7,7,8,8,10], target 8 输出: 2 示例 2: 输入: nums [5,7,7,8,8,10], target 6 输出: 0 限制&#xff1a; 0 < 数组长度 < 50000 代码&#xff1a; class Solution { public int search(int[] nu…

JavaWeb中实现页面跳转的方法

JavaWeb中实现页面跳转的方法 在src中新建Servlet文件&#xff0c;重写doPost()、doGet()方法&#xff0c;可以使用请求转发、重定向或者使用out内置对象编写HTML代码&#xff0c;从而实现页面跳转 ———————————————————————— 一、利用Servlet—————…

Catalan数总结

参考维基百科 Catalan数详解 这里只是把常见的公式搬过来 设Catalan数的第n项为 hnhn&#xff0c;定义 h0h11h0h11 则有如下两个常用递推式 hnh0hn−1h1hn−2...hn−1h0,n>2hnh0hn−1h1hn−2...hn−1h0,n>2hn4n−2n1hn−1,n>1hn4n−2n1hn−1,n>1通项公式为 hnCn2n…

李书福:对未来世界及汽车发展的六个洞见(附万字内部讲话全文)

来源&#xff1a;东西智库2月20日&#xff0c;一直被外界誉为缔造汽车行业传奇的吉利控股集团董事长李书福以“守正出奇 实事求是”为主题在集团内部进行了分享交流&#xff0c;在这场万字内部分享中&#xff0c;李书福从国内国际双循环之机遇和挑战&#xff0c;企业治理能力、…

JSP的“三指六动九内”

JavaWeb——JSP的“三指六动九内” JSP的基本使用 1. JSP模板元素 网页的静态内容。如html标签 JSP脚本 2. JSP的脚本 2.1、小脚本<% Java代码%> 2.2、表达式<% 11%>&#xff0c;等价于out.print(11) 2.3、声明<%! 声明变量和方法%> 3. JSP注释 JSP注释…

【剑指offer】面试题53 - II:0~n-1中缺失的数字(java)

一个长度为n-1的递增排序数组中的所有数字都是唯一的&#xff0c;并且每个数字都在范围0&#xff5e;n-1之内。在范围0&#xff5e;n-1内的n个数字中有且只有一个数字不在该数组中&#xff0c;请找出这个数字。 示例 1: 输入: [0,1,3] 输出: 2 示例 2: 输入: [0,1,2,3,4,5,6,…

Dcloud+mui 压缩上传图片到服务器

chooseImgFromAlbums选择图片chooseImgFromPictures 拍照changeToLocalUrl 转换成可用的路径uploadpic.compressImg 压缩图片uploadpic.avatar 上传图片到oss服务器/*** 上传图片*/function UPLOADPIC() {//上传图片this.avatar function(compressurl) {bzpcommon.showLoading…

基于IPP-FFT的线性调频Z(Chirp-Z,CZT)的C++类库封装并导出为dll(固定接口支持更新)

上一篇分析了三种不同导出C++类方法的优缺点,同时也讲了如何基于IPP库将FFT函数封装为C++类库,并导出为支持更新的dll库供他人调用。 在此基础上,结合前面的CZT的原理及代码实现,可以很容易将CZT变换也封装为C++类库并导出为dll,关于CZT的原理和实现,如有问题请参考: …

梦境交互:做个现代灵媒,考虑一下?

来源&#xff1a;脑极体睡眠几乎占据人生的三分之一时间&#xff0c;做梦又是睡眠中必不可少的生理活动。很多人常常把“无梦之眠”看作是一个人精神状态好的标志&#xff0c;但事实上做梦常常发生&#xff0c;只是很多人在醒来后完全忘记自己做过梦而已。研究表明&#xff0c;…

使用浏览器获取网页模板(HTML+CSS)

使用浏览器获取网页模板(HTMLCSS) 一、获取网页的源代码 进入网页&#xff0c;使用快捷键CtrlU查看网页源代码&#xff0c;也可以单击鼠标右键选择查看网页源代码获取。 网页源代码&#xff1a; 将网页源代码CtrlA全选&#xff0c;CtrlC复制 在网页编辑器中新建一个HTML文…

【剑指offer】面试题54:二叉搜索树的第k大节点(java)

给定一棵二叉搜索树&#xff0c;请找出其中第k大的节点。 示例 1: 输入: root [3,1,4,null,2], k 1 3 / \ 1 4 \ 2 输出: 4 示例 2: 输入: root [5,3,6,2,4,null,null,1], k 3 5 / \ 3 6 / \ 2 4 / 1 输出: 4 限制&…