谷歌A/B实验——重叠实验基础设施解读

谷歌A/B实验——重叠实验基础设施解读

    • 〇、来源
    • 一、背景介绍
    • 二、如何划分参数
    • 三、谷歌设计的ab实验系统
      • 3.1 域和层的设计
        • 3.1.1 基础重叠域和层设计
        • 3.1.2 具备非重叠和重叠的域和层设计
        • 3.1.2 具备非重叠的域的嵌套设计优点
        • 3.1.3 具备非重叠的域的嵌套设计缺点
        • 3.1.4 启动层(launch layers)设计
    • 四、引用

〇、来源

谷歌ab实验论文Overlapping Experiment Infrastructure: More, Better, Faster Experimentation第四章——OVERLAPPING EXPERIMENT INFRAS- TRUCTURE

一、背景介绍

统计解决方案是一个多因素系统,其中每个因素对应于系统中的一个可变参数。

实际上,一个请求将在 N 个同时进行的实验中进行,其中每个实验将修改不同的参数,N 等于参数的数量。多因素实验得到了大量理论和实践的支持 [^1]。

然而,多因素系统在我们的复杂环境中根本不可行,因为并非所有参数都是独立的,并且并非我们可能想要测试的所有参数值都与另一个参数的值一起使用(例如,粉色background上的粉色text)。

鉴于此约束,谷歌的主要思想是将参数划分为 N 个子集。每个子集都与一个实验层相关联。每个请求最多同时进行 N 个实验(每层一个实验)。

每个实验只能修改与其层相关联的参数(即在该子集中),并且同一参数不能与多个层相关联

二、如何划分参数

首先,我们可以将模块化利用到多个二进制文件中:来自不同二进制文件的参数可以位于不同的子集中,这解决了饥饿和偏差问题。

然而,给定二进制文件的所有参数不需要在单个子集中。我们可以通过:

a.检查了解哪些参数不能相互独立地改变;
b.检查过去的实验,即凭经验查看在以前的实验中哪些参数被一起修改。

查看图 1,我们可以为 Web 服务器、搜索结果服务器和广告结果服务器分别设置一个或多个layer

在这里插入图片描述

三、谷歌设计的ab实验系统

谷歌设计的系统比简单地将参数划分为子集然后与层相关联更灵活。

为了解释灵活性,谷歌引入了几个定义。 在传入流量和系统参数的空间内工作,我们有三个关键概念:

domain,是流量的分段。
layer,一个层对应于系统参数的一个子集。
experiment实验,实验是流量分段,其中可以为零个或多个系统参数指定替代值,以改变传入请求的处理方式。

3.1 域和层的设计

我们可以嵌套域和层。

a.域可以包含层。
b.层可以包含实验,也可以包含域。
c.在层内嵌套域允许与该层相关联的参数子集在该嵌套域内进一步分区。

在包含所有流量和所有参数的默认的域和层。 我们可以:
在这里插入图片描述

3.1.1 基础重叠域和层设计

针对图 2a设计,只需将参数分为三层。 在这种情况下,每个请求最多同时进行三个实验,每一层一个。 每个实验只能修改该层对应的参数。

3.1.2 具备非重叠和重叠的域和层设计

针对图 2b设计,首先将流量分成两个域。 一个域可以是具有单层的域(非重叠域),另一个域将是具有三层的重叠域。

在这种情况下,每个请求将首先分配给非重叠域或重叠域:

a.如果请求在非重叠域中,则该请求最多在一个实验中(并且可以更改整个参数空间中的任何参数)。

b.如果请求在重叠域中,则请求最多在三个实验中,每层一个,每个实验只能使用该层对应的参数。

3.1.2 具备非重叠的域的嵌套设计优点

a.拥有一个不重叠的域,允许我们运行真正需要更改大量通常不会一起使用的参数的实验。
b.它允许我们对参数划分不同的分区;
可以想象三个域:

  • 不重叠的域。
  • 具有一个参数分区的重叠域。
  • 具有不同参数分区的重叠域。

c.嵌套允许我们更有效地利用空间,这取决于哪些分区最常用,哪些跨层参数实验最常用。

请注意,将当前未使用的参数从一层移动到另一层很容易:只要确保参数可以安全地与原始层分配中的参数重叠即可。

如果层具有语义上有意义的名称,例如“广告结果层”和“搜索结果层”,工程师往往不愿意移动违反该语义的标志。 当实验配置不正确时,有意义的名称可以通过使其更加明显来帮助提高稳健性,但它也会限制工程师将利用的灵活性。

还要注意,对于基于 cookie-mod 的实验,使用mod = f(cookie) % 1000,为了确保不同层的实验独立转移,谷歌使用 mod = f(cookie, layer) % 1000 代替

3.1.3 具备非重叠的域的嵌套设计缺点

虽然这种嵌套复杂性确实增加了灵活性,但更改配置(尤其是域的配置)是有成本的:更改流量分配到域的方式会改变可用于实验的流量

例如,如果我们将非重叠域从 10% 的 cookie mods 更改为 15%。则额外 5% 的 cookie mods 来自重叠域。

3.1.4 启动层(launch layers)设计

另一个概念是启动层。 启动层在几个关键方面与迄今为止讨论的实验层不同。
启动层始终包含在默认域中(即,它们在所有流量上运行)

a.启动层是参数的单独分区,即一个参数最多可以同时位于一个启动层和最多一个“正常”层(在一个域内)。

b.为了使启动层和正常层之间的参数重叠起作用,启动层内的实验在语义上略有不同:启动层中的实验为参数提供了替代默认值
换句话说,如果正常实验层中没有实验覆盖参数,那么在启动层实验中,将使用指定的替代默认值,并且启动层实验的行为就像正常实验一样。

c.但是,如果普通实验层中的实验确实覆盖了此参数,则该实验将覆盖参数的默认值,无论该值是指定为系统默认值还是在启动层实验中。

启动层的示例如图 2c、d 所示。 以这种方式定义启动层使我们能够在不干扰现有实验的情况下逐步向所有用户推出更改,并以标准化方式跟踪这些推出。

启动层的一般用法是为每个启动的功能创建一个新的启动层,并在功能完全推出时删除该层(并且新的参数值被纳入默认值)

最后,由于启动层中的实验通常更大,因此它们可用于测试特征之间的交互。

虽然理论上我们可以测试正常实验层中的交互作用(假设我们要么在参数在同一层时手动设置实验,要么在参数在不同层时查看交集),因为实验在正常层中,交叉点更小,因此交互更难检测。

四、引用

[^1] D. Cox and N. Reid. The theory of the design of experiments, 2000.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/549145.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Mysql 5.7 创建索引官方解读

一、环境 Mysql 5.7 二、Mysql索引创建解读 1.概述 通常我们在使用CREATE TABLE时会创建所有的索引。索引的创建对于 InnoDB 表尤其重要,其中主键决定了数据文件中行的物理布局。 CREATE INDEX是另一种添加索引的方式,针对已经创建的表添加索引。注…

AspectJ切面自定义注解实现参数分组校验——基础概念(1)

AspectJ切面自定义注解实现参数分组校验——基础概念&#xff08;1&#xff09;一、环境二、validation-api源码解读2-1.Default源码解读2-2.valid源码解读2-3.Validation源码解读一、环境 maven 需要引入的依赖&#xff1a; <dependency><groupId>javax.valida…

主板跳线连接技巧图解

作为一名新手&#xff0c;要真正从头组装好自己的电脑并不容易&#xff0c;也许你知道CPU应该插哪儿&#xff0c;内存应该插哪儿&#xff0c;但遇到一排排复杂跳线的时候&#xff0c;很多新手都不知道如何下手。 钥匙开机其实并不神秘 还记不记得你第一次见到装电脑的时候…

为什么每个线程都需要创建一个栈?

有四个函数A、B、C、D&#xff0c;地址分别为100、200、300、400&#xff1b;有两个线程同时执行&#xff1b; 1&#xff09;假如只有一个栈 函数A在线程1中执行的时候&#xff0c;调用了函数B&#xff0c;将函数A中下一条指令的地址入栈&#xff08;104&#xff09;&#xff…

莎士比亚,肯尼迪总统,孔子,奥巴马总统,马克吐温,梵高,比尔盖茨等13位名人阔谈微博(中英双语版本)...

2019独角兽企业重金招聘Python工程师标准>>> 作者: ganzhijie 发表于 2010-09-02 10:11 原文链接 阅读: 21 评论: 0 John F. Kennedy-“Ask not what your twitter can do for you, ask what you can do for your twitter.”肯尼迪总统-“不要问你的微博能为你做些什…

centos 本地化配置

2019独角兽企业重金招聘Python工程师标准>>> 最近使用svn更新的时候经常出现一些奇怪的错误。经过查询得知是本地化环境没有配置&#xff0c;导致的。记录以下解决方法。 本人环境&#xff1a;centos 5.x 错误现象&#xff1a; [Copy to clipboard]View Code ERRORs…

MySQL连接查询

1.分类 MySQL连接可以分为&#xff1a; 1&#xff09;内连接 2&#xff09;外连接 左外连接右外连接全外连接 3&#xff09;自然连接 自然内连接(NATURAL JOIN)自然左外连接(NATURAL LEFT JOIN)自然右外连接(NATURAL RIGHT JOIN) 4&#xff09;交叉连接 2.语法 SELECT…

IP编址(包括网络地址和广播地址)

1.总述 IP地址使用32位二进数表示&#xff0c;每一个主机或路由器的接口都有全局唯一的IP地址&#xff08;NAT是个例外&#xff09;&#xff0c;它由网络号(NetID)和主机号(HostID)组成&#xff0c;它可以分为五类&#xff0c;如下&#xff1a; 2.地址划分 1&#xff09;A…

面试题:谈谈你对TCP的认识

一 TCP 1. 简介 首先&#xff0c;TCP是一个传输层协议&#xff0c;提供进程到进程之间的可靠性数据传输服务&#xff0c;还提供流量控制和差错控制等机制。 其次&#xff0c;TCP是面向连接的&#xff0c;其通信模式是全双工的&#xff1b;面向连接是指&#xff1a; 在发送数…

面试题:MySQL的innodb和myisam

一 Innodb 1. 简介 索引是一种排好序的用于快速查找的数据结构。 **根据官网手册InnoDB支持B-tree索引、聚簇索引(Clustered indexes)、全文索引(Full-text search indexes)、不支持hash索引&#xff08;InnoDB在内部利用哈希索引来实现其自适应哈希索引功能&#xff09…

用Markup Validation Service进行网页的W3C标准语法验证(c#)

W3C提供免费的Markup Validation Service&#xff0c;这是一个可以验证Html/XHtml文档的语法规范的公共服务。在某种程度上&#xff0c;有了它&#xff0c;我们再也不用为不能全面及时检测众多浏览器和五花八门的js/css不兼容性而痛不欲生了。^-^。 使用方法很简单&#xff0c;…

为什么MySQL索引更适合B+树而不是二叉树、B树

一 数据库为什么使用B树 1. 与二叉树相比 二叉树相比于顺序查找的确减少了查找次数&#xff0c;但是在最坏情况下&#xff0c;二叉树有可能退化为顺序查找。而且就二叉树本身来说&#xff0c;当数据库的数据量特别大时&#xff0c;其层数也将特别大。二叉树的高度一般是log_2…

MDOP套装之app-v安装使用及功能说明

最近尝试了瑞友天翼的虚拟化产品&#xff0c;感觉还不错&#xff0c;正好手上又下载了个mdop套装&#xff0c;顺手做了个app-v实验&#xff0c;其他实验教程后期继续推出。 一、服务端的安装 二、排序工具的安装 三、客户端的安装 四、使用排序工具虚拟化一个程序 五、发布虚…

容器技术之Dockerk8s知识笔记

本文带你快速了解Kubernetes与Docker 让你对容器与虚拟机的区别、Docker与k8s有一个快速的了解 目录 演变史容器与虚拟机的区别K8S与Docker概念DockerK8S演变史 传统部署时代&#xff1a; 早期&#xff0c;将单一的应用服务运行在物理服务器上&#xff0c;无法给服务器的应用…

Container.ItemIndex 获取reapeater行号

<div class"<%# (Container.ItemIndex)4?"class3":"class4"%>"></div>取到第五行的行号&#xff0c;用一个三元运算符来判断div的样式。 图中container.itemindex(container.ItemIndex-5)是不对的&#xff0c;最上面的代码才…

容器技术之快速了解K8S各抽象资源及组件架构

带你快速了解Kubernetes主要概念和组件架构。 Kubernetes的组件和架构比较多&#xff0c;功能也比较多。 如果详细探讨&#xff0c;每个Kubernetes组件都可以单独写篇博客详细讲解。 我们这里是快速了解&#xff0c;就写的相对比较简单一些。 主要是针对不熟悉Kubernetes的…

Python可视化神器之pyecharts

目录 概述安装参数实例 柱状图-Bar饼图-Pie折线图-Line散点图-scatter3D 柱状图-Bar3D仪表盘-Gauge雷达图-Radar词云图-WordCloud地理坐标系-Geo地图-Map概述 Pyecharts是一款将python与echarts结合的强大的数据可视化工具。使用 pyecharts 可以生成独立的网页&#xff0c;也…

腾讯的强大不是偶然,小马哥很强大

为什么80%的码农都做不了架构师&#xff1f;>>> 其实自己对于腾讯没什么好感&#xff0c;不过也没有太多的坏感&#xff0c;之前还有一篇日志&#xff0c;小批评了一下腾讯&#xff0c;今天看到小马哥写给内部员工的反思邮件。记录下两点提醒自己&#xff1a;对待敌…

计算机三级网络技术第一道大题 网络地址 主机号 直接广播地址 网络技术

加粗样式#计算机三级网络技术 ##网络地址&#xff0c;直接广播地址&#xff0c;主机号&#xff0c;子网中第一个可以IP地址&#xff0c;子网中最后一个可用IP地址 这是我在备考计算机三级网络技术中&#xff0c;写的几个例题&#xff0c;有哪里错的&#xff0c;还请大佬们帮忙纠…

SQL Server2008 附加数据库时出错

开机后附加数据库失败&#xff1a; 1.正常操作附加数据库。 右键单击sqlserver中的数据库&#xff0c;选择【附加】左击【添加】,选择文件路径,左击【确定】&#xff0c;之后弹出“附加数据库时出错”&#xff1a;确定&#xff0c;继续下一步进而查看原因&#xff0c;如图&…