mysql .pdb是什么文件_计算广告算法到底要做什么?

这个话题在这个专栏开篇就该去讲。恰逢今天公司业务和财务培训(20190216)之后,也有一些思索,索性就都汇总写下来。本文杂述,不尽完备,但是值得不断完善。

我喜欢一句话“革命不是请客吃饭,不是做文章,不是绘画绣花,不能那样雅致,不能那样从容不迫,文质彬彬,那样温良恭俭让。”。对于一个公司来说,不得不承认,也应该是如此!必须要有贡献,要有对应的产出!这样就自然的提出了一系列问题,要有怎样的产出,要做些什么样的事情,要达到什么样的目标,要去往哪里?我想,作为一名广告算法工程师,不管是怎么入行的,那么现在在这个行当去做,也就该时刻的去问这些问题。记得《乔布斯传》里边儿有写到,乔布斯随时都会问员工几个问题,你在公司负责什么?你今天最重要的事情是什么?我想这也是一个职业人该随时问自己的问题。

首先一点就是广告算法的核心竞争力是什么?知乎上有这个问题,总结一下大家的答案,基本上都强调了业务知识!对于业务的理解很关键,但只单纯的理解业务也不能形成一个算法工程师的核心竞争力!毕竟广告算法工程师还是要从算法工程出发,所以不断的去打磨我们自己的算法和工程能力是一个算法工程师必不可少的功课,深刻理解业务可以说是在任何一个领域深深地耕耘下去必备的知识体系。对于算法工程师的优劣标准老大给过一个决策力是很关键的指标,具体来说就是我们需要做很多的判断,很多的抽象,以至于构建很多的模型和策略,这样怎么去构建我们的评估体系,怎么去决策就显的尤为重要!下边分列一下广告需要着重关注和解决的问题。

第一类事情统计分析

计算广告具有天然的大数据特性特别是涉及到变现的业务对于数据都十分敏感,不管是衡量自己的工作还是汇报工作以及分享离开数据的支撑都是空洞无物的,如何培养这样的敏感性?首先我们要对于统计分析的一些基本方法和能力有培养,另外要对于关键指标有明确的了解和意识,具体到计算广告涉及计费的有CPM、oCPM、CPC、oCPC、CPI、CPA等,涉及到效果的CTR、CVR、eCPM 、TA%、N+REACH等,另外对于一些媒体属性、行业特征等也应该有个大概的把握,对于模型的评价指标比如离线考虑AUC、F1、Accuracy、log_loss等以及A/B测试情况都需要有非常清楚的掌握。

在对于数据分析的过程中,我们常用的一些工具需要有Hive、Mysql等这样的存储介质以及SQL或类SQL的编写能力;基于Spark、Hadoop等大数据引擎编写数据处理与分析的能力由于计算广告所涉及的数据量级都十分巨大,传统简单的分析方式可能很难奏效,无论是数据分析,还是特征抽取以及模型训练,对于大数据的处理能力都是必不可少的;灵活的python、shell等脚本语言的编写能力,有很多任务可能只是即时的分析,能快速的编写对应的脚本来处理也是很重要的,python具有很多数据分析的强大库,比如pandas、scipy、matplot等都是平时工作非常重要的工具,另外灵活的shell脚本的编写也可以快速的实现一些统计分析工作。

第二类事情预估问题

可以说预估问题是计算广告算法发挥作用的核心地带,尤其是点击率预估问题,基本上各大公司都有自己的预估算法体系,预估算法也从传统的经典机器学习比如逻辑回归、朴素贝叶斯、SVM等方法逐渐发展到FM、MLR、LR+GBDT、GBM等,现在很多公司也在逐渐采用一些深度学习方法,比如DNN、DEEPFM、DIN等。可以说这个方向是研究的最多的,也是成果最为丰富的。

但是广告的投放是一个全链的商业行为,一般广告主最终考核的是ROI,因此对于转化率、客单价等的预估问题也是十分重要的,而且这类问题往往也是十分困难的。具体到转化率,可能存在数据特别稀疏,数据延迟或缺失以及反复,无经验下限等问题。因此对于这类问题的模型的研究也是算法工作的一个重点和棘手的问题。

还有就是用户画像涉及到的诸多预估问题,其中涉及到品牌广告一般考核的一个指标TA浓度问题,用户兴趣标签涉及到的预估问题,这类问题可以采用线性模型、树形模型以及深度神经网络模型并用最后融合的方式去解决。

第三类事情出价问题

广告的出价问题是伴随着RTB的发展而发展的,最为著名的就是谷歌采用的广义第二高价方式,可以说对于RTB广告影响深远,不过最近有说谷歌由于各种原因可能会采用一价方式,不管怎样,广告对于出价的考虑都是一个非常重要和系统的问题。另外像百度,他们的出价也是在一个不断迭代的过程,从一价、二价、梅森拍卖、优化出价等不断的在进行迭代。值得说明的是很多出价模型非常依赖于预估的解。

第四类事情推荐与排序问题

对于广告所涉及的推荐和排序问题,可能不像纯粹的推荐系统那么复杂繁琐,或者说广告的推荐业务问题和纯粹的推荐是有很大的差距的,广告的推荐更多的涉及广告素材的推荐,广告的排序是需要考虑价格或者ROI因素的,也就是很多排序是基于eCPM去排序,但是广告所涉及的推荐技术也是和一般的推荐所解决和面临的问题是一样的。

不过在广告推荐里边一般会涉及到广告的创意优选类的功能,也是要基于预估值去实现一些业务功能的。

第五类事情防作弊问题

对于计算广告,防止作弊是十分紧要的问题,一般的作弊处理分为在线防作弊和离线反作弊。作弊系统更为常见的是一些规则,一些具体的规则定义往往可以成为一种标准,具体可以参看一些监测公司的规则定义。当然,对于作弊数据的建模也是可以做算法去区分的。

第六类问题流量预估、分配与评级

对于流量的精细化管理一定是十分重要的,特别是对于联盟网络,以及pdb的多点位的问题,流量预估可以经过统计分析得到,一般的分配算法,可以利用线性方法,也可以利用非线性的优化方法,主要基于业务场景的建模。对于流量的评级,一般基于历史投放数据,和一些业务规则来进行,评级一般可以控制量的情况以及后续合作的情况,所以对于网盟类流量十分必要。

另外还有一些涉及到具体业务的,比如PDB的退量和保量,投放速度、频次控制等算法。

另外,说一点其他的,那就是责任心,对效果负责的责任心,如果没有责任心,我想算法人员是很难有实际的产出的。还有就是好奇心或者说想法、创新性,没有自己的思考和想法也难以成为一名合格的算法工程师。

参考:

1、广告算法工程师的核心竞争力是什么?https://www.zhihu.com/question/41081387

2、广告策略产品经理:浅析广告系统的智能策略有哪些方面?https://zhuanlan.zhihu.com/p/56450602

3、如何更好的理解今日头条的广告智能算法?

https://www.jianshu.com/p/b374af2cbd1a

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/365399.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析inline-block--使用inline-block创建布局

inline-block前端程序猿们肯定不陌生,它是display属性的一个取值。 之所以称之为inline-block。是因为它兼具行内元素(inline-element)和块级元素(block-element)的特征。 块级元素(block elements),来源于CSS盒子模型。块级元素包含width h…

Cookie和Session版的登录验证

URL : from django.conf.urls import url from app01 import viewsurlpatterns [url(r^login/, views.login),url(r^home/, views.home),url(r^index/, views.index), ] 前端 : <form action"" method"post">{% csrf_token %}<input type"t…

Java 8 Friday Goodies:java.io终于成功了!

在Data Geekery &#xff0c;我们喜欢Java。 而且&#xff0c;由于我们真的很喜欢jOOQ的流畅的API和查询DSL &#xff0c;我们对Java 8将为我们的生态系统带来什么感到非常兴奋。 我们已经写了一些关于Java 8好东西的博客 &#xff0c;现在我们觉得是时候开始一个新的博客系列了…

ASP.NET获取客户端、服务器端基础信息

1. 在ASP.NET中专用属性&#xff1a;获取服务器电脑名&#xff1a;Page.Server.ManchineName获取用户信息&#xff1a;Page.User获取客户端电脑名&#xff1a;Page.Request.UserHostName获取客户端电脑IP&#xff1a;Page.Request.UserHostAddress2. 在网络编程中的通用方法&am…

java json decode 中文_关于json_decode乱码及NULL的解决方法

写接口的同学应该会经常遇到数据格式的转换&#xff0c;这时候必不可少的两个函数就是json_encode()和json_decode()。这两个函数使用的时候有很多的主要事项&#xff0c;在这里我来说一下json_decode()。json_decode():对JSON 格式的字符串进行解码,接受一个JSON 格式的字符串…

syslog可能引起得问题_牙齿经常有问题?可能是这4个坏习惯引起的,要改正

很多人明明很年轻&#xff0c;却得了很多牙齿疾病&#xff0c;甚至到了换牙的地步。牙齿虽然是最为坚硬的身体器官&#xff0c;但是即使再坚硬也是容易受到伤害的&#xff0c;日常生活中有很多小事都会造成对牙齿的伤害&#xff0c;想要保护牙齿&#xff0c;一定要改正一下这几…

jq实现前端文件上传

FormData FormData是XMLHttpRequest Level 2 新增的一个接口。 使用FormData可以实现各种文件上传。 使用 // 创建FormData的实例 var formdata new FormData();// 用append()为实例添加键和值 formdata.append(键名, 键值); 注意 使用jq的$.ajax()方法来进行文件上传时&am…

使用JUnitParams进行参数化的JUnit测试

参数化的单元测试用于在不同条件下测试相同的代码。 借助参数化的单元测试&#xff0c;我们可以建立一种测试方法&#xff0c;该方法从某些数据源中检索数据。 该数据源可以是测试数据对象&#xff0c;外部文件甚至数据库的集合。 一般的想法是使使用相同的单元测试方法测试不同…

js webpack 解决跨域问题_webpack-dev-server 作代理解决跨域,让你的本地开发飞起来...

最近在接到一个需求是做一个可视化的监控系统&#xff0c;mock数据来开发的话实在不太方便&#xff0c;况且数据量之大。查了一下资料&#xff0c;可以用webpack-dev-server作为代理&#xff0c;直接请求线上&#xff0c;哈哈哈&#xff0c;是不是很方便。### 目前我用的是webp…

代码片段 欢迎补充 一起共享

python&#xff1a; https://github.com/Lj-github/pythonTool转载于:https://www.cnblogs.com/liujiang04/p/9787486.html

实现用户操作指引功能

主要是通过定位找到需要指引的目标元素&#xff0c;然后再在蒙版上画一个div&#xff0c;设置为白色&#xff0c;定位到目标元素位置。思路大概就是这样。 图一&#xff1a; ![](https://img2018.cnblogs.com/blog/1354858/201811/1354858-20181105141942044-1763163359.png) 图…

扩展Guava缓存溢出到磁盘

缓存使您可以轻松地显着加速应用程序。 Java平台的两种出色的缓存实现是Guava缓存和Ehcache 。 尽管Ehcache功能丰富得多&#xff08;例如其Searchable API &#xff0c;将缓存持久化到磁盘或溢出到大内存的可能性&#xff09;&#xff0c;但与Guava相比&#xff0c;它也带来了…

磁盘

我们现在计算机的瓶颈在磁盘上 CPU运算速率已达到5.0GHz 1GHz10亿次每秒&#xff08;计算速度&#xff09; 硬盘 MB 软盘——>碟片&#xff08;100MB&#xff09;——>芯片ssd&#xff08;500MB~2000MB&#xff09; 存储程序的方式&#xff1a; 磁盘与内存想比较 能够用…

java gson fromjson,Gson的fromJson()方法

Gson提供了fromJson()方法来实现从Json相关对象到java实体的方法。在日常应用中&#xff0c;我们一般都会碰到两种情况&#xff0c;转成单一实体对象和转换成对象列表或者其他结构。先来看第一种&#xff1a;比如json字符串为&#xff1a;[{“name”:”name0”,”age”:0}]Pers…

python文件的读取与写入_python中文件的读取与写入以及os模块

1.文件读取的三部曲&#xff1a;打开 ---> 操作 ----> 关闭r(默认参数)&#xff1a;-只能读&#xff0c;不能写-读取文件不存在 会报错FileNotFoundError: [Errno 2] No such file or directory: /tmp/westosw(д)-write only-文件不存在的时候&#xff0c;会自动创建新的…

vue2.0 element-ui中的el-select选择器无法显示选中的内容

我使用的是element-ui V2.2.3。代码如下&#xff0c;当我选择值得时候&#xff0c;el-select选择器无法显示选中的内容&#xff0c;但是能触发change方法&#xff0c;并且能输出选择的值。 select.vue文件 <template><div><div class"row" v-for&quo…

Gradle接口:Gradle构建元数据

正如我之前在“ 识别Gradle约定 ”和“ 从Ant Build演变Gradle构建&#xff1a;导入Ant构建文件 ”之类的文章中所显示的那样&#xff0c;可以通过Groovy访问Gradle的API来收集有关Gradle构建的重要信息。 在本文中&#xff0c;我演示了如何通过Gradle接口访问基本的Gradle构建…

字符串(string)的常用语法和常用函数

在python中&#xff0c;加了引号&#xff08;单引号、双引号、三引号&#xff09;的字符就是字符串类型&#xff0c;python并没有字符类型。 字符串也是很常用的数据类型&#xff0c;这里介绍一些用的较多的语法和方法&#xff0c;直接以代码示例展示。 1 str helloworld2 str…

os 模块 和 os模块下的path模块

import os # os 主要用于与操作系统进行交互 #获取当前的工作目录 print&#xff08;os.getcwd&#xff08;&#xff09;&#xff09; #切换工作目录 os .chdir("D:\上海python全栈4期\day20\pack") #print(os.getcwd()) #当前目录 是一个点 #print&#xff08;os.cu…

php 工资 2018,佛山市2018年平均工资(社平工资)

2018年佛山市城镇非私营单位就业人员年平均工资为79824元(折合月平均工资6652)。2018年佛山市在岗职工年平均工资为80288元(折合月平均工资6691&#xff0c;四舍五入)。2018年佛山市城镇私营单位就业人员年平均工资为57297元(折合月平均工资4775)。广东地区2019年7月1日起市平均…