宏观行业心得

OLAP的特点

电商这样的OLTP场景大家更熟悉。相比之下,OLAP的特点:

  • 读相对多,1000row以上大批写入,不改已有数据
  • 查询时输出很多行、很少列,结果被过滤或聚合后能够在一台服务器的内存中
  • 单台服务器qps数百,但吞吐量每秒数十亿行
  • 宽表,列总数多
  • 事务不必须,数据一致性要求低

大数据的工作范畴、业务地位

大数据的研究对象,主要是通用分布式计算框架。任务调度(定时执行、相互依赖)和集群管理(选举、通信等)也算。

数据库应该做存储相关的事情。现在的互联网的大流量冲击下,如果把业务处理及计算放在数据库上,数据库的负载压力会特别大。现在大数据一般外置,由专门的集群负责业务处理及计算。从写sql存储过程,到写spark sql(sql + scala/python)和flink代码(java/scala)。

程序化广告

在CCTV黄金时段打洗脑广告的时代已经过去了。现在出现了很多小微流量主,私域不容小觑。
广告主想打广告,流量主想接广告。称为需求方和供给方。需要有一个“中介”,否则洽谈将无休无止。
广告主对不同的用户群体有不同的预算。“中介”需要考虑广告主的出价,用户的特征,广告位的上下文,来决定“你打开手机看见的是哪个广告”。能感觉到这是一个优化问题。

下面是singular公司对程序化广告的解释:
广告库存的实时拍卖发生在访问者登陆网页或应用程序加载屏幕的那一刻。使用数据和机器学习算法向用户提供最相关的广告。将用户个人资料或广告将放置的上下文中的任何已知数据与广告商对相关兴趣或受众人口统计数据的出价进行匹配,确保广告商能够为其营销工作带来回报。

移动营销的一种部门分工

工程

前后端的数据交互。用户加载、点击一个广告,观看、安装、充值/购买、更新app,都会产生日志,日志会发送到日志服务器。日志是最原始、最丰富的数据。比如事件信息(如日期时刻,点击位置)、用户信息(安装的其它app列表,设备信息)、广告信息(素材编号、图片/视频/可交互)、包信息(app类型,评分)。

数据中台

从上述日志中提取字段。设计表的字段(有点特征工程的意思)。也负责反作弊。

数分/运营

熟悉各类指标,比如日活、次留。他们工作一般面对BI软件,生产报表。

大数据平台

按不同粒度(比如日期,地区,事件类型)聚合数据,存储供查询。开发/维护存储和查询时需要用到的工具/集群,监控硬件指标以外的服务指标。解答用户使用时的问题。成本核算。自动化数据质量检测。

算法工程

开发/维护ABtest实验平台。目标是方便、快速比较哪个算法好,记录实验结果。

算法

生成算法提供广告素材,推荐算法给广告素材排序。目标是提高广告点击率。

未来趋势

感觉目前的云厂商有统一天下的野心。我这里仅举出我在这家公司亲眼看见的例子,想必只是冰山一角。之所以现在还没有一统,是因为目前在成本上:养人、开源二次开发、自己运维 < 云厂商服务。部门kafka评估出的全托管成本百万/月,目前用人还是更划算一些。

AWS Athena

AWS Athena是一种交互式查询服务,用户可以使用标准SQL直接在S3上轻松分析数据。也就是说,企业不需要养数据库(存储研究人员、DBA),也不再需要spark集群运维,bi运维。细分市场的BI服务提供商,比如帆软、tableau这种,也会受到冲击。

阿里云PAI

在这里插入图片描述
从上图可以看出,企业用户只需要提供数据集和配置,就能一键微调定制自己的大语言模型。可能只需要招1个人就够了。

AWS也提供类似的服务。amazon bedrock,model as a service,企业用户可以直接选择某一种模型(比如meta llama,amazon titan,anthropic等),打造自己公司的问答机器人,用的是公司自己提供的数据,以解决隐私合规等问题。他们提供了几种评估方式,帮助企业用户来做选择,playground手测,公开benchmark自动测,使用自己的数据集测,委托aws团队测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/675103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

二分算法--模板及原理总结

二分答案 首先我们看这个图&#xff1a; 我们需要二分的答案就是这个临界点x。 什么情况下可以使用二分呢&#xff1a; 具有单调性&#xff08;单调递增&#xff0c;单调递减&#xff09;&#xff0c;二段性&#xff08;整个区间一分为二&#xff0c;一段区间满足&#xff0c;一…

为什么许多年轻人不喜欢回农村过年了?

为什么许多年轻人不喜欢回农村过年了&#xff1f; 随着时代的变迁和社会的发展&#xff0c;越来越多的年轻人选择在春节期间留在城市&#xff0c;而不是回到农村老家过年。这一现象引起了人们的关注和思考&#xff1a;为什么许多年轻人不喜欢回农村过年了&#xff1f; 首先&a…

全栈笔记_插件篇(用Volar替换Vuter)

Volar与Vuter的区别 TS支持&#xff1a;Volar和Vuter是2个独立的插件&#xff0c;都是为.vue单文件组件提供代码高亮以及语法支持&#xff0c;但是Vuter对ts的支持并不友好。唯一根标签&#xff1a;Volar 不限制是否唯一根标签&#xff0c;vuter 则会报错 The template root r…

史上最“昂贵”的漏洞

阿丽亚娜 5 号”事故 欧洲航天局“阿丽亚娜 5 号”运载火箭在 1996 年 6 月 4 日首次发射时发生了事故。火箭在飞行的第 40 秒由于软件错误而解体并爆炸&#xff0c;该软件直接沿用了以前“阿丽亚娜 4 号”火箭的软件&#xff0c;且未在新环境中进行测试。 此次事故导致四颗卫…

SpringBoot响应式编程教程-WebFlux

SpringBoot响应式编程教程-WebFlux 前言正文一、Reactor1、核心概念2、核心特性 二、Spring Webflux与springmvc的组件对比 三、R2DBC 结语 前言 最近有个项目需要用到响应式编程&#xff0c;一开始还是很懵的&#xff0c;以为是网页的自适应&#xff0c;通过部分文章的学习&a…

【模板初阶】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言 1. 泛型编程 2. 函数模板 2.1 函数模板概念 2.2 函数模板格式 2.3 函数模板的原理 2.4 函数模板的实例化 2.5 模板参数的匹配原则 3. 类模板 3.1 类模板的定义…

FPGA_工程_基于Rom的VGA图像显示

一 工程框图 框图中&#xff0c;CLK_in&#xff0c;Vga_ctrl&#xff0c;Vga_pic模块已有&#xff0c;只需要对顶层模块进行修改&#xff0c;并将rom ip例化添加到Vga_pic模块的.v文件中&#xff0c;对Vga_pic的.v文件进行一定修改。 二 理论补充 显示图像的方法&#xff1a;…

Mac 版 Excel 和 Windows 版 Excel的区别

Excel是一款由微软公司开发的电子表格程序&#xff0c;广泛应用于数据处理、分析和可视化等领域。它提供了丰富的功能和工具&#xff0c;包括公式、函数、图表和数据透视表等&#xff0c;帮助用户高效地处理和管理大量数据。同时&#xff0c;Excel还支持与其他Office应用程序的…

docker安装etherpad文档系统

效果 安装 1.创建并进入目录 mkdir -p /opt/etherpad cd /opt/etherpad 2.修改目录权限 chmod -R 777 /opt/etherpad 3.创建并启动容器 docker run -d --name etherpad --restart always -p 10054:9001 -v /opt/etherpad/data:/opt/etherpad-lite/var etherpad/etherpad:la…

【Java数据结构】ArrayList和LinkedList的遍历

一&#xff1a;ArrayList的遍历 import java.util.ArrayList; import java.util.Iterator; import java.util.List;/*** ArrayList的遍历*/ public class Test {public static void main(String[] args) {List<Integer> list new ArrayList<>();list.add(5);list…

win32编程系统BUG(Win32 API中的WM_SETTEXT消息)

由于频繁使用Win32 API中的WM_SETTEXT消息&#xff0c;导致内存占用直线上升。 暂未找到有效解决方案。

HCIA--OSPF实验

1.划分网段&#xff0c;子网划分已完成&#xff1b;接口配置&#xff1a; AR1配置 &#xff1a; [Huawei]int g0/0/0 [Huawei-GigabitEthernet0/0/0]ip add 172.16.64.1 20 [Huawei-GigabitEthernet0/0/0]qu [Huawei]int l0 [Huawei-LoopBack0]ip add 172.16.80.1 20AR2配置…

Prime(VulnHub)

Prime 文章目录 Prime1、nmap2、web渗透随便看看首页隐写查看目录爆破gobusterferoxbusterdirsearchdirb whatwebsearchsploit WordPress 5.2.2/dev/secret.txtFuzz_For_Webwfuzzimage.phpindex.php location.txtsecrettier360文件包含漏洞包含出password.txt尝试ssh登入尝试登…

MPLS VPN功能组件

VPN实例 VPN实例即为VPN路由转发表VRF&#xff0c;不同VPN之间的路由隔离通过VPN实例实现&#xff0c;PE上存在多个路由转发表&#xff0c;包括一个公网路由转发表&#xff0c;以及一个或多个VPN路由转发表。 PE为每个直接相连的Site建立并维护专门的VPN实例&#xff0c;VPN实…

《计算机网络简易速速上手小册》第10章:未来网络技术趋势(2024 最新版)

文章目录 10.1 边缘计算与网络设计 - 未来网络的速度与激情10.1.1 基础知识10.1.2 重点案例&#xff1a;使用 Python 实现边缘计算的实时视频分析准备工作Python 脚本示例 10.1.3 拓展案例1&#xff1a;智能交通系统Python 脚本示例 - 边缘计算设备上的交通流量分析 10.1.4 拓展…

高考志愿填报模拟系统的功能和技术总结

一、金秋志愿高考志愿填报系统主要功能&#xff1a; 用户注册与登录&#xff1a;允许学生和家长注册账号&#xff0c;使用注册的账号登录系统。 个人信息管理&#xff1a;允许用户查看、修改个人信息&#xff0c;如姓名、性别、联系方式等。 高考成绩输入&#xff1a;学生输…

windows上卸载完程序后,清理残余文件,无法删除的情况处理

现象&#xff1a;通常在卸载完软件后&#xff0c;要删除残余文件或者移动残余文件时候&#xff0c;会弹出来 原因&#xff1a; 因为文件被其他程序已经加载&#xff0c;处理的目标是找到使用这个文件的进程&#xff0c;然后kill掉。类似于linux上的lsof命令查找到进程号&…

SpringOne2023解读-01-使用spring-cloud-contract与TestContainer构建可靠程序

个人创作公约&#xff1a;本人声明创作的所有文章皆为自己原创&#xff0c;如果有参考任何文章的地方&#xff0c;会标注出来&#xff0c;如果有疏漏&#xff0c;欢迎大家批判。如果大家发现网上有抄袭本文章的&#xff0c;欢迎举报&#xff0c;并且积极向这个 github 仓库 提交…

如何在vue中使用拖动排序组件sortablejs

效果图&#xff1a; 1.首先&#xff0c;我们需要在vue项目中安装依赖&#xff1a; npm install -save sortablejs2.创建demo文件>demoTest.vue&#xff0c;直接附上实例代码&#xff1a; <template><div><div id"table-names"><div class&…

如何使用CLZero对HTTP1.1的请求走私攻击向量进行模糊测试

关于CLZero CLZero是一款功能强大的模糊测试工具&#xff0c;该工具可以帮助广大研究人员针对HTTP/1.1 CL.0的请求走私攻击向量进行模糊测试。 工具结构 clzero.py - 工具主脚本&#xff1b; default.py - 包含了大多数标准攻击测试方法和字符&#xff1b; exhaustive.py - 包…