宏观行业心得

OLAP的特点

电商这样的OLTP场景大家更熟悉。相比之下,OLAP的特点:

  • 读相对多,1000row以上大批写入,不改已有数据
  • 查询时输出很多行、很少列,结果被过滤或聚合后能够在一台服务器的内存中
  • 单台服务器qps数百,但吞吐量每秒数十亿行
  • 宽表,列总数多
  • 事务不必须,数据一致性要求低

大数据的工作范畴、业务地位

大数据的研究对象,主要是通用分布式计算框架。任务调度(定时执行、相互依赖)和集群管理(选举、通信等)也算。

数据库应该做存储相关的事情。现在的互联网的大流量冲击下,如果把业务处理及计算放在数据库上,数据库的负载压力会特别大。现在大数据一般外置,由专门的集群负责业务处理及计算。从写sql存储过程,到写spark sql(sql + scala/python)和flink代码(java/scala)。

程序化广告

在CCTV黄金时段打洗脑广告的时代已经过去了。现在出现了很多小微流量主,私域不容小觑。
广告主想打广告,流量主想接广告。称为需求方和供给方。需要有一个“中介”,否则洽谈将无休无止。
广告主对不同的用户群体有不同的预算。“中介”需要考虑广告主的出价,用户的特征,广告位的上下文,来决定“你打开手机看见的是哪个广告”。能感觉到这是一个优化问题。

下面是singular公司对程序化广告的解释:
广告库存的实时拍卖发生在访问者登陆网页或应用程序加载屏幕的那一刻。使用数据和机器学习算法向用户提供最相关的广告。将用户个人资料或广告将放置的上下文中的任何已知数据与广告商对相关兴趣或受众人口统计数据的出价进行匹配,确保广告商能够为其营销工作带来回报。

移动营销的一种部门分工

工程

前后端的数据交互。用户加载、点击一个广告,观看、安装、充值/购买、更新app,都会产生日志,日志会发送到日志服务器。日志是最原始、最丰富的数据。比如事件信息(如日期时刻,点击位置)、用户信息(安装的其它app列表,设备信息)、广告信息(素材编号、图片/视频/可交互)、包信息(app类型,评分)。

数据中台

从上述日志中提取字段。设计表的字段(有点特征工程的意思)。也负责反作弊。

数分/运营

熟悉各类指标,比如日活、次留。他们工作一般面对BI软件,生产报表。

大数据平台

按不同粒度(比如日期,地区,事件类型)聚合数据,存储供查询。开发/维护存储和查询时需要用到的工具/集群,监控硬件指标以外的服务指标。解答用户使用时的问题。成本核算。自动化数据质量检测。

算法工程

开发/维护ABtest实验平台。目标是方便、快速比较哪个算法好,记录实验结果。

算法

生成算法提供广告素材,推荐算法给广告素材排序。目标是提高广告点击率。

未来趋势

感觉目前的云厂商有统一天下的野心。我这里仅举出我在这家公司亲眼看见的例子,想必只是冰山一角。之所以现在还没有一统,是因为目前在成本上:养人、开源二次开发、自己运维 < 云厂商服务。部门kafka评估出的全托管成本百万/月,目前用人还是更划算一些。

AWS Athena

AWS Athena是一种交互式查询服务,用户可以使用标准SQL直接在S3上轻松分析数据。也就是说,企业不需要养数据库(存储研究人员、DBA),也不再需要spark集群运维,bi运维。细分市场的BI服务提供商,比如帆软、tableau这种,也会受到冲击。

阿里云PAI

在这里插入图片描述
从上图可以看出,企业用户只需要提供数据集和配置,就能一键微调定制自己的大语言模型。可能只需要招1个人就够了。

AWS也提供类似的服务。amazon bedrock,model as a service,企业用户可以直接选择某一种模型(比如meta llama,amazon titan,anthropic等),打造自己公司的问答机器人,用的是公司自己提供的数据,以解决隐私合规等问题。他们提供了几种评估方式,帮助企业用户来做选择,playground手测,公开benchmark自动测,使用自己的数据集测,委托aws团队测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/675103.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

fastapi mysql 开发restful 3

pip install mysql-connector-python pymysql 数据库链接 创建src目录&#xff0c;里面创建db.py 代码如下&#xff1a; # 导入mysql.connector模块&#xff0c;该模块提供了与MySQL数据库进行连接和交互的功能。 import mysql.connector # 定义一个函数get_db_connectio…

二分算法--模板及原理总结

二分答案 首先我们看这个图&#xff1a; 我们需要二分的答案就是这个临界点x。 什么情况下可以使用二分呢&#xff1a; 具有单调性&#xff08;单调递增&#xff0c;单调递减&#xff09;&#xff0c;二段性&#xff08;整个区间一分为二&#xff0c;一段区间满足&#xff0c;一…

为什么许多年轻人不喜欢回农村过年了?

为什么许多年轻人不喜欢回农村过年了&#xff1f; 随着时代的变迁和社会的发展&#xff0c;越来越多的年轻人选择在春节期间留在城市&#xff0c;而不是回到农村老家过年。这一现象引起了人们的关注和思考&#xff1a;为什么许多年轻人不喜欢回农村过年了&#xff1f; 首先&a…

全栈笔记_插件篇(用Volar替换Vuter)

Volar与Vuter的区别 TS支持&#xff1a;Volar和Vuter是2个独立的插件&#xff0c;都是为.vue单文件组件提供代码高亮以及语法支持&#xff0c;但是Vuter对ts的支持并不友好。唯一根标签&#xff1a;Volar 不限制是否唯一根标签&#xff0c;vuter 则会报错 The template root r…

史上最“昂贵”的漏洞

阿丽亚娜 5 号”事故 欧洲航天局“阿丽亚娜 5 号”运载火箭在 1996 年 6 月 4 日首次发射时发生了事故。火箭在飞行的第 40 秒由于软件错误而解体并爆炸&#xff0c;该软件直接沿用了以前“阿丽亚娜 4 号”火箭的软件&#xff0c;且未在新环境中进行测试。 此次事故导致四颗卫…

Qt网络编程-QTcpServer的封装

简单封装Tcp服务器类&#xff0c;将QTcpServer移入线程 头文件&#xff1a; #ifndef TCPSERVER_H #define TCPSERVER_H#include <QObject>class QTcpSocket; class QTcpServer; class QThread; class TcpServer : public QObject {Q_OBJECT public:explicit TcpServer(…

SpringBoot响应式编程教程-WebFlux

SpringBoot响应式编程教程-WebFlux 前言正文一、Reactor1、核心概念2、核心特性 二、Spring Webflux与springmvc的组件对比 三、R2DBC 结语 前言 最近有个项目需要用到响应式编程&#xff0c;一开始还是很懵的&#xff0c;以为是网页的自适应&#xff0c;通过部分文章的学习&a…

【MIMO】

MIMO技术入门 1.简介 MIMO(多入多出):多天线技术。 注意&#xff1a;此处的多天线&#xff0c;并不是有多个天线板&#xff0c;对基站来讲指天线有多套振子&#xff08;每一套振子都可以看成一个独立的天线&#xff09;。 4G 8天线&#xff1b;5G 64T64R&#xff1b;不仅基站…

[NOIP1998 普及组] 幂次方 题解 含源码

[NOIP1998 普及组] 幂次方 题目描述 任何一个正整数都可以用 2 2 2 的幂次方表示。例如 $13727232^0 $。 同时约定次方用括号来表示&#xff0c;即 a b a^b ab 可表示为 a ( b ) a(b) a(b)。 由此可知&#xff0c; 137 137 137 可表示为 2 ( 7 ) 2 ( 3 ) 2 ( 0 ) 2(7…

什么是VPS服务器技术

VPS就是虚拟私有服务器&#xff0c;那VPS服务器技术具体是包含哪些&#xff1f;什么是VPS服务器技术&#xff1f; VPS可以通过虚拟化技术将一台物理服务器划分成多个虚拟服务器&#xff0c;并且每个虚拟服务器都有着属于自己的独立配置&#xff0c;是多个用户拥有着属于自己的资…

JavaScript valueOf() 方法详解

valueOf() valueOf() 方法通常由 JavaScript 在后台自动调用&#xff0c;并不显式地出现在代码中。 所有主要浏览器都支持valueOf()。 Number对象 valueOf() 方法可以返回数字的原始值。 语法&#xff1a; number.valueOf() // 返回一个数的原始值返回一个 Number 对象的…

【模板初阶】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言 1. 泛型编程 2. 函数模板 2.1 函数模板概念 2.2 函数模板格式 2.3 函数模板的原理 2.4 函数模板的实例化 2.5 模板参数的匹配原则 3. 类模板 3.1 类模板的定义…

FPGA_工程_基于Rom的VGA图像显示

一 工程框图 框图中&#xff0c;CLK_in&#xff0c;Vga_ctrl&#xff0c;Vga_pic模块已有&#xff0c;只需要对顶层模块进行修改&#xff0c;并将rom ip例化添加到Vga_pic模块的.v文件中&#xff0c;对Vga_pic的.v文件进行一定修改。 二 理论补充 显示图像的方法&#xff1a;…

Mac 版 Excel 和 Windows 版 Excel的区别

Excel是一款由微软公司开发的电子表格程序&#xff0c;广泛应用于数据处理、分析和可视化等领域。它提供了丰富的功能和工具&#xff0c;包括公式、函数、图表和数据透视表等&#xff0c;帮助用户高效地处理和管理大量数据。同时&#xff0c;Excel还支持与其他Office应用程序的…

CSS中可继承与不可继承属性有哪些

一、无继承性的属性 1.display&#xff1a;规定元素应该生成的框的类型 属性值作用none元素不显示&#xff0c;并且会从文档流中移除。block块类型。默认宽度为父元素宽度&#xff0c;可设置宽高&#xff0c;换行显示。inline行内元素类型。默认宽度为内容宽度&#xff0c;不…

docker安装etherpad文档系统

效果 安装 1.创建并进入目录 mkdir -p /opt/etherpad cd /opt/etherpad 2.修改目录权限 chmod -R 777 /opt/etherpad 3.创建并启动容器 docker run -d --name etherpad --restart always -p 10054:9001 -v /opt/etherpad/data:/opt/etherpad-lite/var etherpad/etherpad:la…

【Java数据结构】ArrayList和LinkedList的遍历

一&#xff1a;ArrayList的遍历 import java.util.ArrayList; import java.util.Iterator; import java.util.List;/*** ArrayList的遍历*/ public class Test {public static void main(String[] args) {List<Integer> list new ArrayList<>();list.add(5);list…

XGB-4: 学习排序

概述 在信息检索的背景下&#xff0c;学习排序的目标是训练一个模型&#xff0c;将一组查询结果排列成有序列表[1]。对于监督学习排序&#xff0c;预测器是以特征矩阵编码的样本文档&#xff0c;标签是每个样本的相关性程度。相关性程度可以是多级&#xff08;分级&#xff09…

【ASP.NET Core 基础知识】--部署和维护--部署ASP.NET Core应用程序

一、部署准备 1.1 打包应用程序 打包应用程序是将ASP.NET Core应用程序准备好以便于部署到目标环境的关键步骤之一。在本文中&#xff0c;我们将从编译代码、收集依赖项和设置配置三个方面详细讲解如何打包ASP.NET Core应用程序&#xff0c;以确保在部署过程中的顺利进行。 编…

win32编程系统BUG(Win32 API中的WM_SETTEXT消息)

由于频繁使用Win32 API中的WM_SETTEXT消息&#xff0c;导致内存占用直线上升。 暂未找到有效解决方案。