数据按时间拆开分批处理示例

数据按时间拆开分批处理示例

news/2025/10/24 1:10:42/文章来源:https://blog.csdn.net/weixin_30240349/article/details/97299774

我现在的问题是有一个大的事实表,已经有数十亿条数据,过来的临时表需要merge进去. 临时表的大小也不确定,可能上十亿也可能只有几百几千万而已.

如果直接让这两个表merge起来,则需要很大的内存来进行处理.所以我就想着把数据进行按时间拆分的处理,然后merge进去,

拆分的条件是如果临时表的数据量大于三亿条,我就按二亿条左右一个批次进行merge.

总体设计完的package是这样的:

1.第一步,获取总的行数,然后分支下去进行判断.d大于三亿则拆分,否则只执行一次.

2.第二步,获取拆分的数据信息,生成开始时间与结束时间列表.因为我访问的数据库是vertica,语法与tsql略有差异.

我的示例vsql如下:

select

min(yearmonthday)::varchar as startdate,

timestampadd(day,1,max(yearmonthday))::varchar as enddate

FROM

(

select

sum(count(*)) over(order by run_strt_ts::timestamp::char(10)) as totalcount,

floor(sum(count(*)) over(order by run_strt_ts::timestamp::char(10))/200000000) as lvl,

run_strt_ts::timestamp::char(10)::timestamp as yearmonthday

from schemaname.tablename

group by run_strt_ts::timestamp::char(10)

) AS A

group by lvl order by lvl

生成类似的结果集:

这一步我使用了一个Execute sql task对象,配置为返回Full Result Set,传递一个object类型的变量接收.

刚开始我的设计不是这样的,我使用dataflowtask,然后里面一个ado.net source 去获取数据,传递给一个记录集destination.但总是报如下的异常:

所以我就改用现在的设计.

3.第三步就是使用一个Foreach look container,传递两个变量去接收返回的startdate与enddate.

接着就简单了,装配tsql,传递给一个Execute sql task 任务.

转载于:https://www.cnblogs.com/huaxiaoyao/p/3683245.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/575493.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Linux E325: ATTENTION Found a swap file by the name “./.backu.sh.swp“

Linux E325: ATTENTION Found a swap file by the name “./.backu.sh.swp“

在vi编辑时遇到: E325: ATTENTION Found a swap file by the name "./.backu.sh.swp"错误代码。原因是上次编辑的时候，卡了或者别的原因ctrl c强制退出了。下次进来Linux还是默认进入这个上次强制退出的文件，所以报错。解决方…

阅读更多...

python 函数的参数对应

python 函数的参数对应

作者：Vamei 出处：http://www.cnblogs.com/vamei 欢迎转载，也请保留这段声明。谢谢！ 我们已经接触过函数(function)的参数(arguments)传递。当时我们根据位置，传递对应的参数。我们将接触更多的参数传递方式。回忆一下…

阅读更多...

telnet远程登陆、mstsc远程控制、SSH之间的比较和区别

telnet远程登陆、mstsc远程控制、SSH之间的比较和区别

Telnet与远程桌面mstsc 一演示打开mstsc演示： 01 win r 输入mstsc 02 输入要远程的机子的用户名和密码 03 登录 04 连接开启了，如图即是通过win窗口操作远程机子。以上是使用mstsc打开一个远程连接来通过windows窗口的方式来控制远程机器。 …

阅读更多...

c语言中'.'与'-'的区别

c语言中'.'与'-'的区别

记录学习c语言中遇见的问题。定义的结构体如果是指针，访问成员时就用->如果定义的是结构体变量，访问成员时就用.例如：struct AAA { int a; char b;};struct AAA q; 访问成员就用：q.a;struct AAA *p; 访问成员就用&#x…

阅读更多...

Linux查看已经开放的端口，开放端口遇到防火墙的问题。

Linux查看已经开放的端口，开放端口遇到防火墙的问题。

Linux查看已经开放的端口，开放端口，FirewallD is not running 查看已经开放的端口 firewall-cmd --list-all1 如果出现这种情况说明你的防火墙没有开: 则先把防火墙打开：systemctl start firewalld 扩展内容：. 查看firewalld状…

阅读更多...

内核态(Kernel Mode)与用户态(User Mode)

内核态(Kernel Mode)与用户态(User Mode)

内核态: CPU可以访问内存所有数据, 包括外围设备, 例如硬盘, 网卡. CPU也可以将自己从一个程序切换到另一个程序用户态: 只能受限的访问内存, 且不允许访问外围设备. 占用CPU的能力被剥夺, CPU资源可以被其他程序获取为什么要有用户态和内核态由于需要限制不同的程序之间的访…

阅读更多...

用yum装程序报[Errno 12] Timeout on Trying other mirror.

用yum装程序报[Errno 12] Timeout on Trying other mirror.

使用yum，报错如图下： 记着之前网卡和dns文件都配置好着的，114.114.114.114都加上的。检查了下，发现dns文件的配置不见了。。。。故把 /etc/resolv.conf 中加了如下：然后重点不要重启 service network restart &#…

阅读更多...

JavaScript中的原型和继承

JavaScript中的原型和继承

请在此暂时忘记之前学到的面向对象的一切知识。这里只需要考虑赛车的情况。是的，就是赛车。最近我正在观看 24 Hours of Le Mans ，这是法国流行的一项赛事。最快的车被称为 Le Mans 原型车。这些车虽然是由“奥迪”或“标致”这些厂商制造的&#xff0c…

阅读更多...

Centos7.x 网卡启动报错（Failed to start LSB: Bring up/down networking）

Centos7.x 网卡启动报错（Failed to start LSB: Bring up/down networking）

环境：华为云服务器、 CentOS 7.x 操作是调整网卡配置文件和resolv.conf ，systemctl restart network 重启网络服务总是失败：如下： 按提示看细节： 搜索到还算靠谱的帖子,都说大多都是网卡配置文件配置错误&#x…

阅读更多...

计算机网络复习-OSI TCP/IP 物理层

计算机网络复习-OSI TCP/IP 物理层

我膨胀了，挂我啊~ 作者简介： 每年都吐槽吉师网安奇怪的课程安排、全校正经学网络安全不超20人情景以及割韭菜企业合作的FW，今年是第一年。。 TCP/IP模型先做两道题： TCP/IP协议模型由高层到低层分为哪几层： 这题…

阅读更多...

J2EE的十三个规范

J2EE的十三个规范

J2EE想必大家都不陌生吧，貌似现在更流行将其称作JavaEE，不管名字怎么变，核心和思想是没有变的。学习J2EE首先要了解它的规范，下面我们一起看看它的十三个规范。 1，JDBC（Java Database Connectivity&#xf…

阅读更多...

Xshell登录Linux服务器提示WARNING! The remote SSH server rejected X11 forwarding request 及提示符显示-bash-4.2#

Xshell登录Linux服务器提示WARNING! The remote SSH server rejected X11 forwarding request 及提示符显示-bash-4.2#

用root登录 Xshell 登录Linux服务器提示 WARNING! The remote SSH server rejected X11 forwarding request 以及用户表示符是：-bash-4.2# 而不是user主机名路径的显示方式。首先先查 The remote SSH server rejected X11 forwarding request。解决过程 …

阅读更多...

Q我音乐

Q我音乐

转载于:https://www.cnblogs.com/lovelife20/p/3709191.html

阅读更多...

SRS 启动正常，拉流没画面，看SRS日志报错 srs is already running

SRS 启动正常，拉流没画面，看SRS日志报错 srs is already running

日常启动SRS 出错，如下图：像是已有存在的启动。然后各种停止进程，停止 SRS 服务，日志还是一样的错误提示。各种查进程或者程序是否存在，并且reboot过了。都不行，折腾一番，没解决问题。最终重…

阅读更多...

web开发常用工具介绍

web开发常用工具介绍

web开发工具介绍： 主要浏览器：IE浏览器、火狐浏览器、谷歌浏览器、Edge浏览器、Safari浏览器、Opera浏览器等。浏览器市场份额：http://tongji.baidu.com/data/browser 浏览器内核有四种： Trident内核、Gecko内核、WebKit内核、…

阅读更多...

VB.NET Visual Basic

VB.NET Visual Basic

当看到VB.NET者这本书籍的时候，翻开目录唯一的感受就是：这不和VB一样吗？到底有什么区别呢？ 1）版本： 重新回顾VB，可以发现其实他是Microsoft退出的基于Windows操作系统环境下的软件开发工具&…

阅读更多...

CentOS 7安装Development Tools 失败报错 group tools does not exist. Maybe run: yum groups mark install

CentOS 7安装Development Tools 失败报错 group tools does not exist. Maybe run: yum groups mark install

重装centos，以及迁移时，碰见这个问题。如下图： CentOS 7安装Development Tools 失败报错 group tools does not exist. Maybe run: yum groups mark install 报错图示： 一通尝试。最后如下三行解决。 yum groups mark instal…

阅读更多...

HTML常用标签、特殊字符、路径

HTML常用标签、特殊字符、路径

跳转到邮箱： <a href"mailto:someonemicrosoft.com?subjectHello%20again">发送邮件</a><a href"mailto:someonemicrosoft.com?ccsomeoneelsemicrosoft.com&bccandsomeoneelse2microsoft.com&subjectSummer%20Party&bo…

阅读更多...

VM Ware 虚拟机centos 时间与本地时间不一致

VM Ware 虚拟机centos 时间与本地时间不一致

VM Ware 虚拟机centos 时间与本地时间不一致，如下图。大致是时区设置的问题，设置为中国标准时区即可，CST。解决办法 1.安装时间同步插件 ntpdate yum install ntpdate 2.启动服务 service ntpdate restart 或 systemctl restart ntpdat…

阅读更多...

iOS定位服务与地图开发(3)---地理信息编码查询

iOS定位服务与地图开发(3)---地理信息编码查询

即根据一个NSString的文字描述对象获取相关的地理坐标。采用CLGeocoder类操作，具体方法： 1>geocodeAddressDictionary:completionHandler: 通过指定一个地址信息字典对象参数进行查询 2>geocodeAddressString:completionHandler:通过指定一个地址…

阅读更多...

最新文章