使用CLI进行高速跨域日志复制、历史数据重新索引与数仓投递

背景

使用日志服务是不是常常遇到如下烦恼?

  1. 开启了字段索引却无法对历史日志起作用,而手动重建索引又很困难怎么办?
  2. 需要迁移数据,复制数据到其他区域logstore,写代码实现大并发复制又很复杂怎么办?
  3. 投递日志到OSS/ODPS仅仅对新数据起作用,又想投递历史日志怎么办?

现在使用CLI就可以帮你轻松实现这些操作。

介绍

复制数据(CopyData)支持将特定时间范围内的logstore的数据复制到特定logstore中去。其具备如下一些特点:

  1. 没有索引的数据也可以同步.
  2. 速度快, 易并发, 且支持传输压缩.
  3. 拉取的数据按照服务器接受的时间排序.
  4. 支持跨域、跨项目库复制。
  5. 支持复制数据到同一个logstore(重新索引)。

前提

这里假设已经完成了CLI的安装.

配置多区域账户

首先CLI中配置多个区域账户, 以便后续操作, 这一步也是一次性的. 如果之前已经做过, 这里可以跳过.

这里配置2个域的账户, 一个杭州公有云, 一个北京公有云.

> aliyun configure AKID****123 AKKEY****123 cn-hangzhou.log.aliyuncs.com
> aliyun configure AKID****123 AKKEY****123 cn-beijing.log.aliyuncs.com bj

注意: 这里的最后一个参数, 仅仅用于表明这个账户的名字, 以便后续使用. 不传入默认是main, 也是默认使用的账户, 这里使用杭州的账户作为默认账户.

参考:

  • 关于秘钥的配置, 可以参考配置
  • 关于日志服务在各个域的Endpoint地址, 可以参考入口服务

重新索引

如果因为某些特定原因,某个时间范围内的日志没有建立索引,无法被查询和统计。可以如下操作将日志重新写入,就可以实现重新索引的效果。

例如:

aliyunlog log copy_data --project="源project" --logstore="源logstore" --from_time="2018-09-05 0:0:0 CST" --to_time="2018-09-06 0:0:0 CST"

这里将杭州区域的源project源logstore中服务器在时间范围["2018-09-05 0:0:0 CST","2018-09-06 0:0:0 CST")内接收到的数据,重新写入到源logstore中去。

注意:
这里仅仅是复制一份数据进入目标logstore,并在写入时自动对其索引,原来的没有被索引的日志依然存在。

跨区域复制数据

有时需要将某一个logstore的日志迁移到另外一个logstore中去时,可以如下操作:

准备好目标logstore

假设目标logstore已经创建好了,并且配置好了索引。这一步操作可以在Web控制台完成,也可以通过CLI的复制logstore配置来完成,或者使用CLI的create_logstore创建日志库,再配置索引,通过命令get_index_config获取索引,调用命令create_index来实现。

复制数据

例如:

aliyunlog log copy_data --project="源项目" --logstore="源logstore" --from_time="2018-09-05 0:0:0 CST" --to_time="2018-09-06 0:0:0 CST" --to_project="目标project" --to_logstore="目标logstore" --to_client="bj"

这里将杭州区域的源project源logstore中服务器在时间范围["2018-09-05 0:0:0 CST","2018-09-06 0:0:0 CST")内接收到的数据,写入到北京区域的目标project目标logstore中去。

注意:
这里用--to_client指定操作目标project的账户为bj,是前面前提中配置的账户名。

投递历史日志到OSS/ODPS

日志服务的投递任务配置好后,仅仅对新接受数据产生作用。这里也可以借助复制数据来实现投递历史日志的效果:

  1. 创建一个临时的logstore(不需要配置索引)
  2. 在临时logstore上配置投递OSS/ODPS的任务
  3. 复制需要投递的日志到目标logstore
  4. 投递结束后,删除临时logstore

时间格式

时间格式推荐是%Y-%m-%d %H:%M:%S %Z, 如2018-01-24 17:00:00 CST, 但也支持其他合法的时间格式, 例如:Jan 01 2018 10:10:10 CST

注意: 时区不仅可以是CST,如果发现拿不到数据,可以改成特定时区例如 UTC-8 或者 UTC+8

CLI还支持更多其他格式的时间格式,例如2 day ago等,参考这里.

时间范围

传入的时间范围, 需要注意几点:

  1. 这里的时间指的是服务器接受日志的时间
  2. 时间的范围是左闭右开[), 上面例子中16:00:00服务器接受到的日志会被拉取到, 但是17:00:00服务器所接受到的日志不会.

特殊的时间范围

有时我们不关心数据的某一边界, 例如期望获得所有存储的数据到某一天日期位置. 或者获取从某一天开始到目前存储的数据为止的话, 就可以使用特殊游标.

特殊游标包括beginend. 例如:

aliyunlog log copy_data --project="p1" --logstore="l1" --from_time="begin" --to_time="2018-01-24 17:00:00 CST" --to_logstore="l2"

这里复制所有2018-01-24 17:00:00 CST之前服务器接收到的日志到logstorel2

又例如:

aliyunlog log copy_data --project="p1" --logstore="l1" --from_time="2018-01-24 17:00:00 CST" --to_time="end" --to_logstore="l2"

这里复制所有2018-01-24 17:00:00 CST开始及之后服务器接收到的日志到logstorel2

进一步参考

  • 阿里云日志服务
  • 阿里云日志服务CL


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521130.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java map大小_Java中HashMap的size()方法: HashMap.size() - Break易站

Java中的HashMapHashMap类的java.util.HashMap.size()方法用于获取哈希映射HashMap中映射的大小,该映射引用Map中键值对或映射的数量。句法:Hash_Map.size()参数:该方法不接受任何参数。返回值:该方法返回映射的大小,这…

gitee提交代码_git 版本控制,github和gitee

3.4 git 版本控制# 查看本地状态git status # 修改README.txt ,添加一行,保存,添加到暂存区git add README.txt # 查看当前仓库某一个文件的版本git diff README.txt# 提交到本地仓库git commit README.txt -m second Commit# 查看当前仓库某一个文件版本…

IT 拉呱室 | 论我遇到的最刺激的bug【长期福利站】

戳蓝字“CSDN云计算”关注我们哦!套路的最高境界是没有套路:这是一个只送福利的长期互动栏目【如果你们让我尴尬,我就哭给你们看】。书籍、键盘、鼠标、鼠标垫、CSDN 20周年纪念T恤、技术沙龙门票、线上公开课名额……你敢一直在,…

“百变”Redis带你见识不同场景下的产品技术架构

2018飞天技术汇24期-云数据库Redis产品发布会,由阿里云数据库技术组技术专家王欢、怀听、梁盼分别带来以“Redis全球多活产品”、“Redis混合存储产品”、“Redis多线程性能增强版”为题的演讲。本文对Redis进行了简单的介绍,进而针对不同的应用场景研制…

【基于注解方式】Spring整合Kafka

文章目录1. 添加Maven依赖2. 配置与参数分离3. 工具类度内容4. Producer 消息生产者配置5. Consumer 消息消费者配置6. 使用注解监听消息7. 请求测试8. 测试结果1. 添加Maven依赖 <!-- 添加spring-kafka支持 --> <dependency><groupId>org.springframework.…

阿里云PyODPS 0.7.18发布,针对聚合函数进行优化同时新增对Python 3.7支持

近日&#xff0c;阿里云发布PyODPS 0.7.18&#xff0c;主要是针对聚合函数进行优化同时新增对Python 3.7支持。 PyODPS是MaxCompute的Python版本的SDK&#xff0c;SDK的意思非常广泛&#xff0c;辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做“SDK”。 PyODPS在这…

centos安装rabbitmq_【SpringBoot MQ系列教程】RabbitMq 初体验

SpringBoot 系列教程之 RabbitMq 初体验​mp.weixin.qq.commq 在异步解耦削峰的优势非常突出&#xff0c;现在很多的项目都会用到&#xff0c;掌握 mq 的知识点&#xff0c;了解如何顺畅的使用 mq&#xff0c;可以说是一个必备的职业技能点了接下来我们进入 rabbitmq 的学习过程…

java rpc与webservice_RPC体系,RPC和WebService的区别详解

RPC和WebService的关系RPC(Remote Procedure Call)— 远程过程调用&#xff0c;是一个很大的概念, 它是一种通过网络从远程计算机程序上跨语言跨平台的请求服务&#xff0c;rpc能省略部分接口代码的开发&#xff0c;可以跨机器之间访问对象(java rmi)&#xff0c;可以有更方便的…

免费公测中-GPU数据库SQream DB正式上线云市场

业内领先的GPU 数据库服务SQream DB在阿里云云市场正式开启免费公测&#xff01;SQream DB是一款由阿里战略投资的以色列SQream公司提供&#xff0c;能够支撑海量数据高速分析的业内领先的GPU数据库。通过将计算密集型操作卸载到GPU上&#xff0c;与业界的解决方案相比&#xf…

唏嘘!2019榜单出炉:铁打的Python连续3年第一,它居然跌出前十?

IEEE Spectrum2019年度编程语言排行榜最近刚刚出炉&#xff0c;Python不出意外的又拿了个第一&#xff0c;但是意料之外的是&#xff0c;曾经大火的PHP&#xff0c;居然跌出了前十&#xff01;PHP曾被大家称为“世界上最好的编程语言”&#xff0c;去年排名第六&#xff0c;前年…

centos7无法使用epel的解决方法

使用如下代码在centos7安装epel源&#xff0c;却无法使用。 yum -y install epel-release网络没问题&#xff0c;可以ping通epel源的地址&#xff0c;但是就是连不上repo&#xff0c;报错。 解决方法&#xff1a;编辑/etc/yum.repos.d/epel.repo&#xff0c;将epel配置信息中…

阿里云ECS家族再添新成员,推出密集计算型实例规格族ic5

去年&#xff0c;阿里云正式发布云服务器ECS企业级产品家族&#xff0c;推出面向173种企业应用场景的19款实例。适合在复杂的企业计算环境下&#xff0c;满足对于高性能、高可靠的计算需求。 时隔近一年&#xff0c;回看ECS企业级产品家族已经发展到30款实例&#xff0c;近日再…

findbugs插件_Intellij静态代码扫描插件SpotBugs

最近要做Java静态扫描的部分工作&#xff0c;之前是在Jenkins上使用findbugs插件完成的&#xff0c;但是由于现在Jenkins权限收回和Java代码权限的放开(我也搞不懂这两者的关联性)&#xff0c;目前打算在本地完成静态代码扫描工作。选来选取还是选择在Intellij中用插件来完成&a…

一张图看懂智联车管理云平台

智联车管理云平台&#xff08;IoV Command Center&#xff0c;简称IoV CC&#xff09;是阿里云面向智联车领域&#xff0c;专门推出的车辆全生命周期云端管理平台&#xff0c;旨在赋能车厂转型出行服务商&#xff0c;提高运营效率、降低自建成本。 传统模式下&#xff0c;车辆…

刨根问底 | 红遍全网的SD-WAN,到底是个啥?

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 小枣君责编 | 阿秃作为一个热门概念&#xff0c;SD-WAN近年以来频繁地出现在我们的视野当中。很多人说&#xff0c;它是未来最具发展潜力的通信技术之一&#xff0c;极具商业价值。行业里的老牌通信设备商和运营商对它一致看…

centos7安装rabbitmq简单方式

安装rabbitmq前要准备的基础环境 yum install build-essential openssl openssl-devel unixODBC unixODBC-devel make gcc gcc-c kernel-devel m4 ncurses-devel tk tc xz tcp_wrappers需下载的安装文件如下 ## erlang wget www.rabbitmq.com/releases/erlang/erlang-18.3-1.…

java socket数据传输_Java Socket编程(一) Socket传输模式

Java Socket编程(一) Socket传输模式文章来源&#xff1a;ASPCN 作者&#xff1a;孙雯Socket传输模式Sockets有两种主要的操作方式:面向连接的和无连接的.面向连接的sockets操作就像一部电话,他们必须建立一个连接和一人呼叫.所有的事情在到达时的顺序与它们出发时的顺序时一样…

车联网上云最佳实践(一)

一、车联网行业特性讲解 最近两年车联网发展受到政府部门、科研院以及各大互联网巨头的广泛关注和积极推动。从应用来看&#xff0c;主要包括两种模式&#xff1a;一是前装模式&#xff08;即车辆出厂前安装&#xff09;&#xff0c;是乘用车厂主导或者与有相关能力的公司合作&…

python3 网站状态监控_基于python3监控服务器状态进行邮件报警

在正式的生产环境中&#xff0c;我们常常会需要监控服务器的状态&#xff0c;以保证公司整个业务的正常运转&#xff0c;常常我们会用到像nagios、zabbix这类工具进行实时监控&#xff0c;那么用python我们怎么进行监控呢&#xff1f;这里我们利用了python3调用psutil和yagmail…

Centos7 安装Rabbitmq-server和Erlang 仓库汇总

新版本链接rabbitmq-serverhttps://github.com/rabbitmq/rabbitmq-server/releaseserlanghttps://github.com/rabbitmq/erlang-rpm/releasesrabbitmq-server和erlang版本对照https://www.rabbitmq.com/which-erlang.html 旧版本链接erlanghttps://www.rabbitmq.com/releases/e…