ClickHouse 基础知识整理
参考ClickHouse 官方文档:https://clickhouse.com/docs/en/intro
一:行式存储和列式存储
1.行式存储和列式存储的区别
1.1 概念说明
- 行式存储:指存储结构化数据时,在底层的存储介质上,数据是以行的方式来组织的,即存储完一条记录的所有字段,再存储下一条数据的所以字段,以此类推;
- 列式存储:指存储结构化数据时,在底层的存储介质上,数据时以列的方式来组织的,即存储完若干条记录的首个字段后,再存储这些记录的第二个字段,然后是这些记录的第三个字段,以此类推,当这些记录的所有字段存储完毕后,再按照这种方式,组织存储下一批若干条记录的所有字段;
例如,如下JSON 中,存在标题、作者、发布时间、点赞树,如果把这些数据都按照行存储、按列存储,底层存储的结构是什么样子的?
[{"title":