-
高性能:用全并行的MPP架构数据库,业务数据被分散存储在多个节点上,数据分析任务被推送到数据所在位置就近执行,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。
-
易扩展:Shared-Nothing开放架构,可随时根据业务情况增加节点,扩展系统的数据存储能力和查询分析性能,扩容期间业务不中断。
-
存储:行存(更好的点更新和点查询)、列存(更优的数据压缩比、更好的索引性能)、表分区(可以将大型表按照特定的规则分割成更小的子表,有助于提高查询性能。这在大规模数仓中处理海量数据时非常重要)
-
外表:支持外部表和外部数据源的概念,可以通过外部表引用外部数据,而不必将其导入数据库中。这有助于实现对多种数据源的集成查询。(湖仓一体的体现)
-
丰富的函数:支持在查询中进行复杂的数据分析和聚合操作。这对于处理数据仓库中常见的分析型查询非常有用。
-
数据类型:如数组、JSON、文本搜索等。这使得在数仓中可以更灵活地存储和查询半结构化或非结构化数据,适应各种数据模型的需求。