2018年9月大数据计算服务 MaxCompute 又发布新功能啦!
【新功能】MaxCompute窗口函数支持WINDOW_CLAUSE
参考文档
适用客户
数据开发人员在进行数据开发过程中,用到调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxCompute在该版本中支持WINDOW语句预定义窗口,避免了这一现象。
发布功能
为了避免多次调用window函数窗口时,SQL里反复写上OVER语句会显得冗余,MaxCompute在该版本中支持WINDOW语句预定义窗口。
【新功能】子查询支持SCALAR SUBQUERY
参考文档
适用客户
适用于数据开发人员,在做数据开发时,遇到SUBQUERY的输出结果为单行单列的时候,可以当做标量来使用。
发布功能
MaxCompute SQL 中当SUBQUERY的输出结果为单行单列的时候,可以当做标量来使用。
【新功能】MaxCompute SQL-支持OUTER LATERAL VIEW
参考文档
适用客户
适用于数据开发人员,在做数据拆分的同时进行聚合的需求时,使用Outer Lateral View功能和split、explode等UDTF一起封装使用。
发布功能
Lateral view通常和split、explode等UDTF一起封装使用,它能够将一行数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。
Lateral view首先为原始表的每行调用UDTF,UDTF会把一行拆分成一行或者多行,Lateral view再把结果聚合,产生一个支持别名表的虚拟表。
Lateral view outer:当table function不输出任何一行时,对应的输入行在Lateral view结果中依然保留,且所有table function输出列为null。
【新功能】MaxCompute 支持使用UDJ(User Defined Join)自定义SQL的Join操作
参考文档
适用客户
数据开发人员在遇到很多跨表操作的需求时,原来要依赖于内置join + 各种UDF/UDTF+复杂的SQL语句来完成,一些情况下还只能完全自定义MR来完成,这两个方式门槛高且执行效率低。MaxCompute在UDF框架中新近引入的一种新扩展机制:UDJ(User Defined Join),来实现灵活的跨表、多表自定义操作,同时减少不得不通过MR等方式对分布式系统底层细节的操作。
发布功能
MaxCompute在UDF框架中新近引入的一种新扩展机制:UDJ(User Defined Join) 来实现灵活的跨表、多表自定义操作,同时减少不得不通过MR等方式对分布式系统底层细节的操作。
【新功能】MaxCompute支持使用UDT在SQL中直接引用第三方语言的类或者对象,获取其数据
参考文档
适用客户
适用于数据开发人员在进行数据开发过程中,为了实现一些简单的功能而用到第三方语言的类或对象时,之前只能使用UDF这个过程繁杂的方式,通过UDT则可以直接在SQL中直接调用,提升了SQL语言编译过程的易用性与语言的表达能力,进而提升数据开发人员的工作效率。
发布功能
MaxCompute的UDT提供了调用第三方库的功能,不需要用特殊的DDL语法来定义类型的映射,直接在SQL中使用。
【新功能】国际站开启FullScan限制功能
参考文档
适用客户
追求成本控制的MaxCompu用户。
发布功能
通过限制全表扫描,可以控制SQL/MR计算量,避免用户因暴力扫描导致的贵账单。
【体验优化】MaxCompute优化器(Optimizer)性能提升
MaxCompute优化器(Optimizer)基于MaxCompute-bench测试集合整体性能在生产环境可以提高约7%。
优化功能
1、Advanced Shuffle Remove:可以支持Sorted Merge Join和Sorted Aggregate的排序和分布属性被后续操作利用,从而减少Shffle操作。
2、Dynamic Parallelism: 对运行时的数据量动态估计reduce数量。
3、Auto Map Parallelism:Map split size支持列裁剪和压缩比估计。
4、Map Join小表汇集: Map Join小表将首先汇集到单节点,提升broadcast的效率。
5、多处优化性能调优:分区裁剪、代价估计算法的性能有多处调优,优化做得更快。
6、更完整的Join Grouping。
【新地域/可用区】大数据计算服务 MaxCompute 英国(伦敦)节点正式开服售卖
现在开通
大数据计算服务 MaxCompute 英国(伦敦)节点开服售卖。 可在国际站、中文站、日本站购买迪拜节点资源,在控制台按需求开通project。
原文链接
本文为云栖社区原创内容,未经允许不得转载。