本文主要收录一些大数据不错的实践文章
1、数禾云上数据湖最佳实践
https://blog.51cto.com/u_15089766/2601706
该文章介绍了数禾云的数据胡实践,包含presto以及数据湖等组件的一些部署架构,文章听不错的,里面提到了为了避免presto与yarn计算资源之间的互相影响,独立部署了presto集群与hadoop集群
2、Presto高性能引擎在美图的实践 https://jonhuster.blog.csdn.net/article/details/136487794
该文介绍了美图在presto上的一些应用实践
3、大数据存储加速与服务化在Shopee的实践 【Shopee】大数据存储加速与服务化在Shopee的实践 - 从大数据到人工智能
该文介绍了 Shopee在大数据查询上一些优化实践,涉及到presto、Alluxio 等,涉及到一些功能的自定义扩展
4、从 Hadoop 到云原生, 大数据平台如何做存算分离 从 Hadoop 到云原生, 大数据平台如何做存算分离 - JuiceFS 博客
本文介绍大数据行业近几年讨论较多的存算分离的实践,主要是对象存储+JuiceFS
5、Presto在滴滴的探索与实践 Presto在滴滴的探索与实践
本文介绍滴滴公司在 Presto上的一些实践经验