四、云原生数据湖最佳实践最佳实践,以DLA为例子 。DLA致力于帮助客户构建低成本、简单易用、弹性的数据平台,比传统Hadoop至少节约50%的成本 。其中DLA Meta支持云上15+种数据数据源(OSS、HDFS、DB、DW)的统一视图,引入多租户、元数据发现,追求边际成本为0,免费提供使用 。DLA Lakehouse基于Apache Hudi实现,主要目标是提供高效的湖仓,支持CDC及消息的增量写入,目前这块在加紧产品化中 。DLA Serverless Presto是基于Apache PrestoDB研发的,主要是做联邦交互式查询与轻量级ETL 。DLA支持Spark主要是为在湖上做大规模的ETL,并支持流计算、机器学习;比传统自建Spark有着300%的性价比提升,从ECS自建Spark或者Hive批处理迁移到DLA Spark可以节约50%的成本 。基于DLA的一体化数据处理方案,可以支持BI报表、数据大屏、数据挖掘、机器学习、IOT分析、数据科学等多种业务场景 。
文章插图
推荐阅读
- 阿里云服务器域名解析方法 阿里云服务器域名绑定空间
- 淘宝怎么申请退款 淘宝阿里巴巴如何申请退款?
- 阿里云盘收费标准 阿里云磁盘扩容数据丢失
- 阿里云监控软件推荐 阿里云应用商店字在哪里
- 阿里巴巴跨境电商入驻条件 阿里云授权服务中心是干嘛的
- 大文件 现在有哪些免费大容量的网盘?
- 消息属实 阿里回应旗下App接入微信支付
- 阿里云轻量应用服务器 云saas是什么意思
- 阿里云服务器免费体验 阿里云学生认证教程
- 永久免费云储存空间 阿里云存储收费标准