阿里的DataWorks是这样介绍自己的:

DataWorks(大数据开发治理平台)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。

DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink)、机器学习PAI、图计算服务Graph Compute和交互式分析服务,云原生数据仓库 AnalyticDB for PostgreSQL,云原生数据仓库AnalyticDB for MySQL,并且支持用户自定义接入计算和存储服务。DataWorks为您提供全链路智能大数据及AI开发和治理服务。

您可以使用DataWorks,对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发,最后将处理好的数据同步至其它数据系统。

很早我就是知道DataWorks,甚至几度还有一些合作,不过对DataWorks我一直不是那么感冒,最近因为某些原因,我又开始分析了下DataWorks,我更愿意把DataWorks归结为是一个”失败”的产品。

从部署上来说:

DataWorks提供的功能就是一个写SQL去对数据做处理的能力,再配合一些调度这些周边能力,本质上就是一个:BI工具+调度器,也就是例如Superset+Airflow的能力。但是DataWorks完全无法单机部署,甚至无法低成本部署,私有化部署需要部署一大堆阿里的全家桶,仅仅获得了一些通用能力,部署性价低。

从功能上来说:

DataWorks标榜自己是大数据开发治理平台,首先说开发,这里的开发仅仅是”SQL”,而在大部分龙头企业中,SQL占比非常低。对于notebook能力,DataWorks不具备。其次DataWorks提到自己可以搞治理,但是在界面上看不到任何治理的功能。

比如数据治理至少会涵盖:主数据治理,元数据治理,数据质量治理等等,这些功能DataWorks一个都没有,所以它到底治理的是什么呢?

其次既然叫自己是治理平台,但是没有任何一个地方是展示了”治理”纬度的,那么从业务来说,我任何通过DataWorks知道我正在做的”治理”是在往好的地方走,还是在往差的地方走?

从成本上来说:

DataWorks价格高昂,功能不痛不痒还臃肿,非常不划算。

所以综合下来,DataWorks是一个比较失败的产品,再从客户视角来看,阿里的模式是上云,对于上云不是任何企业都会符合这个方向,大型传统龙头企业都不会考虑上云,中小型互联网企业会考虑上云,但是这些企业预算都会偏少,再其次中小型互联网企业一旦做大,必然会脱离别人的云自己开始搞,字节脱离阿里就是很好的例子。


扫码手机观看或分享: