数据团队的来龙去脉
一个企业到底需不需要数据团队?当然得先限定上下文,否则脱离上下文的需要与不需要就没有意义了,在我看来,只有两类企业需要数据团队,一类是从事数据类技术咨询类企业,一类是从事数据类产品研发的企业。
抛开这两类,其他企业需不需要数据团队?当然不需要,或者说不需要有独立的数据团队,数据是一个领域,数据相关的工作是一项能力,而支撑的东西才是业务。如果把数据团队割离出来,类比一下,到今天还有多少企业有Java团队? 有DBA团队?
参考上面这张图,可以看到软件的发展过程一直是把很多基础设施建设的东西丢出去,让那些专业的产品公司去开发合适的产品,然后留下的技术人员就贴合自己的业务,提供自己的2C或者2B的软件,让它变得很好用。
而产品类的企业,先是提供纯粹的虚拟机托管服务,解决硬件问题,再逐步提供一些容器服务,解决开发人员写的代码还需要软件来运行的问题,伴随着这个发展,这些年来,一个开发人员也不需要会采购硬件,会采购软件,会装系统了,只需要会业务需要的编码语言就好了,这个发展是很合乎情理的。
但是,上面这个发展历程,被搞数据的打的措手不及,因为数据业务,把所有的技术人员,拉回了第一阶段,也就是技术人员需要采购硬件,装软件,配置软件,当年会安装Hadoop,那都算是一门手艺,为什么会出现这个问题?
为什么以前业务系统是Java写的,现在换成Ruby,甚至是go,rust,也没有出现把技术人员拉回第一阶段,而搞个报表,就把技术人员拉回第一阶段了?
如果把数据的工作,以出一张报表来举例的话,如果从技术视角来看,这背后有几大核心原因:
- 计算报表需要的技术,现有的技术人员不太会。
- 现有的云上平台,没有好用的数据类产品(指以前)。
- 计算报表,需要的硬件有点不一样。
如果站在业务或者管理者视角来看,也有几大原因:
- 大数据是在现有业务上突破的,很多人听到大数据是因为知道Hadoop,而不是知道雅虎的那个PDF业务,所以搞不明白这玩意儿是干嘛的,后知后觉,觉了后开始瞎跟风。
- 虽然不明白数据咋搞,但是不能掉队,先激动起来。
- 把数据当成创新类业务,既然创新,那自然要专项得有专门的团队。
在这样的背景下,很多企业于是成立了一个新团队,数据团队,由于基础设施的匮乏,这个团队成立第一天就是采购硬件,安装软件,配置集群,然后倒腾数据。基础设施搞完了,得做业务了,那么怎么定业务?什么业务算数据业务?数据团队有自己的思考,业务团队也有自己的思考,各自的观点是这样的:
- 业务团队:那种非常消耗资源的,苦力体力活,让数据团队去做,他们资源多。
- 数据团队:要把核心业务拿过来,长在我的数据平台上,让业务团队调API就行了。
而关于边界的定义,至今依旧在很多企业内吵的不可开交,且出现生产事故的时候闹的不行,甚至有的数据团队提出了”要比业务更懂业务”的口号,嗯,我也曾违心喊过,这简直就是扯,这就是不可能的事。
数据的事还没理清,AI的浪潮又来了,深度学习全面铺开,不买几块xxTI都不好意思出门,这时候AI又面临同样的问题,又把企业拉回了第一阶段,稍微有点思考的企业觉得AI不过是数据的一种处理方式,把AI全部划入数据团队管。
有的企业干脆再成立个AI团队,于是AI团队又从采购硬件GPU开始,开始新的一个轮回。
扫码手机观看或分享: