简介

网名:惊帆,三国名马之一,晋 崔豹 《古今注·杂记》记载:

曹真 有駃马,名为惊帆,言其驰骤如烈风之举帆疾也。

Hive/Kafka contributor,现就职于字节跳动,大数据资深技术专家,前ThoughtWorks中国区首席数据咨询师,DataMesh主推者,多年咨询经验,给众多大厂进行架构设计,拥有较为全面的全栈开发能力,具备大数据组件内核源码开发,且具有独立研发大数据组件的能力。

除了研发技能之外,具备较强的管理和咨询能力,可带领大规模团队,对to B类交付业务全流程有着深刻的理解,多次参与整个交付流程,熟悉交付环节中可能的问题。

  • 火山云大数据产品EMR数据PAAS产品 https://www.volcengine.com/product/emr 技术架构设计者,存算分离架构方案主要负责人。
  • 字节自研缓存系统核心成员 https://www.volcengine.com/docs/6491/149821
  • Hadoop,Hive和Spark内核研发成员。
  • Spark引擎SQL网关服务研发者。
  • Thoughtworks AI PAAS平台Gluon Meson(交界)负责人,专注于大模型应用规模化。

个人技术发展路线

  • 学生期间:迷恋Java和Linux,第一次编程使用的操作系统便是Linux,Linux缺乏应用生态,于是从应用到游戏,都使用Java自我开发:https://mp.weixin.qq.com/s/Zv9KMW7_nTJrO6dmFEdmZw
  • 首次工作:参与跨国(印度)的电商系统构建,在那个时间点,从头领略参与整套微服务架构体系,以及敏捷软件研发,为后续做咨询师打下基础。
  • 14年投入手游:相比应用,游戏对高可用,低延迟,高并发的要求更高,为了追求技术,于是投入游戏服务端开发,参与一家创业公司。
  • 15年投入大数据:经过游戏的经验,隐约感觉游戏产生的大量数据无法得到有效的处理,以及游戏在AI方面的需求很旺盛,特别是机器人和智能NPC,于是投入大数据和AI领域,逐步从技术深入到架构,例如数据PAAS的架构设计,从引擎使用到内核研发设计,且带队做了多个实施。
  • 18年投入AI:有了大数据经验,加上算力的发展,深度学习已经可以逐步进行规模化应用,于是聚焦在AI PAAS,以及深度学习引擎本身的优化,同时参与发起了一款基于Scala的深度学习框架。
  • 21年投入大数据PAAS 云平台:有了众多to B经验,于是投入到了云上大数据PAAS产品的研发。
  • 24年投入大模型PAAS 平台研发:在大模型出现后,逐步意识到,在大模型应用和大模型本身之间,需要有一层PAAS来支持更好的做大模型应用,于是投入到大模型PAAS平台产品的研发。

多年的经验和积累,都随着时间的递增在逐步沉淀,虽然内容会略微变动,但是主题始终唯一。

开源贡献

专业技能

  • 尤其擅长大数据 & AI平台的端到端搭建,参与主导设计过众多数据&AI PAAS平台产品。
  • 熟悉主流如Java/Scala/Python等编程语言以及对应的常用框架,常年作为技术咨询战斗在互联网一线解决不同客户各种技术问题,熟悉微服务架构设计。
  • 对大数据领域有非常丰富的经验,熟悉Hadoop,Spark,SparkStreaming,Flink,搜索引擎等通用组件,拥有相关组件源码开发经验。
  • 熟悉传统机器学习,以及深度学习,熟悉Tensorflow,DeepLearing4j,Keras,Sklearn等常用机器学习和深度学习框架,主讲了深度学习高级算法班系列课程。
  • 带领团队或者客户的团队,解决问题,同时负责团队内部成员技能提升,在团队培养方面拥有比较好的亲和力,帮助多个客户从零开始构建自己的数据团队。
  • 敏捷教练,Devops,在客户很多时候需要充当技术教练,或者敏捷教练,带着团队一起解决问题。同时规范在开发过程中一些不当的行为。
  • 了解安全,区块链,IOT,业余时间折腾了不少智能机器人开发,安全漏洞挖掘等内容。
  • 常年和战斗在客户现场,空闲期间随时参与售前项目,具备基本的售前能力。多次带领超过30+人的团队,传授技术,沟通能力较好,影响力较大。

游戏产品

个人玩具

专利

  • 《一种提高HiveServer2任务级别可靠性的方法》 个人占比40%(感谢队友,自己纯粹辅助)
  • 《一种通过引擎预热方式提升Spark SQL任务效率的方法》 个人占比100%

对外演讲

对外发表文章

ThoughtWorks

字节跳动

外部采访:

联系方式

piaobomengxiang@gmail.com