科技

Datablau王琤:数据治理助企业稳筑数据“地基” 实现数据资产价值|Xtecher项目

字号+ 来源:Xtecher 2017-06-19 12:05 我要评论

祝福语大全春节祝福语 | 亲人 | 父母 | 同事

Xtecher【错别字基金】温馨提示:如果您在阅读过程中发现错别字,请在文章底部留下说明+联系方式,我们会立刻发给您5-88元随机红包一个,同样的红包会发给文末留言点赞最高者。

Xtecher【错别字基金】温馨提示:如果您在阅读过程中发现错别字,请在文章底部留下说明+联系方式,我们会立刻发给您5-88元随机红包一个,同样的红包会发给文末留言点赞最高者。

作者|欣彤lirs

编辑|陈光

网址|www.xtecher.com

微信公众号ID|Xtecher

企业数据“烟囱”急需打破

“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

在被信息化浪潮包裹的今天,大数据已悄然成为企业的重要资产之一。然而,企业内部的数据“孤岛”尚未完全被打破,部分企业仍处于互不相通的状态,数据只有流通和连接,才能实现它的价值。

企业的数据资产在实现其价值之前,就必须要经过数据收集、数据准备、数据分析、利用数据做决策等阶段。对数据的全生命周期进行治理。

数据准备,在整一个数据分析及其企业根据数据做决策这流程中,是一个最基础的阶段。我们可以理解为,它扮演着建筑业中的“打地基”角色,“地基”打得越扎实,工程的后续阶段才能有条不紊地进行。

规模较大的企业内部通常会有上百个业务系统、数据库,数据环境极其复杂。在进行数据分析之前,必须把这些互不相通的数据进行抽取、清洗和整理等工作,数据才能达到可用、可信的程度,进而令后续的数据分析实现其商业价值。因此,数据准备工作的重要程度便不言而喻。

然而,纵观中国国内大数据市场,专注于数据准备和清洗工作的企业,寥寥无几。

这是一个市场契机,但机会只会青睐真正做好一切准备的人。

“十年磨一剑”

2016年年底,王琤离开了他倾注了十年岁月的CA公司,与曾经的队友朱金宝共同创立了Datablau(北京蓝图明册科技有限公司)。CTO朱金宝曾经在CA担任ERwin总架构师,并被王琤称为是“一个有情怀有坚持有梦想”的人。王琤与朱金宝在CA研发的作品就是广为人知的ERwin数据建模产品。作为数据治理市场的领导者,他们始终保持全球视野,专注打造全球技术与理念领先的产品。

“我刚进CA的时候,上级考虑在中国成立一个新的ERwin研发团队,我是这团队里的第一位工程师。”王琤带着自豪的语气告诉Xtecher。经过两年的努力和磨砺后,由王琤带领的ERwin中国研发团队在原有成立多年的美国、印度团队间大放异彩,一举成为ERwin研发的主导力量。最终,所有代码贡献都来自中国团队。

ERwin数据建模过去曾经为不计其数的大企业提供数据服务。“因为Erwin是全球市场排名第一的数据建模的产品,像美国银行、摩根士丹利、迪斯尼等世界500强大部分企业都是我们的客户。”王琤向Xtecher表示他过去十年带领的ERwin研发团队获得了世界500强企业的长久信任。

在中国,ERwin数据建模产品也被运用在数据环境复杂的大规模企业,如建设银行、中国航空、深圳证券交易所、上海外汇交易所等。王琤向Xtecher解释,“只要你的企业规模很大,数据环境很复杂,都需要我们这个东西。”数据环境复杂,这是ERwin猛然击中的行业痛点。

所谓“十年磨一剑”,这十年呕心沥血研发的成果中,有哪些能够为如今Datablau提供借鉴?

“我以前在CA有三个美国的专利,关于非关系型数据库如何建模,及关系型数据库到非关系型数据库之间数据如何转换、迁移方面,”王琤回忆他在CA那十年所收获的累累硕果,为现在创立Datablau奠定了极其重要的技术基础。王琤进一步向Xtecher细述,“Datablau团队了解数据库的所有重要特征,table、column、partition、index、primary key,以及它们的部分业务属性,这是我过去十年在做Erwin时的一个积累。”

理解存量数据业务含义

是大数据解决方案之本

为什么Datablau能专注做好数据准备?

“我们的强项在于对每个数据库的特性足够透彻地理解”,王琤给予Xtecher这个简洁明了的理由,但这个原因的背后其实并不简单。

Datablau在数据准备此阶段中,充分理解Oracle、DB2等数据库的分区方式、数据特性等方面。打个比方,若Oracle的分区方式以及数据特性,若换到DB2会呈现什么样的方式?数据类型如何转换?它的存储方式是按列存储还是按行存储?这些就是Datablau最擅长的拿手好戏,凭借对每一个数据库的透彻深入理解,Datablau才顺理成章地实现它数据准备的角色,把企业每个业务部门的数据从不同的数据库抽取出来,根据概念等分类进行整合。从而实现企业不同部门之间数据的流通、互连,打破数据“孤岛”,为企业的下一步数据分析等工作奠定坚实基础。

一个较大规模的企业,通常会有上百个业务系统、成千上万张表单,如此复杂的数据环境,若单靠人工整理,付出的时间和人力成本想必是难以估计的。

在CA工作期间,王琤曾经利用数据建模来帮助中国建设银行(以下简称“建行”)解决数据治理这个难题。建行业务系统里存在很多设计完全的不同数据库,利用其技术把建行100多个业务系统的数据进行整理搭建新的企业级统一数据架构。

王琤向Xtecher讲述了一个案例,“我们抽出来7千多张表。这7千多张表里有100张表都称为‘客户’, 但只有80张表来自于CRM、ERP系统,是真正意义上的客户。另外20张表也称为‘客户’表单,来自于HR部门系统,但HR系统里的‘客户’其实是公司员工,并非真正客户。”同名异义、异名同义的问题非常普遍。 但往往需要巨大的人力成本。

如果要用传统的人工方法去完成这项任务,则需要IT人员与业务人员同时合作在表单里对数据进行挑选、归类和整合,工程量可见十分庞大。

当企业安装部署了Datablau之后,IT人员只需将各数据源与平台进行连接,自动获取或手动设置存量/增量数据模型后,下一步就让数据科学家进行业务视图设计和样例数据分析设置,完成了数据准备后便自动生成可视化的数据报表。王琤对此曾表示,“能够将各环境下的数据放在同一平台,并用可视化工具进行处理分析,可以极大减少企业在这方面的资源投入。几分钟抽取数据模型、即时跑出数据分析报表。”

王琤告诉Xtecher, Datablau可以将两年时间投入约3亿元的某金融数据治理项目,缩减到只需要约两个月时间,再加少量额外人工辅助便能完成所有数据抽取和整合工作。

此外,王琤还表示,“经过数据准备整理好的存量数据集不仅可以交付给企业,也可‘喂’给BI与AI产品,进行深度分析和挖掘,产生深度业务价值。这是Datablau区别于市场上专注数据分析的大数据产品的特别之处。”

王琤(左一)、朱金宝(右一)与DAMA China主席胡本立

Datablau要为企业淘更多的“金”

王琤把Datablau比喻为“是挖掘金子的工具,帮助企业去淘更多的‘金’。”寓意是为更多企业挖掘出可利用的数据,并快速实现数据的价值。

目前,最新版的Datablau v1.5版本已经开放了免费试用。Datablau在产品不断迭代和推广过程中,自然而然地受到了资本的青睐。

一个值得关注的消息,Datablau在2017年2月中旬获得了美国中经合集团的天使轮融资,融资金额为600万元。

Datablau通过软件产品提取企业数据资产地图,再进行敏捷数据准备和分析为企业提炼产数据价值,让数据可见、可识、可控、可融,更易挖掘价值。

大规模的企业,数据环境复杂,数据需要流通才能实现其价值。因此,Datablau瞄准这一行业痛点,启动了To B的商业路线。

私人订制,不仅流行于To C,同样也适用于To B。对于不同的企业数据状态,Datablau会为它匹配相对应的datablau产品。王琤告诉Xtecher,“数据分几种阶段,第一种是企业数据已经收集完毕,正在做数据仓库的阶段,我们会为这种企业提供数据敏捷准备版本。”在数据敏捷准备版本中,Datablau的角色更像是一个数据高效搬运工,把所需数据进行集成、转换、清洗,最后搬到某个目标数据源里,从而为IT人员提高业务效率。

第二种企业如果在数据仓库建完了的,Datablau会为它提供数据交付版本,数据交付版本主要为企业不同部门的数据进行数据流通和可用、可信,最终生成一个面向某个部门或群体的数据集,供业务人员下载报表和进一步数据挖掘,为企业决策提供数据支持。

Datablau针对不同数据状态的企业,为其匹配相对应的最优数据解决方案。

在炙手可热的大数据行业内,许多公司会考虑提供“一站式服务方案”,但王琤有着他独特的见解,他认为,大数据技术公司不一定要做到“大而全”,哪怕只是将数据资产管理这一阶段的业务做到“小而精”,在市场上也能风生水起。

王琤对挑选客户企业也有周全的考虑,他告诉Xtecher,“Datablau的目标是做产品驱动型企业,抱着匠心打造高质量高客户满意度的产品。如果对方客户企业的刚需和datablau产品的匹配度达到70%以上,我们很乐意进行合作。”目前,Datablau最新版v1.5版本已经应用到制造业、医疗业以及金融业等行业领域,为更多不同领域的企业挖掘并实现其数据的价值,“淘”更多的金。

在今年过去的半年里,Datablau对产品发展方向进行了验证和探索,并得到一定的优化,那么在接下来的2017年下半年,王琤表示Datablau会侧重于加大对市场推广的投入,并寻求与大数据BI厂商的合作。Datablau将渗透到更多不同的行业领域,为更多大规模企业解决数据准备、数据清洗、数据交付等数据资产管理问题。

“踏踏实实地做好Datablau产品”,王琤希望Datablau未来继续“专注这‘小而精’的业务领域,为企业的数据实现可用、可信,并带来更多商业价值。”

━━━━━

封面来源:Datablau  排版:陈光  校对:米琪

━━━━━

Xtecher官网平台现开通认证作者,

有发稿意向的个人或媒体,可联系微信:jueshao121

(添加好友请注明公司、职位、事由)

点击 | 关键词 | 查看对应内容

Xtecher 精品文章

 人 物 

大健康

人本健康 陈恂 | Haplox 许明炎

奇云诺德 罗奇斌 | 基准医疗 范建兵

人工智能

快乐智慧 雷鸣 | 出门问问 李志飞

达闼科技 黄晓庆(上) | Rokid 黄伽卫

驭势科技 吴甘沙 | 格灵深瞳 赵勇 

地平线 方懿 | 彩云天气 袁行远

车和家 李想丨51猎头 刘维

Face Think 杨松帆 | 中科视拓 山世光

深鉴科技 汪玉 | 越疆科技 刘培超

Kneron Inc 刘峻诚 | MINIEYE 刘国清

地平线 黄畅 | 三角兽 亓超

极限元 马骥 | NXROBO 林天麟

灵喵 韩龙 | 云脑科技 张本宇

创来科技 陈茂 | 轻客智能 庞琳勇

虚拟现实

诺亦腾 戴若犁 | 大朋VR 陈朝阳

Ximmerse 贺杰 | Pico 周宏伟

焰火工坊 娄池 | HTCVR 汪丛青 

七鑫易维 彭凡 | 影创科技 孙立

所思科技 罗子雄 | 凌宇智控 张道宁

Dexmo 谷逍驰

大数据

中网数据 孙远根 | 昆仑数据 陆薇

永洪科技 何春涛 | 华农天时 温晗秋子

GrowingIO 张溪梦 | ThinkingData 吕承通

神策数据 桑文锋 | 海云数据 冯一村

佳格数据 张弓 | 普林科技 王储

Datatist 宋碧莲 | 职品汇 龚才春

星环科技 孙元浩 | 人才易 葛昊

航空航天

零壹空间 舒畅 | 天仪研究院 杨峰

Fintech

数库科技 刘彦 | Ping++ 金亦冶

abc Fintech 杨永智 | 奇点机智 宋嘉伟

芥末金融 彭晨 | 蓝海智投 刘震

海鲸金融 丁华昆 | 资易通 盛洁俪

其他科技创业者

科幻作家 郝景芳 | Vinci 宋斯纯

禾赛科技 李一帆 | 诸葛io 孔淼

奥图科技 叶晨光 | 瀚诺半导体 张诚

51猎头 刘维 | 腾展科技 魏松祥

墨刀 张元一 | Phresh Amit

品类 唐十三 | 布比 蒋海

Plug and Play Saeed Amidim

集智俱乐部 张江 | NVIDIA 黄仁勋

 特 写 

人工智能

禾赛科技,加入无人车大战

如果太太说“今晚请使用机器人吧”

奇点汽车强势启动智能驾驶布局

透视Rokid:两度斩获CES大奖背后

语音助手“小不点”可行吗?

人工智能:付不起的工资,抢不到的人巨头之争,无人驾驶尖峰对决

唇亡齿寒,人工智能一场艰难“拔河”

2016中国最具投资价值人工智能项目Top 100 

直播鉴黄:堵塞出口还是守护高贵

国内智能驾驶Top20

无人驾驶若干问题

渡鸦科技被百度收购的过程

创业群像

“买买买”狂潮下物流巨链的前生今世

类定律:1年成为1亿美元公司的背后

华强北困局:离席的人,守望的人

区块链创业者们:黎明之前的那一刻

不开源的区块链都是“耍流氓”

华人对冲基金鼎新资本

一下科技通往纳斯达克之路

航空航天

“潇湘一号”科学实验卫星升空

融资逾亿,零壹空间与它的火箭长征

Fintech

智能投顾:理性更多,还是赌性更多硅谷投资人:真正的AI还得再等等

toC or toB谁的终结,谁的胜利

虚拟现实

Magic Leap:给科技创业公司耐心

如果你拥有高精尖科技创业项目,Xtecher将为你提供:

1.专业的科技人物特稿和视频拍摄

2.在Xtecher官网、APP、微信的全方位展示

3.最专业的科技圈投资人、政府资源、产业资源

4.创业企业品牌管家与PR服务

即刻扫码,联系我们。

微信号:Xtecher

关注未来的人

都关注了Xtecher

   栏目推荐   

Xtecher联合喜马拉雅,推出科技音频脱口秀《甲小姐说》。在本专辑中,甲小姐将不断给你们讲讲科技创业圈里面,有趣、有料、有干货的内容,满足你的小好奇。 

甲小姐第二十一期新鲜出炉:《创始人离场:这不是Uber一家的困境》

▼  ▼  ▼

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

网友点评
祝福语大全春节祝福语 | 亲人 | 父母 | 同事
你感兴趣的
祝福语大全春节祝福语 | 亲人 | 父母 | 同事