佘晖认为在大数据时代,关系型数据库或将被Hadoop解决方案取代。
传统上,一个高端大气的数据中心,IBM的小型机、Oracle(中文译为甲骨文)的数据库以及EMC存储设备,可以说缺一不可。由这三驾马车构成的从软件到硬件的企业数据库系统,几乎占领了全球大部分企业级数据库系统市场份额。
大数据时代让IOE(IBM、Oracle、EMC)看似牢不可破的市场地位开始动摇。在星环科技总经理佘晖看来,传统数据库对海量数据的处理性能并不理想,大数据时代需要新一代数据库产品,终将有新公司取代Oracle的市场地位。
Hadoop开源架构逐渐深入适应企业环境,其疯狂的发展势头已无法阻挡。独立分析机构Forrester Research公司发布的《Forrester浪潮:大数据Hadoop解决方案》报告显示,Hadoop全新独特的数据管理方案正在帮助企业变革大数据存储、处理、分析及共享的方式。不久前在美国,Hadoop领域里代表性公司之一的Cloudera获得F轮融资,融得9亿美元,估值达到41 亿美元。Cloudera之所以能够达到高估值,是因为资本市场看到其可能会取代Oracle的市场地位。这样的产业趋势对中国也影响深远。2013年,曾任Intel数据中心软件部亚太区CTO的孙元浩看准这个趋势,创办了星环信息科技(上海)有限公司(简称星环科技),专注为企业开发Hadoop发行版。2013年底,星环科技发布了国内首个全面支持Spark和Hadoop2.0的大数据平台软件——Transwarp Data Hub(TDH)。Spark作为一个通用的并行计算框架,已经成为继Hadoop之后又一大热门开源项目。
短短一年间,星环科技就被资本市场看中,并于今年中成功获得近千万美元规模的A轮融资。自此,以星环科技为代表的中国Hadoop发行版厂商真正确立,并开始形成国外以Cloudera为代表,国内以星环科技为代表的Hadoop 发行版行业态势。
星环科技创始团队在Hadoop发行版领域起步早。佘晖介绍,TDH是国内落地案例最多的Hadoop数据管理软件,用户在用的项目已经超过数十个。通常来说,要挖掘大数据价值应用到各行各业,需要一个硬件供应商提供硬件,一个软件供应商提供数据库,并由数据挖掘供应商提供算法。星环科技发布的TDH可以看做是大数据时代的新型数据库。
由于TDH融合了Spark和Hadoop2.0两种先进技术,TDH处理数据性能并非传统数据库乃至开源Hadoop可比拟。据介绍,TDH能够处理10GB到100PB的数据,传统Hadoop适用面为100TB以上(1TB=1024GB)。值得一提的是,Hadoop数据管理软件对硬件要求低,只需要几十台便宜的PC Server即可。如果用户数据增长,只需要将PC Server的数量变成几百乃至几万台。而传统数据库必须由价格不菲的小型机来支撑。
佘晖认为在大数据时代,企业对TDH具有较大需求,Oracle的数据库已经无法跟上大数据时代的步伐。早在2011年,星环科技创始团队就在南方某运营商落地一个Hadoop项目。过去手机账单查询在一秒内可以返回结果,但随着数据业务的增加,手机账单上不仅有电话短信明细,同时还有流量明细,使用传统的关系型数据库已经无法做到秒级反馈。客户在寻找解决方案时采用了该团队打造的Hadoop方案,最终以低成本获得高性能。
在佘晖看来,数据库产品比拼的就是研发实力。“有些客户十分直接,直接给你20T的数据,看你究竟要多长时间跑出来。”
佘晖认为大数据领域是小公司的创业舞台。“企业市场将来会有天翻地覆的变化,企业数据库都要更换成能够适应大数据时代的产品。”星环科技希望能够把握其中的机会。
尽管市场潜力巨大,但目前Hadoop数据管理软件还仅仅被应用在客户的边缘系统。佘晖称,没有人能够预测这个市场何时会爆发,但它一定会来。一旦Hadoop数据管理软件进入客户的核心系统,需求量将会剧增。
“在创业期,我们所要做的就是不断将产品做好,然后静待开花。” 佘晖说到。