你好,游客 登录 注册 发布搜索
背景:
阅读新闻

MapR将Apache Drill引入企业应用

[日期:2014-09-17] 来源:Gigaom  作者:Derrick Harris [字体: ]

  近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,他们纷纷通过贡献更多的代码来保护自己,也通过开源来攻击其它公司的开发性。就这个事件,Derrick Harris在Gigaom上做了简要分析。

  以下为译文

  近日,MapR,Apache Drill项目的创建者,已经将该技术的初期版本整合到该公司的大数据平台。该公司称这个版本的Drill为0.5,以“开发者预览版”的方式展示这个SQL查询引擎。

  Drill最初公布是在 2012年8月,专注于SQL on Hadoop,当下已经取得了很大的进展。在SQL on Hadoop领域,各个公司可谓是八仙过海各显神通——Cloudera的Impala、Hortonworks的Hive迭代,以及各种各样的初创公司和开源项目,包括当下炙手可热的Spark社区。

  然而MapR的Chief Marketing Officer Jack Norris表示,Drill是个值得期待的技术,因为它是其他SQL on Hadoop引擎所有特性的“父集”。同时,Drill的主要特性在于,在数据被加载到数据库之前,它可以快速的生成结构模式,这主要因为取代将数据转换成其他模式或者表格,Drill保持原始的格式。因此,Drill也无法满足那些期望将数据转换成特定格式的用户需求。

  MapR产品管理负责人Tomer Shiran表示:“对比其他SQL on Hadoop项目,我们更有信心将Drill做好。”

  尽管该公司当下的大数据平台已经整合了Drill,但是这个技术并不是MapR产品的唯一选择。MapR的大数据平台同样整合了Impala和Hive堆栈,甚至通过更紧密的集成支持HP的Vertica分析工具。

  Tomer承认:“通过支撑更多的技术及贡献大量的代码,这将作为MapR重塑专有Hadoop供应商形象更广泛战略的一部分。”Norris更表示:

  当下,MapR发行版中所有关系到应用程序层组件都使用了开源技术或者标准的API。在将来,MapR将尽可能开源更多的技术。MapR会用实际行动证实这一点,比如这周二,公司就开源了大量Hadoop平台的资源管理功能,并且提交了MapR的磁盘IO分配方法,以及作业调度机制到Apache。

  Drill已经得到超过40个以上公司的支持和贡献,其中包括Cisco、LinkedIn以及威斯康星大学。当下,开源已经被证实为产品提升的有效途径,通过众包的方式它可以喜迎大量的工程师致力开源。同时,在高度竞争的Hadoop领域,开源更成为捍卫自己的盾牌,以及在开放性上攻击其它公司的利剑。

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       大数据 开源 Hadoop 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款