你好,游客 登录 注册 发布搜索
背景:
阅读新闻

专家分享Spark PPT集

[日期:2014-01-10] 来源:CSDN  作者: [字体: ]

Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台,立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark当下已成为Apache基金会的顶级开源项目,拥有着庞大的社区支持,技术也逐渐走向成熟,然而到真正投入企业生产,还需要经过许多优化。以Shark、Spark Streaming及相关项目为主题,Spark Summit邀请到了Yahoo、Adobe、Intel、Amazon、RedHat、Databricks等众多知名企业高管,分享Spark在企业内部的第一手实践。

1.Databricks高级软件工程师Michael Armbrust:Catalyst,一个Spark和Shark的查询优化框架 

Databricks 高级软件工程师Michael Armbrust在此次Spark峰会上就什么是查询优化、简捷的查询规划、优化执行、目前的主要工作以及Catalyst等做了详细介绍。

 

2.UC Berkeley AMPLab 高级软件工程师Sameer Agarwal:在大数据上近似查询

UC Berkeley AMPLab 高级软件工程师Sameer Agarwal在此次Spark峰会上详细介绍了BlinkDB的目标,什么是BlinkDB以及它的架构等等内容。

3.Stratio高级架构师Luca Rosellini:StratioDeep ,一个在Spark 和Cassandra之间的集成层 

 

Stratio高级架构师Luca Rosellini在此次峰会上和其同事Oscar Méndez、Alvaro Agea重点介绍Stratio的主要客户、Cassandra的优势以及为什么使用Spark,最后举例说明。

 

4.Systems Technology Lab of Adobe Research研究专家Nedim Lipka:利用Spark的数字化营销迈向分布式强化学习阶段

Nedim Lipka是Systems Technology Lab of Adobe Research研究专家,主要致力于机器学习、数据挖掘方向的研究。最近他的工作方向是可扩展的强化学习算法、Spark、Hadoop等。此次峰会上就利用Spark的数字化营销向分布式强化学习做了详细的介绍。

 

5.Databricks客户端解决方案主管Pat McDonough:用Spark并行程序设计

 

 

 

Databricks 客户端解决方案主管 Pat McDonough,此次峰会主要就如何用Spark开始你的项目给出自己的建议,从Spark的性能、组件等方面全面介绍Spark的各种优异性能,所以想了解Spark的,这里有你想要的。 

 

6.Databricks高级软件工程师Michael Armbrust:用Shark快速分布式查询处理

Databricks高级软件工程师:Michael Armbrust在此次峰会上除了介绍Catalyst之外,还介绍了Shark和Hive,以及用Shark快速分布式查询处理。(此文档是Michael在Spark峰会第二天的演讲PPT)

7.UC Berkeley博士Tathagata Das:用Spark流实时大数据处理

 

UC Berkeley 博士Tathagata Das主要专注于云计算和大数据。此次峰会就什么是Spark流,为什么选择Spark流,并且用实际案例做了演示。最后还介绍了他的性能和容错机制。

   

8.Databricks创始人Patrick Wendell:部署和管理Spark

Databricks创始人Patrick Wendell曾在加州大学伯克利分校计算机科学系专注于大规模数据密集型计算,致力于Spark的性能基准测试,是spark-perf合著者,此次峰会就Spark组件、集群管理、硬件和配置、Spark的连接、监视和测量等问题详细阐述了自己的看法。

   

9.Conviva  创始人Davis Shepherd :在Spark上实时、准实时离线视频分析

Conviva 创始人Davis Shepherd 在此次峰会上分享了Conviva使用Spark的情况,从我们是做什么的、如今面临哪些问题、为什么Spark对于他们的解决方案必不可少、未来 Spark 能为Conviva带来什么改变等方面做了详细的介绍。

10.Ooyala计算和数据服务主管工程师Evan Chan:Ooyala的Spark查询服务

Ooyala计算和数据服务主管工程师Evan Chan:在Cassandra、Kafka、Spark建立过多个分布式/实时系统。在Spark峰会上就Ooyala如何使用Spark以及他们为什么需要Job Server等都做了详细介绍。

     

 

11.UC Berkeley AMPLab的Kay Ousterhout:Sparrow,下一代Spark调度

UC Berkeley AMPLab的Kay Ousterhout在此次峰会分享了Spark调度的瓶颈、Sparrow分布式、容错技术、Sparrow优化性能等。

     

12.Yahoo首席工程师Gavin Li:从Hadoop流迁移到Spark

 

Yahoo首席工程师Gavin Li主要专注于大规模分布式系统、分布式技术、分布式存储等,此次峰会他和同事Jaebong Kim、 Andy Feng一起主要分享了Yahoo如何在Spark上建立应用程序、Spark可扩展性解决方案、性能测试等内容。

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款