你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PDF]基于Storm的海量数据实时聚类

[日期:2014-12-18] 来源:计算机应用  作者:王铭坤 袁少光 朱永利 王德文 [字体: ]

基于Storm的海量数据实时聚类

王铭坤 袁少光 朱永利 王德文

针对现有平台处理海量数据实时响应能力普遍较差的问题,引入Storm分布式实时计算平台进行大规模数据的聚类分析,设计了基于Storm框架的DBSCAN算法。该算法将整个过程分为数据接入、聚类分析、结果输出等阶段,在框架预定义的组件中分别编程实现,各组件通过数据流连通形成任务实体,提交到集群运行完成。通过对比分析和性能监测,验证了所提方案具有低延迟和高吞吐量的优势,集群运行状况良好,负载均衡。实验结果表明Storm平台处理海量数据实时性较高,能够胜任大数据背景下的数据挖掘任务。


基于Storm的海量数据实时聚类

 

 

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       Storm 海量数据 聚类 实时分析 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款