你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[期刊]PDMiner_基于云计算的并行分布式数据挖掘工具平台

[日期:2014-08-19] 来源:中国科学: 信息科学  作者:何清 庄福振 曾立 赵卫 [字体: ]

PDMiner_基于云计算的并行分布式数据挖掘工具平台

何清 庄福振 曾立 赵卫

本文中我们研究开发一个基于大规模数据处理平台Hadoop的并行分布式数据挖掘工具平台PDMiner.在PDMiner中, 开发实现了各种并行数据挖掘算法, 比如数据预处理、关联规则分析以及分类、聚类等算法. 实验结果表明, 并行分布式数据挖掘工具平台PDMiner中实现的并行算法: 1) 能够处理大规模数据集, 达到TB级别; 2) 具有很好的加速比性能; 3) 大大整合利用已有的计算资源, 因为这些算法可以在由这些商用机器构建的并行平台上稳定运行, 提高了计算资源的利用效率; 4) 可以有效地应用到实际海量数据挖掘中. 此外, 在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖掘任务. 更重要的是, 我们开放了灵活的接口方便用户开发集成新的并行数据挖掘算法.


PDMiner_基于云计算的并行分布式数据挖掘工具平台

收藏 推荐 打印 | 录入:574107552 | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款