你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PDF]基于MapReduce与相关子空间的局部离群数据挖掘算法

[日期:2014-09-13] 来源:软件学报  作者:张继福 李永红 秦啸 荀亚玲 [字体: ]

基于MapReduce与相关子空间的局部离群数据挖掘算法
 
张继福 李永红 秦啸  荀亚玲

针对高维海量数据, 在MapReduce 编程模型下, 提出了一种基于相关子空间的局部离群数据挖掘算法.该算法首先利用属性维上的局部稀疏程度, 重新定义了相关子空间, 从而能够有效地刻画各种局部数据集上的分布特征; 其次, 利用局部数据集的概率密度, 给出了相关子空间中的局部离群因子计算公式, 有效地体现了相关子空间中数据对象不服从局部数据集分布特征的程度, 并选取离群程度最大的 N 个数据对象定义为局部离群数据; 在此基础上, 采用LSH 分布式策略, 提出了一种 MapReduce 编程模型下的局部离群数据挖掘算法; 最后, 采用人工数据集和恒星光谱数据集, 实验验证了该算法的有效性、可扩展性和可伸缩性.


基于MapReduce与相关子空间的局部离群数据挖掘算法

收藏 推荐 打印 | 录入:574107552 | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款