你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[期刊]不完整大数据的分布式聚类填充算法

[日期:2015-07-25] 来源:计算机工程  作者:冷泳林 陈志奎 张清辰 鲁富宇 [字体: ]

不完整大数据的分布式聚类填充算法

冷泳林 陈志奎 张清辰 鲁富宇

传统大数据填充算法是根据整个数据集对缺失数据进行填充,使得填充值容易受到不同类别数据的干扰,导致填充结果不精确。 针对该问题,给出不完整数据的相似度度量方法,使用近邻传播(AP)算法对不完整数据进行聚类。 采用云计算技术优化 AP 聚类算法,实现一种基于 MapReduce 的分布式聚类算法,根据算法聚类结果将同一类数据对象划分到相同簇中,并利用同一类对象的属性值对缺失值进行填充。 实验结果表明,该算法能实现不完整大数据的聚类,同时加快聚类速度,提高缺失数据的填充精度。


不完整大数据的分布式聚类填充算法

 

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款