你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[期刊]基于MapReduce的相似数据查询方案

[日期:2014-10-11] 来源:计算机应用  作者:崔炜 [字体: ]

基于MapReduce的相似数据查询方案

崔炜

大规模数据常因其分布式存储特性导致寻找其相似度最大的前k对数据比较困难。针对上述问题,提出一种基于MapReduce的最相似k对数据查询方案。该方案首先将所有数据对分割成多个组,然后提出所有数据对分组算法和核心数据对分组算法,通过单独计算每个组中的最近似k对数据,再从所有组的最近似k对数据中选择相似度最高的k对数据,进而正确地确定最近似k对数据。最后基于合成数据和真实数据进行实验,通过改变最近似数据对数k和机器数目s验证算法性能。实验结果表明增加机器数目s能够提升算法的运行效率和可扩展性,而k参数的变化对基于MapReduce的算法影响不大。


基于MapReduce的相似数据查询方案

 

 

 

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       MapReduce 相似数据 查询方案 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款