你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PDF]基于MapReduce的增量式数据集的相似性连接

[日期:2014-11-07] 来源: 计算机应用研究  作者:徐媛媛 陈华辉 [字体: ]

基于MapReduce的增量式数据集的相似性连接

徐媛媛 陈华辉

相似性连接,即利用相似函数度量数据之间的相似程度,满足条件后进行连接操作。MapReduce框架下已存在很多相似性连接算法,但仍然存在一些不足,如:大量的索引加大时间、空间的开销;现有算法不能有效完成增量式数据集的相似性连接,等等。针对海量增量式数据集进行了研究,采用抽样技术得到有效中枢,形成更为合理的分区,建立分区索引和分配原则,完成新增数据的相似性连接操作。实验证明,该算法能够有效地解决海量增量式数据集的相似性连接问题,验证了分区索引的建立,可以提高新增数据的相似性连接操作的效率。


基于MapReduce的增量式数据集的相似性连接

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       划分;相似性连接;MapReduce 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款