你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[硕士论文]基于MapReduce框架的频繁项集挖掘算法研究

[日期:2015-08-11] 来源:中国知网  作者:刘士佳 [字体: ]

基于MapReduce框架的频繁项集挖掘算法研究

哈尔滨理工大学  刘士佳

本论文提出了“一个基于MapReduce计算模型的高效率频繁项集挖掘算法”,通过减少低频项集的产生,进而减少内存消耗和数据传输量。为了进一步提高内存利用率和降低数据传输量,基于IOMRA算法提出了优化算法,“基于云计算的Apriori传输效率优化算法”,改进算法中Key/Value对的存储形式,进而减少内存负载量,减少运算中数据传输量,有效提高运算效率。本论文中,通过对原始数据的预处理,再利用交易数据库中每笔交易记录的长度,确定Map端最大合并候选项集的阶次,从而有效减少非高频项集的产生。并且,通过改进Apriori算法中Key/Value对的存储形式,使得Apriori算法在MapReduce的运算中,能够大量减少主机内存的负载量,减少计算机之间的数据传输量,有效地提升运算的效能。


基于MapReduce框架的频繁项集挖掘算法研究

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款