你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PDF]KNN分类算法的MapReduce并行化实现

[日期:2013-11-08] 来源:CNKI  作者:闫永刚 马廷淮 王建 [字体: ]

KNN分类算法的MapReduce并行化实现

闫永刚    马廷淮  王建

为了提高k-nearest neighbor algorithm(KNN)算法处理大数据集的能力,本文利用MapReduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现.通过设计Map、Combine和Reduce 3个函数,实现了KNN算法的并行化.Map函数完成每个测试样本与训练样本之间的相似度计算,Combine函数作为一个本地的Reduce操作,用以减少中间计算量及通信开销,Reduce函数则根据上述函数得到的中间结果计算出k近邻并作出分类判断.实验结果表明:较之以往的单机版方法,在Hadoop集群上实现的并行化KNN算法具有较好的加速比和良好的扩展性.


KNN分类算法的MapReduce并行化实现

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款