你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PDF]基于改进K最近邻分类算法的不良网页并行识别

[日期:2014-01-22] 来源:CNKI  作者:徐雅斌 李卓 陈俊伊 [字体: ]

基于改进K最近邻分类算法的不良网页并行识别

徐雅斌  李卓  陈俊伊

互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。

关键词: 不良网页 文本分类 K最近邻分类算法 Hadoop MapReduce  


基于改进K最近邻分类算法的不良网页并行识别

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款