你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[RAR]基于Hadoop平台的DBSCAN算法应用研究

[日期:2013-10-18] 来源:CNKI  作者:王雅光 [字体: ]

基于Hadoop平台的DBSCAN算法应用研究

广东工业大学 王雅光

本文中首先论述了在数据挖掘中经常用到并且也是主要的一种挖掘算法,DBSCAN (Density-Based Spatial Clustering of Applications with Noise基于密度的空间聚类算法),在深入研究和探讨了其挖掘原理的基础上,对于其存在的一些不足,提出了一种基于增量的DBSCAN聚类算法。其次,本文结合云计算中一个开源的框架Hadoop,研究并利用其MapReduce的编程思想,将海量数据进行分块,并且分布到云计算的计算机集群中,实现每一部分数据可以在集群中进行并发的运行。最后,本文实现增量式DBSCAN挖掘算法与Hadoop平台相结合,将DBSCAN算法MapReduce化,当数据库出现新增或删除数据时,无需对整个数据库集进行重新挖掘,只需对新增数据进行局部的挖掘,最后将获取的局部挖掘知识与原先整体挖掘知识进行类簇相似性合并,形成最终的挖掘知识。

基于Hadoop平台的DBSCAN算法应用研究

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       Hadoop 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款