你好,游客 登录 注册 发布搜索
背景:
阅读新闻

基于Hadoop平台的视觉数据聚类研究与实现

[日期:2014-12-23] 来源:CNKI  作者:李林 [字体: ]

基于Hadoop平台的视觉数据聚类研究与实现

西安电子科技大学 李林

Hadoop是解决大数据存储和分析问题的分布式模型。聚类算法能通过聚类生成码书,对视觉数据进行特征表达。如何将聚类算法架构在分布式模型上完成对大规模数据的聚类是科研和生产中的重要问题。针对大规模视觉数据聚类问题,本文设计并实现了基于Hadoop模型的视觉数据聚类算法,提高了视觉数据聚类的效率。 本文首先介绍了视觉特征,分析了在视觉信息聚类生成码书过程中存在的维数灾难问题。然后,本文详细分析Hadoop分布式模型,设计并实现了基于Hadoop模型的视觉数据K-Means、GMM聚类方法,解决了在视觉信息数据生成码书过程中存在的维数灾难问题。通过Map/Reduce算法实现视觉数据的分布式聚类,很大程度上提高了视觉信息数据处理的效率。 在这些研究基础之上,本文通过在不同规模实验数据和不同规模集群上设计实验和分析实验结果,得出了基于Hadoop框架的视觉数据聚类算法对大规模数据的聚类效率更高、加速比更大、可扩展性更强的结论。


基于Hadoop平台的视觉数据聚类研究与实现

收藏 推荐 打印 | 录入:574107552 | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款