你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[硕士论文]改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现

[日期:2014-08-24] 来源:厦门大学   作者:黎光谱 [字体: ]

改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现

厦门大学  黎光谱

本文主要的内容是如何应用大数据技术进行基于内容的海量图像检索技术的研究和实现。从数据层面分析,一个基于内容的图像检索系统要解决大量图像数据的存储和快速处理两个最主要的问题,本文将使用专门用于大数据存储和处理的Hadoop技术来存储大量的图像数据并进行离线地分布式计算;从检索技术层面分析,要进行特征提取和处理,本文将提取图像的SIFT特征,然后对这些特征进行K-Means聚类,将聚类结果作为Bag-of-Words模型的视觉词袋对所有图像的SIFT特征点进行量化处理,从而用一个固定维数的特征向量表示每一幅图像,此外再用TF-IDF加权技术处理这些特征向量,最终计算这些图像与检索图像特征向量之间的相似度,返回相似度最小的一些图像。本文使用并修改HIPI-Hadoop图像处理接口实现在Hadoop上进行图像类型的存储处理和检索,提出了一种改进的并行K-Means算法并应用于特征点的聚类,使用一种基于面积的相似度计算方法计算图像特征向量间的相似度。改进了部分Mahout源码适应大数据的处理需求。图像检索应用广泛,对基于Hadoop的图像检索系统的研究将对大数据时代图像检索技术的发展起到一定的指导作用。


改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       图像检索; 大数据; 存储 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款