你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[硕士论文]基于云平台的数据挖掘算法的研究与实现

[日期:2014-01-17] 来源:CNKI  作者:颜巍 [字体: ]

基于云平台的数据挖掘算法的研究与实现

电子科技大学  颜巍

在本文中,针对聚类算法K-Means依赖于k值和初始中心点的缺陷,提出了基于采样和密度的改进K-Means算法。通过采样和密度来确定K-Means算法初始k值和初始中心点,并且基于Hadoop平台进行并行化改进。通过实验验证,改进后的K-Means算法具有很好的并行性。(2)协同过滤算法是目前用的最多的一种项目推荐算法,通过计算用户之间的相似性找到具有最高相似度的k个邻居,然后通过邻居对项目的评分为用户推荐项目。在本文中,针对用户评分的稀疏性,提出了一种基于用户相似度和属性权值的混合推荐算法。通过对用户评分记录的学习,求出项目属性的权值,通过属性的权值并结合用户相似度来推荐项目,最后将算法移植到Hadoop平台。通过实验验证,改进后的协同过滤算法比原始算法具有更好的精准度和并行性。(3)目前,Hadoop平台主要通过命令行进行操作,这对普通用户具有一定的难度。本文设计实现了基于Hadoop平台的数据挖掘系统。该系统将数据挖掘算法和Hadoop平台细节进行封装,对外提供Rest接口,用户通过Rest接口调用并行化的数据挖掘算法进行数据分析,无需了解底层的具体实现。


基于云平台的数据挖掘算法的研究与实现

收藏 推荐 打印 | 录入:574107552 | 阅读:
相关新闻       数据挖掘 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款