你好,游客 登录
背景:
阅读新闻

[PDF]Towards a Deduplication Framework utilising Apache Spark

[日期:2015-03-19] 来源:  作者:Niklas Wilcke [字体: ]

Towards a Deduplication Framework utilising Apache Spark

Niklas Wilcke

This paper is about a new framework called DeduPlication (DduP). DduP aims to solve large scale deduplication problems on arbitrary data tuples. DduP tries to bridge the gap between big data, high performance and duplicate detection.


Towards a Deduplication Framework utilising Apache

推荐 打印 | 录入: | 阅读:
相关新闻       Record Linkage  Duplicate Detection  Deduplication 
本文评论   
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款

版权所有:© 2018-2019 新疆云创智算数据中心有限责任公司,保留一切权利。苏ICP备18051603号-1

本站所转载、链接、引用及翻译的内容等,其版权属于各自合法的拥有者。

本站创建、管理、商务合作: 1078583763#qq.com(用@代替#)

Powered by iwms 5.4
Processed in 0.025 second(s), 6 queries, Gzip enabled