你好,游客 登录 注册 发布搜索
背景:
阅读新闻

[PPT]机器学习画布:一页纸把机器学习核心问题说清楚

[日期:2017-05-09] 来源:  作者: [字体: ]

  小薇是一个公司的数据科学家,她很懂机器学习,但最近有一个困扰:

  当老大想上一个机器学习项目时,她召集了业务团队、工程团队、产品团队和销售团队开会。但是 3 个小时过去了,讨论变得一团糟,大家找不到讨论重点,各部门同事也不清楚到底需要做什么、以及项目该怎么做。

  出现这样的原因,很大程度在于机器学习是一门新兴服务,来自不同部门背景各异的同事们在讨论的时候,往往很难抓住问题的重点,大家也缺少讨论问题的框架。

  而实际上,一个机器学习项目需要讨论的问题是有限的,如果能够把核心问题讨论清楚,项目的推进就会事半功倍。这时候我们就可以采用一些好用的工具,例如机器学习画布。

  机器学习画布的作用是,它把机器学习项目最核心的问题都放在一张纸上了。这样当进行跨部门沟通的时候,就可以把它打印出来,或者放在 PPT 上放映,大家对着同一张纸、或者同一个屏幕讨论。这样即便需要开多次会议,大家也可以始终处于相同的理解频率,对过去已解决的问题、当下正在解决的问题和还需讨论的问题都有清晰的认识。

  机器学习画布长这个样,第四范式基于 Louisdorard 画布的基础上制作。

  

 

  机器学习画布 PPT 可编辑版本下载:https://pan.baidu.com/s/1eRXwJbc

  画布的框架分为 4 个部分,问题定义、模型预测、模型学习和系统评估,你可以自由选择顺序讨论。

  问题定义:预测系统会为终端用户带来什么价值?我们选择什么指标来解决问题?

  机器学习任务:预测的输入和输出是什么?机器学习任务的类型是什么?可选的算法模型是什么?

  决策行动:模型预测如何变成决策行动?

  线上预测:我们什么时候会对输入做出预测?我们多久做一次预测?

  离线评估:部署之前,用什么方法和指标来评估预测系统?

  数据标签:我们如何获得有标签的数据?

  数据来源:我们可以使用哪些原始数据?(内部数据和外部数据)

  特征工程:从原始数据中提取什么特征?如何处理这些特征?

  建立模型:新数据进来后,我们什么时候建立/更新模型?我们多久建立/更新一次模型?

  实施评估和监测:部署之后,用什么方法和指标来评估预测系统?如何量化它带来的价值?

  当你把这些问题定义清楚后,事情就好办多了。

  下面是机器学习画布的两个使用实例:

  (如果图片看不清,可以保存到手机浏览~)

  1、主播推荐系统

  

 

  2、垃圾邮件识别

  

 

 

下载地址:temp_17050912528310.pptx

收藏 推荐 打印 | 录入:涤生2017 | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款