你好,游客 登录 注册 发布搜索
rss订阅 手机访问 
初学入门
深度译文|数据预处理VS数据整理
要点
  在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。
  市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。
  数据整理是数据预处理的重要扩展。它最适合在可视化分析工具中使用,这能够避免分析流程被打断。
  可视化分析工具与开源数据科学组件之间,如R、Pytho...
日期:04月27日 作者: 点击:84
应用程序实现嵌入式系统
应用程序通过 Ubuntu Core 实现嵌入式 Linux 系统后,能够享受事务更新和更高安全性的益处,并且能够访问“卡式”应用程序生态系统。
日期:04月25日 作者: 点击:78
最生动的数据分析师技能图谱
数据分析师一个需要“门门通”的职业。以下是知乎大神“陈丹奕”对数据分析师的能力体系的一个梳理,希望对大数据的同学们能有帮助。
日期:04月25日 作者: 点击:70
东时大数据Hadoop、Spark、Storm主流框架对比
说起大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。我们这次来谈谈大数据处理框架。
日期:04月25日 作者: 点击:111
十分钟搞定云架构 · 什么是Bucket、什么是Object
今天,我们来了解COS中两个十分重要的概念:Bucket 和 Object 。
日期:04月25日 作者: 点击:60
微分享:Spark基础入门介绍
提到大数据技术,大多数开发者首先想到的技术莫过于Hadoop和Spark。他们都是大数据框架,也是当前应用最广泛的大数据框架。
日期:04月24日 作者: 点击:45
理解Docker容器网络之Linux Network Namespace
由于2016年年中调换工作的原因,对容器网络的研究中断过一段时间。随着当前项目对Kubernetes应用的深入,我感觉之前对于容器网络的粗浅理解已经不够了,容器网络成了摆在前面的“一道坎”。继续深入理解K8s网络、容器网络已经势在必行。而这篇文章就算是一个重新开始,也是对之前浅表理解的一个补充。
日期:04月24日 作者: 点击:105
十分钟轻松搞定云架构 · 单点和多点
这节课,我们来学习单点架构和多点架构的知识
  首先,我们来了解一下,什么是单点?
单点顾名思义,就是只使用一个设备对外提供服务。从架构图上来看,单点就是用户直接请求我们的云主机。只有一台云主机对外提供服务。单点架构就是我们在前面课程提到的 “云端最简架构”
而多点就是指对用户提供服务时,不止有一个设备提供服务,多个设备同时...
日期:04月24日 作者: 点击:59
常见机器学习效果调优思路整理
最新腾讯云技术公开课直播,提问腾讯W3C代表,如何从小白成为技术专家?点击了解活动详情。
日期:04月20日 作者: 点击:40
做弹性的云—腾讯云弹性伸缩
最新腾讯云技术公开课直播,提问腾讯W3C代表,如何从小白成为技术专家?点击了解活动详情。
日期:04月19日 作者: 点击:89
ShadowBrokers方程式工具包浅析
臭名昭著的方程式组织工具包再次被公开,TheShadowBrokers 在 steemit.com博客上提供了相关消息。
日期:04月18日 作者: 点击:104
一文看懂神经网络工作原理
本文带来对深度神经网络的通俗介绍。
  现在谈人工智能已经绕不开“神经网络”这个词了。人造神经网络粗线条地模拟人脑,使得计算机能够从数据中学习。
  机器学习这一强大的分支结束了 AI 的寒冬,迎来了人工智能的新时代。简而言之,神经网络可能是今天最具有根本颠覆性的技术。
  看完这篇神经网络的指南,你也可以和别人聊聊深度学...
日期:04月17日 作者: 点击:78
医疗机器人:未来第二大机器人发展现状与应用前景
医疗机器人这种叫法可能有点误导,会让人联想到独立操作预编程任务,而无需监督的机器。这样的应用在工业上很流行,但在处理人体任务时,人的技能也是非常重要的。
日期:04月17日 作者: 点击:50
虚拟化迷宫:应用分层放哪好?
分层无处不在。婚礼上肯定会有分层蛋糕。寒冷的冬天外出的人们肯定会里三层外三层穿很多来保暖。地球本身也是有很多层组成的。因此分层成为应用虚拟化的一部分也是顺其自然的事儿。
日期:04月17日 作者: 点击:43
R做你的第一个机器学习项目教程
2载入数据
  我们将要使用iris这个数据集。这个数据集是非常有名的,因为这是机器学习和统计学里的”hello world”类数据集,这对于每个人来说都非常实用。
  这个数据集含有150个观测值,而且这个数据集有4列,这些列表示花的直径的测量。而这个数据集的第五列就是花的类型,而所有的观测值则是3种花里的其中一种。
  关于这个数据集的...
日期:04月17日 作者: 点击:83