云上的数据科学


文档摘要

云上的数据科学 cloud-picture 拍摄者 Jelleke Vanooteghem 上传于 Unsplash 将“云”应用在大数据相关的数据科学上时,它可以起到四两拨千斤的作用。在接下来的三节课程中,我们将逐一了解并学习“云”的基本概念,并尝试弄明白它对数据科学有何帮助。我们也会通过探索心力衰竭这一疾病相关的数据集来构建模型,并用它来评估某人患有心力衰竭的概率。通过借助“云”的力量,我们将采取两种不同的方式来训练、部署、使用该模型。第一种方式仅采用低代码或无代码的用户界面,另一种则采用了 Azure 机器学习软件开发工具包 (Azure ML SDK)。 project-schema 主题 为什么要将云应用于数据科学?

云上的数据科学

cloud-picture

拍摄者 Jelleke Vanooteghem 上传于 Unsplash

将“云”应用在大数据相关的数据科学上时,它可以起到四两拨千斤的作用。在接下来的三节课程中,我们将逐一了解并学习“云”的基本概念,并尝试弄明白它对数据科学有何帮助。我们也会通过探索心力衰竭这一疾病相关的数据集来构建模型,并用它来评估某人患有心力衰竭的概率。通过借助“云”的力量,我们将采取两种不同的方式来训练、部署、使用该模型。第一种方式仅采用低代码或无代码的用户界面,另一种则采用了 Azure 机器学习软件开发工具包 (Azure ML SDK)。

project-schema

主题

  1. 为什么要将云应用于数据科学?
  2. 云上的数据科学:通过低代码/无代码方式
  3. 云上的数据科学:通过 (Azure ML SDK)

致谢

这些课程由 Maud LevyTiffany Souterre 用 ☁️ 及 编写。

心力衰竭预测项目的数据来源于 Larxel (在 Kaggle 上)。 适用 Attribution 4.0 International (CC BY 4.0) 许可证。

可视化

a bee on a lavender flower

拍摄者 Jenna Lee 上传于 Unsplash

数据可视化是数据科学家最重要的任务之一。在有的时候,一图可以胜千言。除此之外,可视化还可以帮助你指出你的数据中包含的各种有趣的特征,例如峰值、异常值、分组、趋势等等,这可以帮助你更好的了解你的数据。

在这五节课当中,你将接触到来源于大自然的数据,并使用各种不同的技术来完成有趣且漂亮的可视化。

主题

  1. 可视化数据
  2. 可视化数据分布
  3. 可视化数据占比
  4. 可视化数据间的关系
  5. 做有意义的可视化

致谢

这些可视化课程是由 Jen Looper 用 编写的

US Honey Production 所使用的数据来自 Jessica Li 在 Kaggle 上的项目。事实上,该 数据集 来自 美国农业部

mushrooms 所使用的数据集也是来自于 Kaggle,该数据集经历过 Hatteras Dunton 的一些小修订. 该数据集包括对与姬松茸和环柄菇属中 23 种金针菇相对应的假设样本的描述。蘑菇取自于奥杜邦协会北美蘑菇野外指南 (1981)。该数据集于 1987 年捐赠给了 UCI ML 27 (机器学习数据集仓库)

Minnesota Birds 的数据也来自于 Kaggle,是由 Hannah Collins 从 Wikipedia 中获取的。

以上这些数据集都遵循 CC0: Creative Commons 条款。

处理数据

data love

摄影者 Alexander SinnUnsplash

在这些课程中, 你将学习到一些关于数据管理、数据操作和应用的方式。你将学习关系和非关系数据库,以及数据如何存储在他们中。你将学习 Python 语言的基础知识,同时还会发现一些使用 Python 来管理和挖掘数据的方式。

话题

  1. 关系数据库
  2. 非关系数据库
  3. 使用 Python
  4. 准备数据

致谢

这些课程由 Christopher HarrisonDmitry SoshnikovJasmine Greenaway 用 ❤️ 编写

数据科学的生命周期

communication

拍摄者 Headway 上传于 Unsplash

在这些课程中,你将探索到数据科学生命周期的一些方面,包括围绕数据展开的分析和数据之间的沟通。

主题

  1. 简介
  2. 数据分析
  3. 数据沟通

致谢

这些课程由 Jalen McGeeJasmine Greenaway 用 ❤️ 编写

数据科学简介

data in action

Photo by Stephen Dawson on Unsplash

在这些课程中,你将了解到数据科学是如何定义的,以及数据科学家必须考虑的伦理问题。你还将学习数据是如何定义的,还有一些关于统计学和概率的知识,这是数据科学的核心学术领域。

主题

  1. 数据科学的定义
  2. 数据科学伦理
  3. 数据的定义
  4. 统计与概率概论

致谢

这些课程由 Nitya NarasimhanDmitry Soshnikov 用 ❤️ 编写。

现实中的数据科学

数据科学在各行业的实际应用。

主题

  1. 现实世界中的数据科学

致谢

本课程由 Nitya Narasimhan 用 ❤️ 编写。


发布者: 作者: 转发
评论区 (0)
U