云上的数据科学 cloud-picture 拍摄者 Jelleke Vanooteghem 上传于 Unsplash 将“云”应用在大数据相关的数据科学上时,它可以起到四两拨千斤的作用。在接下来的三节课程中,我们将逐一了解并学习“云”的基本概念,并尝试弄明白它对数据科学有何帮助。我们也会通过探索心力衰竭这一疾病相关的数据集来构建模型,并用它来评估某人患有心力衰竭的概率。通过借助“云”的力量,我们将采取两种不同的方式来训练、部署、使用该模型。第一种方式仅采用低代码或无代码的用户界面,另一种则采用了 Azure 机器学习软件开发工具包 (Azure ML SDK)。 project-schema 主题 为什么要将云应用于数据科学?

拍摄者 Jelleke Vanooteghem 上传于 Unsplash
将“云”应用在大数据相关的数据科学上时,它可以起到四两拨千斤的作用。在接下来的三节课程中,我们将逐一了解并学习“云”的基本概念,并尝试弄明白它对数据科学有何帮助。我们也会通过探索心力衰竭这一疾病相关的数据集来构建模型,并用它来评估某人患有心力衰竭的概率。通过借助“云”的力量,我们将采取两种不同的方式来训练、部署、使用该模型。第一种方式仅采用低代码或无代码的用户界面,另一种则采用了 Azure 机器学习软件开发工具包 (Azure ML SDK)。

这些课程由 Maud Levy 和 Tiffany Souterre 用 ☁️ 及 编写。
心力衰竭预测项目的数据来源于 Larxel (在 Kaggle 上)。 适用 Attribution 4.0 International (CC BY 4.0) 许可证。

数据可视化是数据科学家最重要的任务之一。在有的时候,一图可以胜千言。除此之外,可视化还可以帮助你指出你的数据中包含的各种有趣的特征,例如峰值、异常值、分组、趋势等等,这可以帮助你更好的了解你的数据。
在这五节课当中,你将接触到来源于大自然的数据,并使用各种不同的技术来完成有趣且漂亮的可视化。
这些可视化课程是由 Jen Looper 用 编写的
US Honey Production 所使用的数据来自 Jessica Li 在 Kaggle 上的项目。事实上,该 数据集 来自 美国农业部。
mushrooms 所使用的数据集也是来自于 Kaggle,该数据集经历过 Hatteras Dunton 的一些小修订. 该数据集包括对与姬松茸和环柄菇属中 23 种金针菇相对应的假设样本的描述。蘑菇取自于奥杜邦协会北美蘑菇野外指南 (1981)。该数据集于 1987 年捐赠给了 UCI ML 27 (机器学习数据集仓库)
Minnesota Birds 的数据也来自于 Kaggle,是由 Hannah Collins 从 Wikipedia 中获取的。
以上这些数据集都遵循 CC0: Creative Commons 条款。

摄影者 Alexander Sinn 于 Unsplash
在这些课程中, 你将学习到一些关于数据管理、数据操作和应用的方式。你将学习关系和非关系数据库,以及数据如何存储在他们中。你将学习 Python 语言的基础知识,同时还会发现一些使用 Python 来管理和挖掘数据的方式。
这些课程由 Christopher Harrison, Dmitry Soshnikov 和 Jasmine Greenaway 用 ❤️ 编写

在这些课程中,你将探索到数据科学生命周期的一些方面,包括围绕数据展开的分析和数据之间的沟通。
这些课程由 Jalen McGee 和 Jasmine Greenaway 用 ❤️ 编写

Photo by Stephen Dawson on Unsplash
在这些课程中,你将了解到数据科学是如何定义的,以及数据科学家必须考虑的伦理问题。你还将学习数据是如何定义的,还有一些关于统计学和概率的知识,这是数据科学的核心学术领域。
这些课程由 Nitya Narasimhan 和 Dmitry Soshnikov 用 ❤️ 编写。
数据科学在各行业的实际应用。
本课程由 Nitya Narasimhan 用 ❤️ 编写。