云中的数据科学入门 插图由@sketchthedocs绘制 :---: 云中的数据科学:入门 - 插图由@nitya绘制 在本课中,您将学习云计算的基本原理,然后了解为什么使用云服务来运行您的数据科学项目会很有趣,并且我们将看一些在云中运行的数据科学项目的示例。 课前测验 什么是云? 云,或云计算,是通过互联网提供的一系列按需付费的计算服务。这些服务包括存储、数据库、网络、软件、分析和智能服务等解决方案。 我们通常将公有云、私有云和混合云区分为以下几种: 公有云:公有云是由第三方云服务提供商拥有并运营的,它通过互联网向公众提供计算资源。 私有云:私有云是指由单个企业或组织专用的云计算资源,其服务和基础设施在私有网络上维护。 混合云:混合云是一个结合了公有云和私有云的系统。
![]() |
|---|
| 云中的数据科学:入门 - 插图由@nitya绘制 |
在本课中,您将学习云计算的基本原理,然后了解为什么使用云服务来运行您的数据科学项目会很有趣,并且我们将看一些在云中运行的数据科学项目的示例。
云,或云计算,是通过互联网提供的一系列按需付费的计算服务。这些服务包括存储、数据库、网络、软件、分析和智能服务等解决方案。
我们通常将公有云、私有云和混合云区分为以下几种:
大多数云计算服务可以归入三类:基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。
一些最大的云服务提供商包括亚马逊网络服务(AWS)、谷歌云平台(GCP)和微软Azure。
开发人员和IT专业人员选择使用云的原因有很多,包括以下几点:
这些都是人们选择使用云服务的一些常见原因。现在我们已经更好地理解了云是什么及其主要优势,接下来我们将更具体地探讨数据科学家和处理数据的开发人员的工作,以及云如何帮助他们应对可能遇到的各种挑战:
让我们通过几个场景来使其更加具体。
我们将从一个常见的机器学习研究场景开始:实时社交媒体情感分析。
假设您经营一个新闻网站,想要利用实时数据来了解读者可能感兴趣的内容。为了更多地了解这一点,您可以构建一个程序,对来自Twitter发布的数据进行实时情感分析,针对与读者相关的主题。
您将关注的关键指标是特定主题(话题标签)的推文数量和情感,后者是通过执行情感分析的分析工具来确定的。
创建此项目的步骤如下:
要查看完整的流程,请参阅文档。
我们再来看另一个由课程作者之一Dmitry Soshnikov创建的项目示例。
Dmitry创建了一个工具,用于分析COVID相关论文。通过查看这个项目,您将了解到如何创建一个工具,从中提取知识,获得见解,并帮助研究人员高效地浏览大量论文。
以下是该项目的不同步骤:
要查看完整的流程,请访问Dmitry的博客。
正如您所见,我们可以利用云服务以多种方式执行数据科学。
来源:
**声明**: 本文件灏天文库团队进行了翻译。尽管我们力求准确,但请注意,翻译可能包含错误或不准确之处。原文档以其原始语言为准。我们不对因使用此翻译而产生的任何误解或误译负责。