附录:机器学习在现实世界中的应用


文档摘要

附录:机器学习在现实世界中的应用 用速写笔记总结的机器学习在现实世界中的应用 速写笔记由 Tomomi Imura 创作 在这门课程中,你已经学习了许多准备训练数据和创建机器学习模型的方法。你构建了一系列经典的回归、聚类、分类、自然语言处理以及时间序列模型。恭喜!现在你可能会想,这一切都是为了什么……这些模型在现实世界中有哪些实际应用? 尽管人工智能,尤其是深度学习,在工业界引起了极大的兴趣,但经典机器学习模型仍然有许多有价值的应用。你甚至可能已经在今天使用了其中的一些应用!本课将探讨八个不同行业及其专业领域如何利用这些类型的模型来提高其应用程序的性能、可靠性、智能性和对用户的吸引力。 课前测验 金融 金融领域为机器学习提供了许多机会。该领域的许多问题可以通过机器学习进行建模和解决。

附录:机器学习在现实世界中的应用

用速写笔记总结的机器学习在现实世界中的应用

速写笔记由 Tomomi Imura 创作

在这门课程中,你已经学习了许多准备训练数据和创建机器学习模型的方法。你构建了一系列经典的回归、聚类、分类、自然语言处理以及时间序列模型。恭喜!现在你可能会想,这一切都是为了什么……这些模型在现实世界中有哪些实际应用?

尽管人工智能,尤其是深度学习,在工业界引起了极大的兴趣,但经典机器学习模型仍然有许多有价值的应用。你甚至可能已经在今天使用了其中的一些应用!本课将探讨八个不同行业及其专业领域如何利用这些类型的模型来提高其应用程序的性能、可靠性、智能性和对用户的吸引力。

课前测验

金融

金融领域为机器学习提供了许多机会。该领域的许多问题可以通过机器学习进行建模和解决。

信用卡欺诈检测

我们在课程早期了解了 k-means 聚类,但它是如何用于解决与信用卡欺诈相关的问题的呢?

在信用卡欺诈检测技术中,k-means 聚类非常有用,这种方法被称为“异常检测”。异常值或一组数据中的观察偏差可以告诉我们信用卡是否正在正常使用,或者是否有不寻常的事情发生。正如下面链接中的论文所示,你可以使用 k-means 聚类算法对信用卡数据进行排序,并根据交易的异常程度将其分配到不同的聚类中。然后,你可以评估风险最高的聚类,以区分欺诈交易和合法交易。
参考文献

财富管理

在财富管理领域,个人或公司代表客户管理投资。他们的工作是长期保持并增加财富,因此选择表现良好的投资至关重要。

评估某个特定投资表现的一种方法是通过统计回归。线性回归是一种理解基金相对于某些基准的表现的重要工具。我们还可以推断出回归结果是否具有统计显著性,或者它们会对客户的投资产生多大影响。你甚至可以进一步扩展分析,使用多元回归,考虑更多的风险因素。关于如何为特定基金使用回归来评估其表现,请参阅下面的论文。
参考文献

教育

教育领域也是机器学习可以应用的一个有趣区域。有许多有趣的问题需要解决,例如检测考试作弊或作文作弊,以及在评分过程中管理偏见,无论是有意还是无意。

预测学生行为

Coursera,一个在线开放课程提供者,有一个很棒的技术博客,讨论了许多工程决策。在这个案例研究中,他们绘制了一条回归线,试图探索低净推荐分数(NPS)评级与课程留存率或辍学率之间的任何相关性。
参考文献

减少偏见

Grammarly,一个检查拼写和语法错误的写作助手,其产品中广泛使用了复杂的 自然语言处理系统。他们在技术博客上发布了一篇有趣的案例研究,讲述了他们如何处理机器学习中的性别偏见,这在我们之前的学习中介绍过 公平性入门课程
参考文献

零售

零售业可以从机器学习中受益匪浅,从创造更好的客户旅程到优化库存管理等各个方面。

客户旅程个性化

Wayfair 是一家销售家居用品如家具的公司,帮助客户找到符合其品味和需求的产品至关重要。在这篇文章中,公司的工程师描述了他们如何使用机器学习和自然语言处理来“为客户呈现正确的结果”。值得注意的是,他们的查询意图引擎已经建立,可以使用实体提取、分类器训练、资产和意见提取以及情感标记来处理客户评论。这是自然语言处理在线零售中的一个经典应用场景。
参考文献

库存管理

像 StitchFix 这样的创新、敏捷公司,通过机器学习进行推荐和库存管理。他们的造型团队与商品团队密切合作:“我们的数据科学家尝试了一个遗传算法,并将其应用于服装,以预测哪些目前不存在的成功服装款式。我们将这一成果带给商品团队,现在他们可以使用这一工具。”
参考文献

医疗保健

医疗保健领域可以利用机器学习来优化研究任务,也可以解决诸如患者再入院或阻止疾病传播等后勤问题。

管理临床试验

临床试验中的毒性是制药商的一个主要关注点。多少毒性是可以接受的?在这项研究中,分析各种临床试验方法导致开发出一种新的方法来预测临床试验结果的概率。具体来说,他们能够使用随机森林生成一个 分类器,能够区分不同药物组。
参考文献

患者再入院管理

医院护理成本高昂,特别是当患者需要再次入院时。这篇论文讨论了一家公司如何使用机器学习来预测再入院的可能性,使用 聚类 算法。这些聚类帮助分析师“发现可能有共同原因的再入院群体”。
参考文献

疾病管理

最近的大流行揭示了机器学习如何在阻止疾病传播方面发挥作用。在这篇文章中,你会看到 ARIMA、逻辑曲线、线性回归和 SARIMA 的使用。“这项工作试图计算病毒传播的速度,从而预测死亡、康复和确诊病例的数量,以便我们可以更好地准备并生存下去。”
参考文献

生态学与绿色科技

自然和生态学包括许多敏感系统,动物和自然之间的互动成为焦点。准确测量这些系统并适当应对事件(如森林火灾或动物种群减少)非常重要。

森林管理

你在之前的课程中学到了 强化学习。它在预测自然模式时非常有用。特别是在跟踪生态问题,如森林火灾和入侵物种的扩散时。在加拿大,一组研究人员使用强化学习从卫星图像构建森林野火动态模型。他们采用了一种创新的“空间扩散过程 (SSP)”,将森林火灾视为“景观中任一单元格的主体”。火灾从某一位置在任意时刻可采取的动作包括向北、南、东或西扩散,或者不扩散。

这种方法反转了通常的 RL 设置,因为相应的马尔可夫决策过程 (MDP) 的动态对于立即发生的野火扩散是一个已知函数。“点击下方链接了解更多关于该小组使用的经典算法。”
参考文献

动物运动传感

虽然深度学习在视觉追踪动物运动方面掀起了一场革命(你可以在这里构建自己的 北极熊追踪器),经典机器学习在这一任务中仍然有其作用。

监测农场动物运动和物联网使用的传感器,但更基础的机器学习技术可用于预处理数据。例如,在这篇论文中,使用各种分类器算法监控和分析了绵羊的姿态。你可能会在第 335 页上看到 ROC 曲线。
参考文献

⚡ 能源管理

在我们关于 时间序列预测 的课程中,我们引入了智能停车计的概念,基于供需理解为城镇创收。这篇文章详细讨论了如何结合聚类、回归和时间序列预测来帮助爱尔兰基于智能计量预测未来的能源使用。
参考文献

保险

保险行业也是使用机器学习构建和优化可行的金融和精算模型的另一个领域。

波动性管理

人寿保险公司 MetLife 在分析和减轻其金融模型中的波动方面非常透明。在这篇文章中,你会注意到二元和序数分类可视化。你还会发现预测可视化。
参考文献

艺术、文化和文学

在艺术领域,例如新闻领域,有许多有趣的问题。检测假新闻是一个巨大的问题,因为它已被证明会影响人们的观点,甚至颠覆民主制度。博物馆也可以从使用机器学习中受益,无论是在寻找文物之间的联系还是资源规划方面。

假新闻检测

检测假新闻在今天的媒体中已经成为一场猫捉老鼠的游戏。在这篇文章中,研究人员建议可以测试结合我们所学的多种机器学习技术的系统,并部署最佳模型:“这个系统基于自然语言处理提取特征,然后这些特征被用于训练机器学习分类器,如朴素贝叶斯、支持向量机 (SVM)、随机森林 (RF)、随机梯度下降 (SGD) 和逻辑回归 (LR)。”
参考文献

这篇文章展示了结合不同的机器学习领域可以产生有趣的结果,有助于阻止假新闻的传播和造成真正的损害;在这种情况下,动机是关于 COVID 治疗谣言的传播引发了暴乱。

博物馆机器学习

博物馆正处于人工智能革命的前沿,收藏品的编目和数字化以及寻找文物之间的联系变得越来越容易。诸如 In Codice Ratio 项目正在帮助解锁梵蒂冈档案馆等不可访问收藏的秘密。但是,博物馆的商业方面也受益于机器学习模型。

例如,芝加哥艺术学院建立了模型来预测观众的兴趣和参观展览的时间。目标是每次用户访问博物馆时都能创造个性化的和优化的参观体验。“在财政年度 2017 年,该模型预测的参观人数和门票收入误差在 1% 以内,”芝加哥艺术学院高级副总裁安德鲁·西姆尼克说。

标签 营销

客户细分

最有效的营销策略会根据不同群体以不同的方式来吸引客户。本文讨论了聚类算法在差异化营销中的应用。差异化营销帮助企业提高品牌知名度,触及更多客户,并赚取更多利润。
参考链接

火箭 挑战

找出另一个受益于本课程中学到的一些技术的行业,并发现它是如何使用机器学习的。

课后测验

复习与自学

Wayfair 的数据科学团队制作了几个有趣的视频,展示了他们在公司中如何使用机器学习。值得 观看

作业

一个机器学习寻宝游戏

声明:
本文件灏天文库团队进行了翻译。尽管我们力求准确,但请注意,翻译可能包含错误或不准确之处。原文档以其原始语言为准。我们不对因使用此翻译而产生的任何误解或误译负责。


发布者: 作者: 转发
评论区 (0)
U