8.3 PyTorchVideo简介 近几年来,随着传播媒介和视频平台的发展,视频正在取代图片成为下一代的主流媒体,这也使得有关视频的深度学习模型正在获得越来越多的关注。然而,有关视频的深度学习模型仍然有着许多缺点: 计算资源耗费更多,并且没有高质量的 ,不能像图片一样进行迁移学习和论文复现。 数据集处理较麻烦,但没有一个很好的视频处理工具。 随着多模态越来越流行,亟需一个工具来处理其他模态。 除此之外,还有部署优化等问题,为了解决这些问题,Meta推出了 深度学习库(包含组件如Figure 1所示)。PyTorchVideo 是一个专注于视频理解工作的深度学习库。PytorchVideo 提供了加速视频理解研究所需的可重用、模块化和高效的组件。