自 2015 年以来,NFL 一直在其 Next Gen Stats 平台中使用 AWS 云计算技术,并于 2017 年将机器学习添加到 Next Gen Stats 中,这是一个高级分析平台,为橄榄球比赛带来了令人兴奋的新见解。通过跟踪来自现场的复杂数据,部署机器学习模型以实现可视化动作的新方法,包括完成概率、接球后预期码数和最快持球者等。这些先进的统计数据有助于增强球迷体验,为球迷带来更多实时数据,了解球员在场上的天赋和比赛期间的决策。即使每场比赛都有 200 多个由 AWS 驱动的下一代统计数据,但只有少数高级统计数据可以捕捉跑步游戏的某些部分。直到现在。今年,NFL 推出了“预期冲球码数”,以帮助展示跑卫的能力,包括他的速度和难以捉摸的能力。本赛季,NFL 将使用 AWS 技术推出几项新的下一代统计数据,而这只是球迷将看到的高级统计数据之一。预期冲球码数旨在根据拦网手和防守者的相对位置、速度和方向,显示持球者在给定冲球时预计获得多少冲球码数。这项新统计数据是由 AWS 提供支持的数据分析竞赛 Big Data Bowl 的结果。大数据碗于 2 月底举行,是来自世界各地的数据科学家齐聚一堂,探索如何为 NFL 先进统计数据的持续发展做出贡献的机会。今年的大数据碗重点关注一个问题:当 NFL 持球者接球时,我们应该期望他在比赛中获得多少码?超过 2,000 人参加了开源竞赛,一支来自奥地利的两人团队——在比赛前没有接触过美式足球——成为明显的胜利者。菲利普·辛格 (Philipp Singer) 和德米特里·戈尔德耶夫 (Dmitry Gordeev) 的团队名称为“动物园”,他们利用他们在机器学习方面的专业知识构建了一个卷积神经网络来开发新的统计数据。两名团队成员在大数据碗之后的讨论区中详细分析了他们如何构建最终演变成新的高级统计数据的模型:“如果我们专注于冲锋者并移除其他进攻队球员,这看起来像是一场简单的游戏,一名球员试图逃跑,其他 11 名球员试图抓住他。我们假设一旦冲球开始,每个防守者,无论位置如何,都会专注于尽快阻止冲球者,并且每个防守者都有机会做到这一点。防守者铲断冲锋者的机会(以及铲球的估计位置)取决于他们的相对位置、速度和移动方向。使用 stats 的前 10 条进攻线然后,NFL 的 Next Gen Stats 团队在休赛期使用 Amazon SageMaker(一项完全托管的服务,为每个开发人员和数据科学家提供快速构建、训练和部署机器学习模型的能力)实施了 The Zoo 的建模架构,以创建新的冲刺指标。现在,随着预期冲球码数准备在赛季初推出,球队、球员、广播公司和球迷可以看到的不仅仅是围绕冲球码数的传统统计数据。现在可以从这个新统计数据中得出许多主要指标——预期冲球码数、冲球码数超过预期、每次尝试冲球码数超过预期、冲球百分比超过预期、首攻概率和达阵概率——所有这些都可以在上赛季的一场特定比赛中说明。克利夫兰布朗队在比赛还剩 24 分 18 秒时以 9-47 领先巴尔的摩乌鸦队,并在自己的 12 码线处面临第 1 和 15 分。跑卫尼克·丘布 (Nick Chubb) 接过传球,推进 88 码达阵。这导致冲球码数超出预期 +81 码,首下概率为 12.4%,达阵概率不到 1%。与我们能够通过完成概率更好地理解和欣赏四分卫和接球手的表现类似,我们现在可以使用这些高级统计数据来更好地量化跑卫的独特能力,“NFL 新兴产品和技术副总裁马特·斯文森 (Matt Swensson) 说。“预期冲球码数的解决方案是一种独特的方法,我们还可以将其用于未来的统计数据,并有可能改进现有统计数据,例如我们的接球后预期码数指标。随着 AWS 为我们的 Next Gen Stats 平台提供支持,我们将继续发现我们以前从未见过的游戏的新方面。










