“数据科学家”可能是一个不像几年前那样奇特的职位,但这并不意味着每个人都确切地了解这个角色涉及什么,或者该领域的职业是否适合他们。大多数组织现在生成、积累和存储大量数据;然而,他们中的许多人不知道如何充分利用他们收集到的所有信息。这就是数据科学家的用武之地。Amazon Web Services (AWS) 数据科学家既是创新的研究人员,也是熟练的讲故事者,他们揭示了隐藏在这些大数据集中深处的趋势,这有助于改变我们客户的业务。Antonia Schulze 是德国柏林 AWS 机器学习 (ML) 解决方案实验室的一名数据科学家。我们采访了她参与的一些项目、机器学习在现实世界中的样子,以及她从事数据科学职业的技巧——无论你是否拥有该领域的传统技能。告诉我们您在 AWS 的角色我的工作涉及分析大量数据并从中获得有价值的见解,结合使用商业头脑和统计数据以及机器学习技术。我通常向不熟悉 ML 的人描述 ML 是构建可以从数据中学习的系统,而无需由人类明确编程。在 AWS,我参与帮助我们的一些最大客户加速在其业务中采用 ML。我们首先研究他们的愿景并找到 ML 的最高价值用例。然后,我们使用最新的机器学习模型运行短期试点项目或“概念验证”来解决特定问题。对于制造客户,机器学习可用于改进研发或供应链功能。例如,我们帮助制造公司更准确地检测缺陷,并将员工进行人工检查的时间减少一半。在汽车行业,数据可用于帮助提高驾驶员和行人的安全性,例如自动驾驶汽车的开发。数据和高级分析可以创建更先进的道路场景感知,这有助于自动驾驶汽车准确地看到周围环境并评估任何风险。我们在哪里可以看到 AWS ML 的实际应用?如今,ML 无处不在。一个很好的日常例子是体育运动。在美国,NFL 将 AWS ML 技术用于其“Next Gen Stats”,这是一个高级分析平台,为球迷带来有关美式足球比赛的令人兴奋的新见解。我们的机器学习模型跟踪来自现场的一系列复杂数据集,以生成从最快的持球者到完成传球概率的所有数据的统计数据。同时,在一级方程式 (F1) 中,由 AWS 提供支持的“F1 Insights”让车迷更好地了解从这项运动历史上最快的车手到车手如何尝试完美起步、他们的制动性能、完成超车的概率等等。这些数据驱动的洞察力为观众提供了更有意义的信息,有助于引发对话,加深粉丝的知识,并最终让人们更接近他们喜爱的运动。这一切都是为了创造更好的体验——在大流行期间,当球迷无法亲自观看体育赛事时,这一点变得更加重要。AWS 如何帮助女性和女孩在技术职业中取得成功女性在 Amazon Web Services 的技术职位上茁壮成长,她们正在构建和支持帮助他人的计划。你有最喜欢的项目吗?在大流行的早期阶段,我们直接与世界卫生组织 (WHO) 合作开展了一个项目,以应对有关 COVID-19 的错误信息和“假新闻”浪潮。世卫组织面临的挑战是需要分析的信息量,因为信息量比以往任何时候都多。我们帮助世卫组织开发机器学习模型并将其纳入其公共卫生工具,以分析和分类来自世界各地的大量 COVID-19 相关内容。我们帮助开发的机器学习模型可以帮助世卫组织分析人员评估信息的可信度,并使可靠的来源更容易找到和分析。此类工作属于自然语言处理 (NLP) 领域,这是人工智能 (AI) 和机器学习的关键领域。这是一个独特的项目,因为我们必须了解如何处理全新的数据集,而所需的规模或速度没有先例。你工作中最好的部分是什么?我喜欢我工作的多样性。我已经与体育、医疗保健等领域的组织合作过,并且我可以灵活地在其他领域工作,例如汽车、制造、零售或任何其他行业。我们工作的多样性也意味着我们与 AWS 业务部门的人员接触,从高级领导到主题专家,他们都愿意分享他们的时间和经验。我喜欢思想、个性和专业知识的多样性。例如,专门从事金融的人将以与在体育行业工作的人不同的方式与您工作和沟通。对我来说,与我一起工作的人——客户和同事——是我工作中最有趣的部分。您是如何进入数据科学领域的?我的职业生涯有点非常规。我没有学习数学或科学,与我的许多同事不同,我没有博士学位。我一开始想进入工商管理领域,所以我的背景是商业和传播。然而,我很快意识到我想在一个更加注重技术和数据驱动的领域工作。我在技术和媒体电信领域进行了市场研究实习。这激发了我更多地了解机器学习和数据科学。我决定回到大学攻读大数据和商业分析硕士学位,我喜欢它,因为它非常注重客户体验。在那之后,我最初发现很难获得数据科学职位,因为公司通常需要数学或统计学背景。当我看到亚马逊正在招聘商业智能数据科学方面的实习生时,我立即申请了。我完成了招聘流程,并在亚马逊运营的客户体验团队找到了一份工作。这真的很有趣,但不是我想去的确切区域。在那里,我找到了一位在亚马逊从事数据科学工作的导师,我的经理帮助我在业务中寻找合适的机会。在他们的支持下,我能够找到一位招聘经理担任数据科学职位,并找到了我现在的工作。你工作中最具挑战性的部分是什么?我们是一个非常创新的团队,因此我们经常将新的想法、工具和流程应用于以前从未解决过的问题。对我来说,最具挑战性但也是最有价值的部分是从头开始创建一个 ML 模型,特别是因为我的学术背景不是数学或统计学。我确保我不断加深我的知识。这可能是通过在我经验较少的领域发展我的网络——例如寻找 NLP 专家定期同步——或者阅读大量研究论文来帮助我更好地理解算法。指导和支持是双向的。当有人慷慨地投入时间时,我总是想提供价值作为回报。凭借我的商业和通信背景,我可以提供帮助的一种方法是将复杂的科学解释翻译成易于理解、用户友好的语言。这可能是将数据科学项目的结果传达给可能没有技术背景的客户,或者在内部与整个企业的亚马逊员工分享有关我们创新的新闻。您希望看到机器学习和数据科学如何发展?我们需要更多的女性担任领导职务,让她们能够引人注目、诚实和开放地对待她们面临的一些挑战。去年,我在亚马逊创立了 Women@ 亲和小组的 Women in ML/AI 全球分会。对这一领域工作的女性可能遇到与我相同的问题——不知道从哪里获取信息,也不知道在没有特定资格的情况下过渡到数据科学角色可能有哪些选择。该小组向所有亚马逊员工开放。您不必是女性或从事 ML 工作才能成为社区的一部分。我们的大多数女性成员都没有担任 ML 角色,但正在寻求有关如何过渡到机器学习角色的支持。通过该小组,我们定期评估会员的需求,然后通过具体活动、指导计划和其他解决方案来解决这些需求。对我来说,更大的多样性对于 AWS 以及整个数据科学和机器学习的未来来说都是关键。多元化的团队意味着不同的观点,这反过来只意味着有更多机会更好地了解您的客户。AWS 致力于为来自不同背景的学生和应届毕业生提供机会,以培养他们的热情和提高他们的技能。了解有关我们实习计划的更多信息。





 与 CNBC 的吉姆·克莱默 (Jim Cramer) 的对话.jpg)




