Apache Beam 2.43.0

我们很高兴推出 Beam 的新版本 2.43.0。此版本包含改进和新功能。有关此版本的下载页面,请参阅 下载页面

有关 2.43.0 中更改的更多信息,请查看 详细的发布说明

亮点

  • Apache Beam 中的 Python 3.10 支持 (#21458).
  • 运行器的初始实现,使我们能够在 Dask 上运行 Beam 管道。试用它并给我们反馈!(Python) (#18962).

I/Os

  • 将 TextSource 的 CPU 利用率降低了 2.3 倍(Java) (#23193).
  • 修复了在使用 SpannerIO 时使用 RuntimeValueProvider 选项的错误(Java) (#22146).
  • 修复了 WriteToBigQuery 上的 Unicode 渲染问题 (#22312)
  • 删除 BigQuery 读取和写入的过时变体,始终使用 Beam 本地变体 (#23564#23559).
  • 将 Python SDK 的 google-cloud-spanner 依赖项版本提升至 3.x (#21198).

新功能/改进

  • 通过跨语言(带有自动扩展服务)在 Go SDK 中添加了数据帧包装器。(Go) (#23384).
  • 命名所有 Java 线程以帮助调试 (#23049).
  • 运行器的初始实现,使我们能够在 Dask 上运行 Beam 管道。(Python) (#18962).
  • 允许通过管道选项配置 GCP OAuth 范围。这将解除需要额外范围的 Beam I/O 的使用限制。例如,此功能使您可以访问 Google Drive 支持的 BigQuery 表格 (#23290).
  • 一个从 Java 使用 Python RunInference 的示例 (#23290).

重大变更

  • Python SDK 中的 CoGroupByKey 变换已更改输出类型提示。表示分组值的类型提示组件已从 List 更改为 Iterable,这更准确地反映了任意大输出集合的性质。 #21556 Beam 用户可能会在 CoGroupByKey 下游的变换上看到错误。用户必须将期望 List 的方法更改为期望 Iterable 以便继续使用。有关信息和修复方法,请参阅 文档
  • Spark 的 PortableRunner 假设 Spark 3 是默认的 Spark 主版本,除非使用 --spark_version 进行配置。Spark 2 支持已弃用,并将很快移除 (#23728).

错误修复

  • 修复了 Python 跨语言 JDBC I/O 连接器无法读取或写入包含 Numeric/Decimal 类型值的行的错误 (#19817).

贡献者列表

根据 git shortlog,以下人员为 2.43.0 版本做出了贡献。感谢所有贡献者!

Ahmed Abualsaud AlexZMLyu Alexey Romanenko Anand Inguva Andrew Pilloud Andy Ye Arnout Engelen Benjamin Gonzalez Bharath Kumarasubramanian BjornPrime Brian Hulette Bruno Volpato Chamikara Jayalath Colin Versteeg Damon Daniel Smilkov Daniela Martín Danny McCormick Darkhan Nausharipov David Huntsperger Denis Pyshev Dmitry Repin Evan Galpin Evgeny Antyshev Fernando Morales Geddy05 Harshit Mehrotra Iñigo San Jose Visiers Ismaël Mejía Israel Herraiz Jan Lukavský Juta Staes Kanishk Karanawat Kenneth Knowles KevinGG Kiley Sok Liam Miller-Cushon Luke Cwik Mc Melissa Pashniak Moritz Mack Ning Kang Pablo Estrada Philippe Moussalli Pranav Bhandari Rebecca Szper Reuven Lax Ritesh Ghorse Robert Bradshaw Robert Burke Ryan Thompson Ryohei Nagao Sam Rohde Sam Whittle Sanil Jain Seunghwan Hong Shane Hansen Shubham Krishna Shunsuke Otani Steve Niemitz Steven van Rossum Svetak Sundhar Thiago Nunes Toran Sahu Veronica Wasson Vitaly Terentyev Vladislav Chunikhin Xinyu Liu Yi Hu Yixiao Shen alexeyinkin arne-alex azhurkevich bulat safiullin bullet03 coldWater dpcollins-google egalpin johnjcasey liferoad rvballada shaojwu tvalentyn