博客与发布
2023/10/11
Apache Beam 2.51.0
我们很高兴推出 Beam 的新版本 2.51.0。此版本包含改进和新功能。请访问 下载页面 获取此版本的下载链接。
有关 2.51.0 中更改的更多信息,请查看 详细的版本说明。
新功能/改进
- 在 Python 中,RunInference 现在支持使用 KeyedModelHandler 在同一个转换中加载多个模型 (#27628).
- 在 Python 中,VertexAIModelHandlerJSON 现在支持传递 inference_args。这些参数将作为参数传递给 Vertex 端点。
- 添加了对在用户管道上运行
mypy
的支持 (#27906)
重大变更
- 删除了 Beam SQL 的 fastjson 库依赖项。表属性已更改为基于 jackson ObjectNode(Java)(#24154).
- 从 Beam Python 容器镜像中删除了 TensorFlow PR。如果您受到此更改的负面影响,请在 #20605 上发表评论。
- 从
parquetio.Write
中删除了参数t reflect.Type
。元素类型是从输入 PCollection(Go)中推断出来的 (#28490) - 重构 BeamSqlSeekableTable.setUp,添加了参数 joinSubsetType。 #28283
错误修复
- 修复了 GCS 连接器(Python)中的异常链问题 (#26769).
- 修复了流式插入的异常处理,GoogleAPICallErrors 现在根据重试策略进行重试,并在适当的情况下路由到失败的行,而不是导致管道错误(Python)(#21080).
- 修复了 Python SDK 的跨语言 Bigtable 输出端点中处理没有显式设置时间戳的记录时出现的错误:#28632。
安全修复
- Python 容器已更新,修复了 CVE-2021-30474、CVE-2021-30475、CVE-2021-30473、CVE-2020-36133、CVE-2020-36131、CVE-2020-36130 和 CVE-2020-36135
- 使用 go 1.21.1 构建,修复了 CVE-2023-39320
已知问题
- 使用 BigQuery 存储读取 API 的 Python 管道必须将
fastavro
依赖项固定到 1.8.3 或更早版本:#28811
贡献者列表
根据 git shortlog,以下人员为 2.50.0 版本做出了贡献。感谢所有贡献者!
Adam Whitmore
Ahmed Abualsaud
Ahmet Altay
Aleksandr Dudko
Alexey Romanenko
Anand Inguva
Andrey Devyatkin
Arvind Ram
Arwin Tio
BjornPrime
Bruno Volpato
Bulat
Celeste Zeng
Chamikara Jayalath
Clay Johnson
Damon
Danny McCormick
David Cavazos
Dip Patel
Hai Joey Tran
Hao Xu
Haruka Abe
Jack Dingilian
Jack McCluskey
Jeff Kinard
Jeffrey Kinard
Joey Tran
Johanna Öjeling
Julien Tournay
Kenneth Knowles
Kerry Donny-Clark
Mattie Fu
Melissa Pashniak
Michel Davit
Moritz Mack
Pranav Bhandari
Rebecca Szper
Reeba Qureshi
Reuven Lax
Ritesh Ghorse
Robert Bradshaw
Robert Burke
Ruwann
Ryan Tam
Sam Rohde
Sereana Seim
Svetak Sundhar
Tim Grein
Udi Meiri
Valentyn Tymofieiev
Vitaly Terentyev
Vlado Djerek
Xinyu Liu
Yi Hu
Zbynek Konecny
Zechen Jiang
bzablocki
caneff
dependabot[bot]
gDuperran
gabry.wu
johnjcasey
kberezin-nshl
kennknowles
liferoad
lostluck
magicgoody
martin trieu
mosche
olalamichelle
tvalentyn
xqhu
Łukasz Spyra