学习资源

欢迎来到我们的学习资源。本页面包含一系列资源,可帮助您入门和使用 Apache Beam。如果您是初学者,可以将其视为一个引导式教程,否则您可以直接跳到您感兴趣的任何部分。

如果您想在此处看到其他材料,请告知我们 user@beam.apache.org

入门

快速入门

学习基础知识

基础

常见模式

文章

数据分析

数据迁移

机器学习

高级概念

视频

课程

书籍

使用 Apache Beam 构建大数据管道

使用 Apache Beam 构建大数据管道 由 Jan Lukavský 撰写,Packt 出版社出版。(2022 年 1 月)。Apache Beam 模型的概括描述,包括逐步构建的示例,有助于创建对该主题的牢固理解。在第一部分中,本书使用 Java SDK 解释概念,然后使用 SQL DSL 和可移植性层,重点介绍 Python SDK。本书的最后部分专门介绍更高级的主题,如使用 Splittable DoFn 的 I/O 连接器,以及运行器如何执行管道的描述。

流式系统:大型数据处理的什么、哪里、何时和如何

流式系统:大型数据处理的什么、哪里、何时和如何 由 Tyler Akidau、Slava Chernyak 和 Reuven Lax 撰写。(2018 年 8 月)。扩展自 Tyler Akidau 的热门博客文章“流式 101”和“流式 102”,本书将带您从入门级到对实时数据流处理的什么、哪里、何时和如何的细致理解。

认证

Apache Beam Quest 入门

Apache Beam 入门 此任务包含四个实验室,教你如何编写和测试 Apache Beam 管道。三个实验室使用 Java,一个实验室使用 Python。每个实验室大约需要 1.5 个小时才能完成。完成此任务后,您将获得一个徽章,可用于展示您的 Beam 专业知识。

互动实验室

Java

Python

Beam Katas

Beam Katas 是交互式 Beam 编码练习(例如 代码 kata),可以帮助您动手学习 Apache Beam 概念和编程模型。Beam Katas 基于 JetBrains 教育产品 构建,其目标是为学习者提供一系列结构化的动手学习体验,通过解决难度逐渐增加的练习来了解 Apache Beam 及其 SDK。Beam Katas 可用于 Java 和 Python SDK。

Java

Python

代码示例

Dataflow 食谱

菜谱 包含 Java、Python 和 Scala(通过 Scio)的示例,提供可立即启动且独立的 Beam 管道。

Java

Python

Beam Playground

API 参考

反馈和建议

我们欢迎反馈和建议,您可以在 联系我们 页面中找到与社区联系的不同方式。

如果您有错误报告或想建议新功能,您可以通过 提交新问题 来告知我们。

如何贡献

我们欢迎来自所有人的贡献!要了解有关如何贡献的更多信息,请查看我们的 贡献指南