Beam SQL 入门指南

此页面通过示例代码演示了 Beam SQL 的用法。

Beam 架构和行

SQL 查询只能应用于 PCollection<T>,其中 T 已注册架构,或 PCollection<Row>。有关为类型 T 注册架构的详细信息,请参阅 Beam 编程指南中的 架构文档

如果您没有现有的类型 T,可以通过多种方式获取 PCollection<Row>,例如

一旦您获得了 PCollection<Row>,就可以使用 SqlTransform 对其应用 SQL 查询。

SqlTransform

SqlTransform.query(queryString) 方法是唯一一个从 SQL 查询的字符串表示创建 PTransform 的 API。您可以将此 PTransform 应用于单个 PCollection 或包含多个 PCollectionsPCollectionTuple

代码库中的 BeamSqlExample 演示了这两个 API 的基本用法。