Distinct
Javadoc生成一个包含输入集合中不同元素的集合。
在某些数据集上,使用 ApproximateUnique
计算近似答案可能更高效,这还允许确定每个键的不同值。
示例
示例 1:从 PCollection
of String
中查找不同元素。
static final String[] WORDS_ARRAY = new String[]{
"hi", "hi", "sue",
"sue", "bob"
};
static final List<String> WORDS = Arrays.asList(WORDS_ARRAY);
PCollection<String> input =
pipeline.apply(Create.of(WORDS)).withCoder(StringUtf8Coder.of());
PCollection<String> distinctWords = input.apply(Distinct.create());
示例 2:从 PCollection
of Integer
中查找不同元素。
相关转换
- Count 统计每个聚合内的元素数量。
- ApproximateUnique 估计集合中不同元素的数量。
最后更新时间:2024/10/31
您是否找到了您要查找的所有内容?
它是否对您有用且清晰?是否有您想更改的内容?请告诉我们!