最新
Javadoc使用 HyperLogLog++ 算法 估计数据流中不同元素的数量。创建和合并草图以及从中提取的相应转换是
HllCount.Init
将输入聚合到 HLL++ 草图中。HllCount.MergePartial
将 HLL++ 草图合并到一个新草图中。HllCount.Extract
从 HLL++ 草图中提取不同元素的估计计数。
您可以在 https://github.com/google/zetasketch 中了解更多关于草图的信息。
示例
示例 1:为 PCollection<Long>
创建一个长类型草图,并使用自定义精度
示例 2:为 PCollection<KV<String, byte[]>>
创建一个字节类型草图
示例 3:将 PCollection<byte[]>
中的现有草图合并到一个新草图中,该草图总结了合并的草图中聚合的输入的并集
示例 4:估计 PCollection<String>
中不同元素的计数
示例 5:从现有草图中提取不同计数估计
相关转换
- ApproximateUnique 估计键值对中不同元素或值的数量(但不公开草图;也比
HllCount
不那么准确)。
最后更新时间:2024/10/31
您找到您要查找的所有内容了吗?
所有内容都有用且清晰吗?您想更改任何内容吗?请告诉我们!