Presto 的聚合函数有哪些?

推荐答案

Presto 提供了多种聚合函数,常见的聚合函数包括:

  • COUNT():计算行数。
  • SUM():计算数值列的总和。
  • AVG():计算数值列的平均值。
  • MIN():返回列中的最小值。
  • MAX():返回列中的最大值。
  • ARBITRARY():返回任意一个非空值。
  • APPROX_DISTINCT():返回近似唯一值的数量。
  • APPROX_PERCENTILE():返回近似百分位数。
  • STDDEV():计算标准差。
  • VARIANCE():计算方差。
  • CORR():计算两列的相关系数。
  • COVAR_POP():计算总体协方差。
  • COVAR_SAMP():计算样本协方差。
  • REGR_INTERCEPT():计算线性回归的截距。
  • REGR_SLOPE():计算线性回归的斜率。
  • BITWISE_AND_AGG():对列中的值进行按位与操作。
  • BITWISE_OR_AGG():对列中的值进行按位或操作。

本题详细解读

Presto 的聚合函数用于对数据集进行汇总计算,通常与 GROUP BY 子句一起使用。以下是对常见聚合函数的详细解释:

COUNT()

  • 功能:计算指定列或行的数量。
  • 示例SELECT COUNT(*) FROM table_name; 计算表中的总行数。

SUM()

  • 功能:计算数值列的总和。
  • 示例SELECT SUM(column_name) FROM table_name; 计算某一列的总和。

AVG()

  • 功能:计算数值列的平均值。
  • 示例SELECT AVG(column_name) FROM table_name; 计算某一列的平均值。

MIN()

  • 功能:返回列中的最小值。
  • 示例SELECT MIN(column_name) FROM table_name; 返回某一列的最小值。

MAX()

  • 功能:返回列中的最大值。
  • 示例SELECT MAX(column_name) FROM table_name; 返回某一列的最大值。

ARBITRARY()

  • 功能:返回任意一个非空值。
  • 示例SELECT ARBITRARY(column_name) FROM table_name; 返回某一列的任意一个非空值。

APPROX_DISTINCT()

  • 功能:返回近似唯一值的数量。
  • 示例SELECT APPROX_DISTINCT(column_name) FROM table_name; 返回某一列的近似唯一值数量。

APPROX_PERCENTILE()

  • 功能:返回近似百分位数。
  • 示例SELECT APPROX_PERCENTILE(column_name, 0.5) FROM table_name; 返回某一列的中位数。

STDDEV()

  • 功能:计算标准差。
  • 示例SELECT STDDEV(column_name) FROM table_name; 计算某一列的标准差。

VARIANCE()

  • 功能:计算方差。
  • 示例SELECT VARIANCE(column_name) FROM table_name; 计算某一列的方差。

CORR()

  • 功能:计算两列的相关系数。
  • 示例SELECT CORR(column1, column2) FROM table_name; 计算两列的相关系数。

COVAR_POP()

  • 功能:计算总体协方差。
  • 示例SELECT COVAR_POP(column1, column2) FROM table_name; 计算两列的总体协方差。

COVAR_SAMP()

  • 功能:计算样本协方差。
  • 示例SELECT COVAR_SAMP(column1, column2) FROM table_name; 计算两列的样本协方差。

REGR_INTERCEPT()

  • 功能:计算线性回归的截距。
  • 示例SELECT REGR_INTERCEPT(column1, column2) FROM table_name; 计算两列的线性回归截距。

REGR_SLOPE()

  • 功能:计算线性回归的斜率。
  • 示例SELECT REGR_SLOPE(column1, column2) FROM table_name; 计算两列的线性回归斜率。

BITWISE_AND_AGG()

  • 功能:对列中的值进行按位与操作。
  • 示例SELECT BITWISE_AND_AGG(column_name) FROM table_name; 对某一列的值进行按位与操作。

BITWISE_OR_AGG()

  • 功能:对列中的值进行按位或操作。
  • 示例SELECT BITWISE_OR_AGG(column_name) FROM table_name; 对某一列的值进行按位或操作。

这些聚合函数在数据分析和处理中非常有用,能够帮助用户快速获取数据的汇总信息。

纠错
反馈