Hive/Spark/Presto SQL 备忘
参考资料
复杂案例
数据类型
基本类型 TODO
容器类型
常用 DDL
建表 (CREATE)
CREATE)临时表
修改 (ALTER)
ALTER)修改列
增加列
常用查询/技巧
聚合操作 (GROUP BY)
GROUP BY)排序 sort_array(collect_list(...))
sort_array(collect_list(...))侧视图 (LATERAL VIEW)
LATERAL VIEW)侧视图 for Presto (CROSS JOIN)
CROSS JOIN)子查询 (WITH t AS (...))
WITH t AS (...))数组操作
分页
构造示例/测试数据
对称去重 (基于 sort_array)
sort_array)常用函数/UDF
字符串
数学
聚合函数
条件函数
CASE WHEN
CASE WHEN表生成函数 (UDTF)
Python Transform 用法
Map-Reduce 语法
窗口与分析函数
排序 (ROW_NUMBER/RANK/DENSE_RANK)
ROW_NUMBER/RANK/DENSE_RANK)切片 (NTILE) TODO
NTILE) TODO去重 (基于 ROW_NUMBER)
ROW_NUMBER)排序分位值
配置属性
Hive
其他
DISTINCT 和 GROUP BY 在去重时有区别吗?
DISTINCT 和 GROUP BY 在去重时有区别吗?web 模板变量
从 Hive 迁移到 Presto
异常记录
对 f(col) 分组或排序
f(col) 分组或排序日期加减
AS 多个别名时要不要括号?
AS 多个别名时要不要括号?自动类型转换
规避暴力扫描警告
Last updated