如题所述
é¦å
ï¼sumæ¯å¯¹ä¸ä¸ªå段è¿è¡æ±åï¼hiveä¸å段çç±»åä¸è¬æ¯stringæè
intï¼å¦ææ¯intå½ç¶æ²¡é®é¢ï¼å¦ææ¯stringç±»åä½æ¯å
¨é¨æ¯æ°åä¹æ²¡é®é¢ï¼å¦æå
å«ä¸ä¸ªåæ¯sumåºæ¥å°ä¼æ¯0.
åå¦æè¿æ ·ä¸å¼ ç®åç表
user_id stringshop_id string
1234hello
12341234
é£
ä¹sum(user_id)çç»ææ¯2468ï¼sum(shop_id)çç»ææ¯0.å¦æ没æ符åæ¡ä»¶çè®°å½ï¼sumçè¿åå¼å°æ¯nullï¼å¦
sum(case when user_id<1000 then shop_id
end)è¿åå¼å°æ¯nullãä½æäºæ¶åæ没å¸æsumçç»æå¦æ没æ符åæ¡ä»¶çè®°å½å°±è¿å0æä¹åå¢ï¼å¯ä»¥ç¨coalesce(shop_id,0)解
å³è¿ä¸ªé®é¢ã
countæ¯å¯¹æ°æ®è®°å½çæ¡æ°è¿è¡ç»è®¡ï¼æä¸æ¡ç¬¦åçè®°å½å°±æ¯1ï¼æ²¡æå°±æ¯0.
åå 天éå°è¿æ ·ä¸æ¡sqlè¯å¥ï¼sum(case when
substr(gmt_receive_pay,0,13)='$cur_date $env.last_hour' then t2.total_fee end)
as hour_alipay_fee,
æç¥éè¿æ¡è¯å¥å½æ²¡æ符åæ¡ä»¶çè®°å½æ¶è®¡ç®åºæ¥ç»ææ¯nullï¼ä½æ¯æ没ææè¯å°è¿æ¯ä¸ä¸ªbugï¼æ们è¦çç»æåºè¯¥æ¯0ãæ£è®¨ä¸ä¸ã
åå¦æè¿æ ·ä¸å¼ ç®åç表
user_id stringshop_id string
1234hello
12341234
é£
ä¹sum(user_id)çç»ææ¯2468ï¼sum(shop_id)çç»ææ¯0.å¦æ没æ符åæ¡ä»¶çè®°å½ï¼sumçè¿åå¼å°æ¯nullï¼å¦
sum(case when user_id<1000 then shop_id
end)è¿åå¼å°æ¯nullãä½æäºæ¶åæ没å¸æsumçç»æå¦æ没æ符åæ¡ä»¶çè®°å½å°±è¿å0æä¹åå¢ï¼å¯ä»¥ç¨coalesce(shop_id,0)解
å³è¿ä¸ªé®é¢ã
countæ¯å¯¹æ°æ®è®°å½çæ¡æ°è¿è¡ç»è®¡ï¼æä¸æ¡ç¬¦åçè®°å½å°±æ¯1ï¼æ²¡æå°±æ¯0.
åå 天éå°è¿æ ·ä¸æ¡sqlè¯å¥ï¼sum(case when
substr(gmt_receive_pay,0,13)='$cur_date $env.last_hour' then t2.total_fee end)
as hour_alipay_fee,
æç¥éè¿æ¡è¯å¥å½æ²¡æ符åæ¡ä»¶çè®°å½æ¶è®¡ç®åºæ¥ç»ææ¯nullï¼ä½æ¯æ没ææè¯å°è¿æ¯ä¸ä¸ªbugï¼æ们è¦çç»æåºè¯¥æ¯0ãæ£è®¨ä¸ä¸ã
温馨提示:答案为网友推荐,仅供参考
第1个回答 2016-07-22
首先,sum是对一个字段进行求和,hive中字段的类型一般是string或者int,如果是int当然没问题,如果是string类型但是全部是数字也没问题,如果包含一个字母sum出来将会是0.
假如有这样一张简单的表
user_id stringshop_id string
1234hello
12341234
那么sum(user_id)的结果是2468,sum(shop_id)的结果是0.如果没有符合条件的记录,sum的返回值将是null,如sum(case when user_id<1000 then shop_id end)返回值将是null。但某些时候我没希望sum的结果如果没有符合条件的记录就返回0怎么办呢,可以用coalesce(shop_id,0)解决这个问题。
count是对数据记录的条数进行统计,有一条符合的记录就是1,没有就是0.
前几天遇到这样一条sql语句,sum(case when substr(gmt_receive_pay,0,13)='$cur_date $env.last_hour' then t2.total_fee end) as hour_alipay_fee,
我知道这条语句当没有符合条件的记录时计算出来结果是null,但是我没有意识到这是一个bug,我们要的结果应该是0。检讨一下。
假如有这样一张简单的表
user_id stringshop_id string
1234hello
12341234
那么sum(user_id)的结果是2468,sum(shop_id)的结果是0.如果没有符合条件的记录,sum的返回值将是null,如sum(case when user_id<1000 then shop_id end)返回值将是null。但某些时候我没希望sum的结果如果没有符合条件的记录就返回0怎么办呢,可以用coalesce(shop_id,0)解决这个问题。
count是对数据记录的条数进行统计,有一条符合的记录就是1,没有就是0.
前几天遇到这样一条sql语句,sum(case when substr(gmt_receive_pay,0,13)='$cur_date $env.last_hour' then t2.total_fee end) as hour_alipay_fee,
我知道这条语句当没有符合条件的记录时计算出来结果是null,但是我没有意识到这是一个bug,我们要的结果应该是0。检讨一下。
第2个回答 2019-10-26
对你的问题有些疑问,不知你是要了解两者在hive的执行层面的区别,还是纯粹HiveSQL 的两个函数的问题?
如果是前者,把问题描述更具体一些,现在还不知你是想了解什么问题~
如果是后者,关于两个函数的区别,count 是记数,sum是求和。
比如有以下记录:
学号 姓名 课程 分数
001 张三 语文 88
001 张三 数学 90
如果针对上面数据中的分数进行count和sum,count的结果为2,表示2条记录,如果sum,就是88+90=178
如果是前者,把问题描述更具体一些,现在还不知你是想了解什么问题~
如果是后者,关于两个函数的区别,count 是记数,sum是求和。
比如有以下记录:
学号 姓名 课程 分数
001 张三 语文 88
001 张三 数学 90
如果针对上面数据中的分数进行count和sum,count的结果为2,表示2条记录,如果sum,就是88+90=178