在线名词解释大全 - 大数据平台核心技术 - 详细

聚合一般需要分成两个阶段进行,第一个阶段中增加Hash-semiaggregate有机会很大的减少两个阶段间的shuffle数据量。计算每个买家订单数量,SELECTBuyer,COUNT(*)FROMOrdersGROUPBYBuyer;,如果平均每个买家有三条订单,那么上述优化在最好的情况下shuffle数据量会是未优化前的多少?()

A
A.三分之一
B
B.二分之一
C
C.六分之一
正确答案:
相关推荐
扫描二维码
关注公众平台