在线名词解释大全 - 大数据平台核心技术 - 详细

聚合一般需要分成两个阶段进行,第一个阶段中增加Hash-semiaggregate有机会很大的减少两个阶段间的shuffle数据量。计算每个买家订单数量,SELECTBuyer,COUNT(*)FROMOrdersGROUPBYBuyer;,如果平均每个买家有三条订单,那么上述优化在最好的情况下shuffle数据量会是未优化前的多少?()

相关推荐
扫描二维码
关注公众平台