参考然后写的学习笔记:
OperatorState采用了List的數据结构的设计在改变并发时,通过取模的方式分配分区新增分区的offset需要远程拉取。
KeyedState并发度改变因为KeyedState保存的状态往往挺大的,不在使用OperatorState并行度改变的方法可以看出每次修改并行度如果按照取模的算法,对算子状态就是灾难大量的算子无法在使用原本本地的状态,呮能从远程拉取状态进行同步OperatorState的算法是先以maxParallelism为标准
从图中可以看出大部分算子还是落到了本地。