'''假设 `should_do_breakpoint` 是一个自定义定义的函数,返回一个条件,而该条件可能只在进程 1 上为真'''if should_do_breakpoint(loss): accelerator.set_breakpoint() # 在训练脚本后期需要检查断点时if accelerator.check_breakpoint(): break
这样只有进程1上也early stop之后,才会结束accelerate的分布式训练
京公网安备 11010502049817号