集群实用程序⚓︎
作者: Hongxin Liu
前置教程: - 分布式训练
引言⚓︎
我们提供了一个实用程序类 colossalai.cluster.DistCoordinator
来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。
API 参考⚓︎
{{ autodoc:colossalai.cluster.DistCoordinator }}
最后更新:
November 25, 2023
创建日期: November 25, 2023
创建日期: November 25, 2023