跳转至

集群实用程序⚓︎

作者: Hongxin Liu

前置教程: - 分布式训练

引言⚓︎

我们提供了一个实用程序类 colossalai.cluster.DistCoordinator 来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。

API 参考⚓︎

{{ autodoc:colossalai.cluster.DistCoordinator }}


最后更新: November 25, 2023
创建日期: November 25, 2023