设计原理

UAI Train平台使用GPU主机来提供AI训练的基础算力,平台利用Docker容器技术来封装训练任务,并可以对接UFIle和UFS作为后端数据存储。

其所涉及到的技术和产品包括包括:

  1. Docker 容器技术 Docker使用指南
  2. UHub AutoAI Docker Hub UHub使用指南
  3. UFile AutoAI 对象存储系统 UFile使用指南
  4. UFS AutoAI 分布式存储系统 UFS使用指南
  5. UDisk AutoAI 块存储系统 UDisk使用指南

UAI Train执行的概念图

UAI Train平台在执行训练任务时,是通过将外部存储(UFile、UFS、UDisk)的数据映射到Docker容器中访问。整个执行逻辑如下:

其中有一些固定参数:

  1. 代码入口路径:/data
  2. 输入数据路径:/data/data/
  3. 输出数据路径:/data/output/

注: 固定参数为系统默认参数,无法更改。