API代码

获取方法

https://github.com/ucloud/uai-sdk

git clone https://github.com/ucloud/uai-sdk.git

PyTorch 相关文件路径

uai-sdk/
  examples/
     pytorch/
        train/
  uaitrain/
     arch/
        pytorch/
          uargs.py
  uaitrain_tool/
     pytorch/
        pytorch_tool.py

简介

uaitrain/arch/pytorch/uargs.py

uaitrain/arch/pytorch/uargs.py 定义了UAI Train在运行PyTorch训练任务时所需的参数定义,此类参数均为固定参数。

固定参数
参数 默认值 说明
--work_dir /data 默认的执行路径,UAI Train打包工具会默认将用户指定的训练代码放入该路径下,详细可见MNIST开发案例
--data_dir /data/data 默认input数据存放路径,UAI Train会将UFile中的input数据下载到该路径下
--output_dir /data/output 默认输出路径,checkpoint和模型文件需要输出到该路径下,UAI Train会在训练完成后将该目录上传
--log_dir /data/output
--num_gpus <#num_gpus> GPU数量,UAI Train会根据训练节点实际的GPU数量生成该参数,GPU编号为递增0,1,2,3…

固定参数为系统自动生成,用户不需要做特殊设置。

uaitrain_tool/pytorch/pytorch_tool.py

pytorch_tool.py 工具支持镜像打包功能,详细使用方法可参见打包镜像