API代码
获取方法
https://github.com/ucloud/uai-sdk
git clone https://github.com/ucloud/uai-sdk.git
PyTorch 相关文件路径
uai-sdk/ examples/ pytorch/ train/ uaitrain/ arch/ pytorch/ uargs.py uaitrain_tool/ pytorch/ pytorch_tool.py
简介
uaitrain/arch/pytorch/uargs.py
uaitrain/arch/pytorch/uargs.py 定义了UAI Train在运行PyTorch训练任务时所需的参数定义,此类参数均为固定参数。
固定参数
参数 | 默认值 | 说明 |
---|---|---|
--work_dir | /data | 默认的执行路径,UAI Train打包工具会默认将用户指定的训练代码放入该路径下,详细可见MNIST开发案例 |
--data_dir | /data/data | 默认input数据存放路径,UAI Train会将UFile中的input数据下载到该路径下 |
--output_dir | /data/output | 默认输出路径,checkpoint和模型文件需要输出到该路径下,UAI Train会在训练完成后将该目录上传 |
--log_dir | /data/output | |
--num_gpus | <#num_gpus> | GPU数量,UAI Train会根据训练节点实际的GPU数量生成该参数,GPU编号为递增0,1,2,3… |
固定参数为系统自动生成,用户不需要做特殊设置。
uaitrain_tool/pytorch/pytorch_tool.py
pytorch_tool.py 工具支持镜像打包功能,详细使用方法可参见打包镜像