API代码
获取方法
https://github.com/ucloud/uai-sdk
git clone https://github.com/ucloud/uai-sdk.git
Caffe相关文件路径
uai-sdk/ examples/ caffe/ train/ uaitrain/ arch/ caffe/ train.py uaitrain_tool/ caffe/ caffe_tool.py
简介
uaitrain/arch/caffe/train.py
uaitrain/arch/caffe/train.py 是Caffe训练的特定入口文件,由于UAI-Train平台统一采用python的接口启动训练任务,因此我们需要该train.py 文件作为入口
train.py 有如下参数:
可变参数
参数 | 默认值 | 说明 | 是否必填 |
可变参数中--solver是必填项,指定了Solver proto的路径, 通常有两种填写方法:
- /data/xxx,此时solver proto文件需要和train.py 一同打包进/data/ 目录下,详细说明请参见打包镜像
- /data/data/xxx,此时solver proto文件需要和数据一同上传至UFIle存储中,训练过程文件将下载至/data/data/目录下。用户可以通过该方案,在不重上传Docker镜像的基础上,动态修改solver proto 文件
固定参数
参数 | 默认值 | 说明 |
固定参数为系统自动生成,用户不需要做特殊设置。由于Caffe 会自动进行多GPU训练,因此用户无需关心GPU的配置,train.py已经帮用户自动去使用多GPU训练(如果num_gpus >1),当然用户可以自行修改train.py
uaitrain_tool/caffe/caffe_tool.py
caffe_tool.py 工具支持镜像打包功能,详细使用方法可参见打包镜像