API代码

获取方法

https://github.com/ucloud/uai-sdk

git clone https://github.com/ucloud/uai-sdk.git

Caffe相关文件路径

uai-sdk/

  examples/
    caffe/
       train/
  uaitrain/
    arch/
      caffe/
         train.py
  uaitrain_tool/
    caffe/
      caffe_tool.py

简介

uaitrain/arch/caffe/train.py

uaitrain/arch/caffe/train.py 是Caffe训练的特定入口文件,由于UAI-Train平台统一采用python的接口启动训练任务,因此我们需要该train.py 文件作为入口

train.py 有如下参数:

可变参数

参数 默认值 说明 是否必填

可变参数中--solver是必填项,指定了Solver proto的路径, 通常有两种填写方法:

  1. /data/xxx,此时solver proto文件需要和train.py 一同打包进/data/ 目录下,详细说明请参见打包镜像
  2. /data/data/xxx,此时solver proto文件需要和数据一同上传至UFIle存储中,训练过程文件将下载至/data/data/目录下。用户可以通过该方案,在不重上传Docker镜像的基础上,动态修改solver proto 文件

固定参数

参数 默认值 说明

固定参数为系统自动生成,用户不需要做特殊设置。由于Caffe 会自动进行多GPU训练,因此用户无需关心GPU的配置,train.py已经帮用户自动去使用多GPU训练(如果num_gpus >1),当然用户可以自行修改train.py

uaitrain_tool/caffe/caffe_tool.py

caffe_tool.py 工具支持镜像打包功能,详细使用方法可参见打包镜像