设计原理
UAI Train平台使用CPU/GPU 计算节点来提供AI Inference在线服务任务的基础算力。平台利用Docker容器技术来封装训练任务,并内置Django Server来接受外部HTTP请求
其所设计到的主要技术和产品包括包括:
- Docker 容器技术
- UHub 云知芯 Docker Hub 公共镜像库 UHub
UAI Inference执行的概念图
UAI Inference平台在执行在线服务任务分为两块:
- 初始化(init),即在django server启动时会调用 load_model 来加载AI 模型
- 执行(service),在外部请求被django server接收后,会调用execute来处理推理请求