价格计算方法

UAI-Inference 产品目前为按需计费模式(后付费)。

UAI-Inference 有两类节点:

  • 弹性集群,该集群使用的计算资源为共享型资源,可以提供海量计算资源。
  • 独占性集群,该集群使用的计算资源为独占型资源,充分保障算力的隔离性。

计费模式

概念

节点*时,基础计量单位,即一个节点运行1个小时时间
基准算力单元,计费的最小单位,对应一定的算力。

弹性集群计费模式

UAI Inference 弹性集群的计费将按照节点*时的方式收费,由于时共享型资源,系统实际将根据推理请求计算所消耗的节点*时来计费,计费时间精确到分钟
弹性集群的基础计算单元为1个基准算力单元,其对应为 1核1GB 的计算资源,1个基准单元的节点*时 收费为0.04元,目前支持的计算节点类型如下:

基准配置 具体配置 节点*时价格
1个基准算力单元 1核1GB 0.04元
2个基准算力单元 2核2GB 0.08元
4个基准算力单元 4核4GB 0.16元
8个基准算力单元 8核8GB 0.32元
计费公式

计费采取日结的方式,具体公式如下:

  1. 总价格 = 当日请求平均值 X 当日请求次数 X 节点*时单价
  2. 如果一个在线服务APP处于激活状态,且当日的计算消耗时间 < 1 节点*时,我们仍将按照 1 节点*时 收费

注:当日请求平均值的计算将自动剔除请求延时的噪点。

计费案例

假设部署了一个UAI Inference 在线服务APP,采用弹性集群模式,选择的是8个基准算力单元的节点,任务执行了4天:

平均延时 请求次数 节点*时价格 当日结算公式 当日结算费用
Day 0 2s 1000 0.32元 0.32 0.32 元
Day 1 2s 120w 0.32元 2*120w/3600 * 0.32 213.33元
Day 2 1.9s 90w 0.32元 1.9*90w/3600 * 0.32 152元
Day 3 2.1s 100w 0.32元 2.1*100w/3600 * 0.32 186.67元

独占型集群计费模式

UAI Inference 独占型集群的计费将按照节点*时的方式收费,由于时独占型资源,系统将根据APP实际所占用的节点的使用时间总和来计算节点*时计费时间精确到分钟。其APP独占型集群具有以下特点:

  • 用户可以在操作界面一键完成APP节点集群的扩容和缩容,计时精确到分钟
  • 每个APP最小的资源数量为 2 个独占型节点。系统将自动做高可用部署,因此需要2+个节点。
  • 独占节点的扩容时间可能会持续几分钟

独占型集群目前支持的独占型计算资源及单价如下:

计算资源类型 最小配置数量 节点*时价格
1*P40 GPU, 4核16GB 2 5.1元/小时

独占型服务在UAI-Inference平台中存在多种状态,其中未激活和已激活状态是收费的

状态 是否计费 说明
部署中 在线服务任务正在初始化
未激活 在线服务任务已经初始化完毕,等待客户激活(点击停止按钮后,任务状态也会回到未激活)
已激活 在线服务任务正在正常服务
错误 在线服务任务部署错误
已删除 训练任务已完成(前端界面不显示)
计费公式

计费采取日结的方式,具体公式如下:
- 总价格 = 当日节点总占用时间 X 节点*时单价

计费案例

假设部署了一个UAI Inference 在线服务APP,采用独占型集群模式,选择的是1*P40型节点,任务执行了3天:

最少节点数 最大节点数 累计节点占用时间 节点*时价格 当日结算公式 当日结算费用
Day 0 2 2 48 5.1元 48 * 5.1 244.8 元
Day 1 2 10 72 5.1元 72 * 5.1 367.2元
Day 2 2 8 64 5.1元 64 * 5.1 326.4元