生成tfrecords文件
我们借助生成镜像中的镜像来生成tfrecords文件。
本地生成tfrecords文件
我们可以将数据按照如下文件结构进行放置。
- char_dict.json、index_2_ord_map.json和ord_2_index_map.json需要放置在data/data/char_dict文件夹下(这三个文件描述了字符的编码和训练中index的关系);
- Test和Train中放置了我们准备好的用于训练和测试的sample.txt文件;
- ./pic中放置了生成的图像文件;
/_ data/ |_ data/ |_ char_dict/ |_ char_dict.json |_ index_2_ord_map.json |_ ord_2_index_map.json |_ Test/ |_ sample.txt |_ Train/ |_ sample.txt |_ pic/ |_ tfrecords
我们需要将本地的/data/data和/data/tfrecords映射到docker镜像中去
sudo docker run -it -v /data/data:/data/data -v /data/data/tfrecords:/data/output uhub.service.auto-ai.com.cn/uai_demo/crnn_cpu:latest /bin/bash -c " /usr/bin/python /data/code/tools/write_text_tfrecords.py --batch_size=10000"
然后我们可以在本地/data/tfrecords中找到生成的tfrecords文件。