Tub(数据存储)
这是标准的Donkey数据存储。"data"文件夹被称为"tub"。
支持的数据类型
以下数据类型受支持:
str
(字符串)int
(整数)float
/np.float
(浮点数)image_array
和array
(np.ndarray
)image
(jpeg / png 图像)
Tub是一种仅追加的格式,专为读取(以加快模型训练速度)进行了优化。它维护记录的索引,并使用内存映射文件。
Tub提供了一个迭代器(Iterator),可用于读取记录。这些迭代器可以由Pipeline用于在训练之前对数据进行任意转换(用于数据增强)。
示例
from donkeycar.parts.tub_v2 import Tub
# 在此示例中,我们定义了具有单个`input`(类型为`int`)的记录。
inputs = ['input']
types = ['int']
tub = Tub(path, inputs, types)