Tub(数据存储)

这是标准的Donkey数据存储。"data"文件夹被称为"tub"。

支持的数据类型

以下数据类型受支持:

  • str(字符串)
  • int(整数)
  • float / np.float(浮点数)
  • image_arrayarraynp.ndarray
  • image(jpeg / png 图像)

Tub是一种仅追加的格式,专为读取(以加快模型训练速度)进行了优化。它维护记录的索引,并使用内存映射文件。

Tub提供了一个迭代器(Iterator),可用于读取记录。这些迭代器可以由Pipeline用于在训练之前对数据进行任意转换(用于数据增强)。

示例

from donkeycar.parts.tub_v2 import Tub

# 在此示例中,我们定义了具有单个`input`(类型为`int`)的记录。
inputs = ['input']
types = ['int']
tub = Tub(path, inputs, types)