我们的实验中使用了流行的航空图像中的车辆检测 (VEDAI) 数据集,其中包含从更大的犹他州自动地理参考中心 (AGRC) 数据集获得的裁剪图像。在AGRC中从相同高度收集的每张图像大约有16 000 x 16 000像素,分辨率约为每像素12.5 cm x 12.5 cm。RGB 和 IR。是同一场景中每个图像的两种模态。VEDAI 数据集由 1246 张较小的图像组成,这些图像侧重于涉及草地、高速公路、山脉和城市地区的不同背景。所有图像的大小为 1024 x 1024 或 512 x 512.任务是检测 11 类不同车辆,例如汽车、皮卡、露营和卡车。