ADE20K

ADE20K是一个广泛使用的场景解析数据集, 包含超过2万张图像, 涵盖150个类别. 它由麻省理工学院(MIT)和斯坦福大学联合发布, 旨在促进场景解析和语义分割领域的研究. ADE20K数据集的多样性和复杂性使其成为评估语义分割模型性能的理想选择.

语义分割是计算机视觉中的一项任务, 旨在对图像中的每一个像素进行分类, 将其分配到预定义的类别中. 例如, 在一张街景图像中, 语义分割模型会将每个像素标注为"道路", "建筑物", "行人", "车辆"等类别. 这种细粒度的分析不仅能够识别图像中的物体, 还能精确地定位它们在图像中的位置和形状.

mIoU(平均交并比)是评估语义分割模型性能的常用指标. 它通过计算预测分割结果与真实标注之间的重叠程度来衡量模型的准确性.