数据集:

beans

语言:

en

计算机处理:

monolingual

大小:

1K<n<10K

语言创建人:

expert-generated

批注创建人:

expert-generated

源数据集:

original

许可:

mit
英文

Beans 数据集卡片

数据集概要

Beans叶片数据集,包含患病和健康叶片的图像。

支持的任务和排行榜

  • 图像分类:基于叶片图像,目标是预测是否存在病害类型(角斑和豆锈)。

语言

英文

数据集结构

数据实例

下面是训练集中的一个样本:

{
    'image_file_path': '/root/.cache/huggingface/datasets/downloads/extracted/0aaa78294d4bf5114f58547e48d91b7826649919505379a167decb629aa92b0a/train/bean_rust/bean_rust_train.109.jpg',
    'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=500x500 at 0x16BAA72A4A8>,
    'labels': 1
}

数据字段

数据实例具有以下字段:

  • image_file_path:字符串类型的图像文件路径。
  • image:包含图像的PIL.Image.Image对象。注意,访问image列时,dataset[0]["image"]会自动解码图像文件。解码大量图像文件可能需要较长时间。因此,首先查询样本索引,然后再查询"image"列,即dataset[0]["image"]始终优先于dataset["image"][0]。
  • labels:整数类型的分类标签。

分类标签映射:

{
  "angular_leaf_spot": 0,
  "bean_rust": 1,
  "healthy": 2,
}

数据拆分

train validation test
# of examples 1034 133 128

数据集创建

策划原理

[需提供更多信息]

数据源

初始数据收集和归一化

[需提供更多信息]

谁是源语言生成者?

[需提供更多信息]

注释

注释过程

[需提供更多信息]

谁是标注员?

[需提供更多信息]

个人和敏感信息

[需提供更多信息]

使用数据的注意事项

数据的社会影响

[需提供更多信息]

偏见讨论

[需提供更多信息]

其他已知限制

[需提供更多信息]

附加信息

数据集策划者

[需提供更多信息]

许可信息

[需提供更多信息]

引用信息

@ONLINE {beansdata,
    author="Makerere AI Lab",
    title="Bean disease dataset",
    month="January",
    year="2020",
    url="https://github.com/AI-Lab-Makerere/ibean/"
}

贡献

感谢 @nateraw 添加此数据集。