品质至上,客户至上,您的满意就是我们的目标
技术文章
当前位置: 首页 > 技术文章
Plant Phenomics | GWHD_2021:改进后的全球麦穗检测数据集
发表时间:2021-10-04 08:41:17点击:2691
在部署深度学习方法以获取适用于尽可能多情况的通用模型时,优质的训练数据至关重要。并且,已有研究表明增加数据集的大小、多样性和数据质量相比于增加模型的复杂性和深度更加有效。在开发和评估新的深度学习方法时,数据集(如用于分类的ImageNet数据集、用于实例分割的MS COCO数据集等)同样十分重要。因此,获取特定植物或作物的数据集的重要性已在植物表型业内基本达成了共识,此类数据集可用于对估算表型性状的算法进行基准测试,并鼓励计算机视觉专家对数据集进一步改进。
随着技术的发展,相机和图像采集平台(如无人机、智能手机等)的性价比正在不断提高,这使得田间条件下的图像采集变得越来越便捷。基于图像分析的高通量方法也正在逐步取代人工,对一系列重要性状(如小麦穗密度等)进行测量。
近日,Plant Phenomics在线发表了题为Global Wheat Head Detection 2021: An Improved Dataset for Benchmarking Wheat Head Detection Methods的研究论文。
小麦是在全球范围内得到广泛种植的农作物之一,单位面积穗数是评估其产量潜力的一个重要指标。为了创建一个足够强大的深度学习模型,研究者需要一个涵盖尽可能多的基因型、播种密度、生长阶段及采集条件的图像数据集。为了满足这一需求,作者在2020年开发了全球麦穗检测数据集(GWHD_2020,http://mp.weixin.qq.com/s/E7oen1Y3Kq2Jquc5qGpAiA),从来自7个国家的各种采集平台的4700张图像中收集了193634个标记好的小麦麦穗。通过在Kaggle举办的相关竞赛,GWHD_2020成功吸引了计算机视觉和农业科学领域研究者的关注。在第一次实践中,作者定位了一些关于数据大小、麦穗多样性、标注可靠性方面的问题。为了改进上述问题,作者对2020年的数据集进行了校对、重标和补充,并添加了来自另外5个国家的1722张图像,向数据集中新增了81553个小麦麦穗。新版的全球麦穗检测数据集(GWHD_2021,Figure 1)比之前的版本(GWHD_2020)更庞大、更多样(Figure 2,3)、更优质。
Figure 1: Sample images of the Global Wheat Head Detection 2021.
Figure 2: Distribution of the development stage.
Figure3: Distribution of the images in the two first dimensions defined by the UMAP algorithm for the GWHD 2021 dataset.
论文链接
http://spj.sciencemag.org/journals/plantphenomics/2021/9846158/
——推荐阅读——
Global Wheat Head Detection (GWHD) Dataset: A Large and Diverse Dataset of High-Resolution RGB-Labelled Images to Develop and Benchmark Wheat Head Detection Methods
http://spj.sciencemag.org/journals/plantphenomics/2020/3521852/
Plant Phenomics | 小麦麦穗自动检测大规模图像数据库:为可用于农业生产和研究现场的AI算法测试奠基
TasselGAN: An Application of the Generative Adversarial Model for Creating Field-Based Maize Tassel Data
http://spj.sciencemag.org/journals/plantphenomics/2020/8309605/
Plant Phenomics | TasselGAN:一种使用生成对抗模型创建基于田间的玉米穗数据的方法
About Plant Phenomics
《植物表型组学》(Plant Phenomics)是由南京农业大学和美国科学促进会(AAAS)合作创办的英文学术期刊,于2019年1月正式上线发行,是Science合作出版的第二本期刊。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被CABI、CNKI、DOAJ、PMC、SCIE、Scopus和EI数据库收录。
说明:本文由《植物表型组学》编辑部负责组稿。
中文内容仅供参考,一切内容以英文原版为准。
撰稿:王栋(实习)
编辑:张威(实习)
审核:卞越、孔敏