Plant Phenomics | 分布式账本能帮助克服农业机器学习对标记数据的需求吗?



欧亚国际

欢迎您来到欧亚国际科技官方网站!

土壤仪器电话

010-82794912

品质至上,客户至上,您的满意就是我们的目标

技术文章

当前位置:  首页 > 技术文章

Plant Phenomics | 分布式账本能帮助克服农业机器学习对标记数据的需求吗?

发表时间:2023-08-23 14:57:15点击:541

来源:植物表型组学

分享:

1692773306517385.png

1692773395637543.png

植物表型描述了基因型与环境相互作用的结果。高通量成像流程导致大量数据,这需要复杂的处理程序。表型相关数据的共享和重用并不常见,因为其获取和处理需要耗费大量资源和技术。在MIAPPE(Minimum Information About a Plant Phenotyping Experiment)方法之后,存在数据采集的一般标准,甚至与表型相关的特定标准。此外,最近,资金组织已经将FAIR(可查找性、可访问性、互操作性和可重用性)原则集成到数据管理中,并使其成为强制性的。

现如今,获取数据总是伴随着机器学习(ML),而监督学习尤其依赖于充分预处理的数据,如数据标记。特别是随着深度学习程序的建立,对大量高质量、有标记的数据的需求增加,从而导致植物表型模型训练的瓶颈。与底层数据集类似,标准化、可用性和质量要求也对训练模型提出了挑战。开放数据集展示了它们的可用性,例如,在计算机视觉和机器学习挑战中,如叶片分割和计数。然而,更复杂的情景,如疾病和产量预测模型,需要详细的土壤、土地特征和天气信息。ML模型的质量随着数据集的异质性而提高。对于数据共享和重用的有价值和稀缺信息问题,一个直观的方法是数据市场。专注于数据和处理的协作方法允许共享生成的异构和普遍适用的ML模型,从而解决了所描述的需求。

2023年7月,Plant Phenomics在线发表了Institute for Software and Systems Engineering, TU Clausthal等单位题为Can Distributed Ledgers Help to Overcome the Need of Labeled Data for Agricultural Machine Learning Tasks ?的前沿观点文章。

作者主张采用一种协作的方法来获取和处理表型相关数据集,以及训练随后的人工智能(AI)模型。本文描述了最先进的数据处理和共享方法的局限性,以开发用于植物表型和精准农业的人工智能驱动应用程序。本文描述了一种方法,通过引入基于分布式账本的数据跟踪,使科学家和植物表型实体能够改善科学数据的可用性,该数据跟踪集成到更广泛的生态系统中,为其利益相关者提供不同的激励。它描述了一种可能的解决方案,通过将编辑过的数据集与来自不同参与者的元数据连接起来,克服数据存储和共享的各种孤岛解决方案。它有助于克服当前机器学习模型的瓶颈,通过使用大量标记的训练数据可以极大地提高其准确性。因此,定义了数据收集器、建模器和模型最终用户的角色。以农业疾病预测系统为例,来自无人机飞行或卫星图像的现场数据被用来训练一个模型来预测田间作物疾病的严重程度/发病率,说明了基于分布式账本方法的工作流程。数据收集器使用标准、元信息和数据协调来准备数据集,并将它们发送到数据存储。每当完全或部分使用ML模型时,数据收集器就会得到模型用户的奖励。模型用户向付费的农民提供信息。农民也可以通过提供参考数据,如疾病参考数据 (位置、发病率和严重程度),成为数据收集者。此外,他们提供关于模型的准确性/质量的反馈。

1692773616444550.png

图1 一个市场生态系统的例子。用户的参与包括数据提供者、应用程序/图形用户界面用户、数据管理员和AI/ML培训师。市场支持买/卖选项和订阅者/提供者选项。可用的AI/ML模型涵盖了训练数据的不同子集。


1692773738365877.png



图2 现代农业中数据市场生态系统的一个用例。数据可以用于训练机器学习模型,这些模型由模型用户提供给农民。该示例通过基于遥感现场数据的疾病预测用例进行可视化。

论文链接:

‍http://doi.org/10.34133/plantphenomics.0070

——推荐阅读——

Classification of Rice Yield Using UAV-Based Hyperspectral Imagery and Lodging Feature

http://doi.org/10.34133/2021/9765952

Plant Phenomics | 结合无人机高光谱图像和倒伏特征构建水稻产量类别检测模型

Using Machine Learning to Develop a Fully Automated Soybean Nodule Acquisition Pipeline (SNAP)

http://doi.org/10.34133/2021/9834746

Plant Phenomics | SNAP:基于机器学习的全自动大豆根瘤提取算法

加入作者交流群

扫码添加小编微信,拉您进入《植物表型组学》作者交流群,群内不定期开展作者分享会、专刊发布会等高质量活动。

1692773973547144.png

添加小编微信,备注姓名+单位+PP,加入作者交流群

About Plant Phenomics

《植物表型组学》(Plant Phenomics)是由南京农业大学和美国科学促进会(AAAS)合作创办的英文学术期刊,于2019年1月正式上线发行。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等数据库收录。科睿唯安JCR2021影响因子为6.5,位于农艺学、植物科学、遥感一区。中科院农艺学、植物科学一区,遥感二区,生物大类一区(TOP期刊)。2020年入选中国科技期刊卓越行动计划高起点新刊项目。

说明:本文由《植物表型组学》编辑部负责组稿。

中文内容仅供参考,一切内容以英文原版为准。

排版:赵庆泽(南京农业大学)

审核:孔敏、王平



  • 土壤仪器品牌德国steps
  • 土壤仪器品牌奥地利PESSL
  • 土壤仪器品牌荷兰MACView
  • 土壤仪器品牌德国INNO_Concept
  • 土壤仪器品牌比利时WIWAM
  • 土壤仪器品牌德国GEFOMA
  • 土壤仪器品牌奥地利schaller
  • 土壤仪器品牌荷兰PhenoVation
  • 土壤仪器品牌法国Hi-phen系统
  • 土壤仪器品牌Videometer
  • 土壤仪器品牌比利时INDUCT(OCTINION)
  • 土壤仪器品牌美国EGC
  • 土壤仪器品牌HAIP
  • 土壤仪器品牌植物遗传资源学报
欧亚国际