论文:Developing a segment anything model-based framework for automated plot extraction
Kim, H.S., Olaniyi, I., Chang, A. et al. Developing a segment anything model-based framework for automated plot extraction. Precision Agric 26, 53 (2025). https://doi.org/10.1007/s11119-025-10249-x
技术总结
该论文提出了一种基于**Segment Anything Model(SAM)** 的自动化地块提取框架,旨在实现农业田间试验中地块边界的精准、高效提取,支撑高通量表型分析。其核心技术流程包括三部分:
掩码生成:利用SAM的零样本分割能力,通过预设网格点作为提示生成初始地块掩码,再基于地块尺寸过滤无效掩码,无需模型训练或微调。
方向估计与图像旋转:通过边缘检测和霍夫变换提取地块主导方向,将图像旋转至正交角度(0°或90°),优化边界识别精度。
地块优化:将掩码转换为固定尺寸多边形,通过“网格填充”补充遗漏地块、“网格移除”删除重复/错误地块,并结合Canopeo植被覆盖度分析提升可靠性。
该框架在5个小麦试验田数据集上验证效果优异:像素级平均F1分数达89.54%,多边形级在IoU=50%时精度达99.71%,且仅依赖RGB图像即可运行,适配不同地块布局、作物生长阶段及分辨率场景。
基于SAM的自动化地块提取框架——重新定义农业田间表型分析效率
引言:为何需要自动化地块提取?
在农业田间试验中,地块(Plot)是表型分析的基本单元——不同品种、施肥方案或环境处理的作物差异,均需基于地块边界统计。传统地块提取依赖人工数字化,不仅耗时(处理1000个地块需3-5天),且易因主观误差导致边界偏移,影响后续产量估算、长势监测等分析的准确性。
近年来,深度学习分割模型虽在图像识别中表现突出,但多依赖大量标注数据,且难以适配农田中作物遮挡、地块倾斜、背景复杂等场景。而Meta提出的SAM模型凭借“零样本分割”能力(无需训练即可识别新对象),为农业地块提取提供了新可能。本文介绍的SAM-based框架,正是通过优化SAM的应用逻辑,实现了地块提取的全自动化与高精度。
技术框架:三步实现地块“自动勾勒”
该框架的核心逻辑是“利用SAM的通用分割能力+农业场景适配优化”,流程如图所示(示意图):
自动化地块提取框架流程图
Flowchart of the proposed plot extraction framework. The methodology consists of three main steps: mask generation, plot orientation estimation, and plot refinement
步骤1:掩码生成——让SAM“认出”地块
SAM的零样本分割能力需通过“提示(Prompt)”激活。框架中,研究人员预设均匀分布的网格点作为提示(参数“points per side=100”),引导SAM生成覆盖图像中潜在地块的初始掩码。
生成的掩码需经过过滤:保留面积在预设地块尺寸范围内的掩码(如排除过小的杂草区域或过大的背景区域),得到初步的地块候选区域。
SAM掩码生成与过滤效果
Sample segmentation results produced by the SAM model. (Left) Original RGB image, (Center) Random color-coded output masks, and (Right) Filtered masks retained based on plot dimensions (Color figure online)
步骤2:方向估计与图像旋转——给地块“正姿”
农田地块常因地形或种植习惯呈倾斜分布(如1°-25°),导致SAM分割的边界出现偏差。框架通过以下操作校正:
对初始掩码进行边缘检测,提取地块轮廓边缘;
用霍夫变换识别边缘中的主导直线,计算其角度作为地块整体方向;
旋转图像至正交角度(0°或90°),使地块边界与坐标轴平行。
地块方向校正效果
Illustration of the plot orientation estimation and image rotation process. a RGB image, b Segmented masks, c Filtered masks, d Detected edges, e Extracted lines based on the Hough Transform, and f Rotated image after alignment correction
步骤3:地块优化——查漏补缺,去伪存真
经过前两步处理的地块仍可能存在遗漏(被遮挡)或重复标注问题,框架通过“网格填充”和“网格移除”优化:
网格填充:基于已知地块的行列间距构建规则网格,对网格中未识别到地块的位置,用SAM重新分割验证,补充符合尺寸的遗漏地块;
网格移除:计算相邻地块 centroids 距离,删除距离过近的重复地块;结合Canopeo植被覆盖度(通过RGB三通道计算的植被指数),保留覆盖度更高的有效地块。
地块优化前后对比
Examples of the plot refinement process. a Initial plot centroids (red) and regular grid (yellow), b Initial plot cells, c Plots after grid filling, d Duplicated plot centroids (random color-coded), e Duplicated plot cells, f Plots after grid removal (Color figure online)
性能验证:精度与效率双突破
在5个涵盖不同地块尺寸、倾斜角度、生长阶段的小麦试验田数据集上,该框架表现如下:
精度指标:像素级平均F1分数89.54%,多边形级在IoU=50%时精度99.71%,远超传统人工标注的一致性(人工标注误差率约5-8%);
效率提升:处理含500个地块的区域仅需20分钟,较人工标注(3天)提速约216倍;
泛化能力:仅依赖RGB图像,无需多光谱或LiDAR数据,适配不同分辨率(0.1-1m)和作物覆盖度场景。
更重要的是,通过Canopeo植被覆盖度回归分析发现,该框架提取的地块对作物生长状态的表征能力优于人工标注(R²=0.92 vs 0.85),为表型分析提供更可靠的基础数据。
应用与展望
该框架的落地将推动农业研究从“人工主导”向“AI驱动”转型:
高通量表型:快速匹配地块与基因、环境数据,加速作物育种进程;
精准农业:结合地块级长势监测,实现变量施肥、灌溉的闭环管理;
成本降低:摆脱对专业标注人员和多光谱设备的依赖,单地块提取成本降低70%。
未来,研究团队计划拓展框架至不规则地块(如弧形、多边形)和多作物类型(玉米、水稻等),并通过轻量化模型优化,适配边缘设备实时处理需求。
专利:识别农业机械中配置错误的植物识别模型-Blue River
US20250212866A1_IDENTIFYING INCORRECTLY CONFIGURED PLANT IDENTIFICATION MODELS IN A FARMING MACHINE.pdf
摘要
该专利(US 2025/0212866 A1)公开了一种能识别农业机械中错误配置的植物识别模型的技术,核心是农业机械的控制系统通过监控植物识别模型性能,确定其是否适用于田间植物检测。具体而言,控制系统获取田间植物图像,应用第一植物识别模型识别植物为第一类的概率,再通过验证模型基于该概率判断植物是否为第二类;随后应用第二植物识别模型识别第二类植物,并对其进行处理。该技术可自动检测模型配置错误并调整,提升农业作业效率与准确性。
一、专利概述
基本信息:该专利为美国专利申请公开(US 2025/0212866 A1),公开于2025年7月3日,申请人为Blue River Technology Inc,发明人为Anuradha Chandrashekar等8人,核心是解决农业机械中植物识别模型配置错误的问题,提升田间作业的准确性和效率。
背景:现代农业机械依赖植物识别模型进行精准作业(如除草、施肥),但模型配置错误可能导致作物损伤、除草无效等问题,传统依赖人工配置易因人为误差出错,因此需要自动识别并纠正配置错误的系统。
二、系统组成
系统/组件 | 核心功能 | 关键构成 |
农业机械 | 执行田间作业,包括图像采集、植物处理等 | 检测机制(图像/传感器数据获取)、处理机制(植物处理,如喷雾、激光)、控制系统(协调各组件) |
控制系统 | 监控植物识别模型性能,协调各系统工作 | 处理器、非暂态计算机可读存储介质(存储程序指令) |
模型性能分析系统(MPAS) | 评估植物识别模型配置是否正确 | 植物识别模型(识别植物类别及概率)、验证模型(判断植物识别模型配置正确性) |
外部系统 | 提供环境数据、历史信息等支持 | 传感器(测量田间环境)、处理器(数据处理)、数据存储(存储历史作业数据) |
三、核心工作流程
获取图像:农业机械在田间移动时,通过图像采集系统获取田间植物的多张图像。
应用第一植物识别模型:对图像应用第一植物识别模型,确定植物为第一类的概率(likelihood)。
确定第二类植物概率:基于第一模型的结果,通过验证模型计算田间植物为第二类的概率。
应用第二植物识别模型:根据上述概率,应用第二植物识别模型识别第二类植物,确定其为第二类的概率。
处理植物:农业机械对识别为第二类的植物进行处理(如喷洒农药、除草等)。
四、关键技术细节
植物识别模型:可识别多种植物类别,输出植物属于某一类别的概率;第一和第二模型可为同一模型(通过参数调整识别不同类别)。
验证模型:通过两种方法判断植物识别模型配置是否正确:①基于单张图像的置信度阈值(如 aggregate class 置信度高于阈值则配置正确);②结合当前及历史图像的 aggregate class 结果(如连续多张图像结果不符则配置错误)。
概率计算:计算植物为某一类别的概率时,可应用平滑函数处理历史图像的 likelihood 结果,提高准确性。
五、响应措施
配置正确时:继续按当前模型进行作业,处理识别出的植物。
配置错误时:①暂停当前作业;②自动调整模型参数(重新配置第一模型作为第二模型);③向操作员发送通知,接收操作员指令后调整配置。
六、关键问题
问题:系统如何判断植物识别模型配置错误?
系统通过验证模型判断配置错误,主要有两种方法。一是基于单张图像,若植物识别模型输出的 aggregate class 与模型配置的目标类别不符,或置信度低于阈值,则判定配置错误;二是结合当前及历史图像的 aggregate class 结果,若连续多张图像的结果与目标类别不符(如3张中有2张不符),则判定配置错误。
问题:第一植物识别模型和第二植物识别模型的关系是什么?它们可以是同一个模型吗?
第一和第二植物识别模型用于识别不同类别的植物,第二模型的应用基于第一模型的结果(通过验证模型确定田间植物更可能为第二类)。它们可以是同一个模型,通过重新配置参数(如识别目标类别),使同一模型分别作为第一和第二模型使用。
问题:当系统判定植物识别模型配置错误时,会采取哪些具体措施?
系统可能采取三种措施:①暂停当前作业,避免错误处理植物;②自动调整模型参数,将第一模型重新配置为第二模型,以识别正确类别;③向操作员发送包含错误概率的通知,接收操作员指令后调整模型配置(如切换识别类别)。

小程序扫码观看
更多农机资讯尽在农机一键查
版权声明:本文仅代表作者观点,不代表农机新闻网立场。 本文为分享行业信息所用,如需转载,请联系原作者。