主要观点总结
文章主要介绍了向AI转型的程序员在机器学习AI算法工程中的整体流程,包括基于YOLOV8的目标检测和关键点检测、基于Paddleocr的刻度OCR识别、图片透视变换、读数计算以及算法优化等内容。
关键观点总结
关键观点1: 基于YOLOV8的目标检测和关键点检测
使用labelme进行yolov8数据集的制作,包括指针的整体结构选和指标的关键点选。需要将labelme格式的标注文件转化成yolo格式。
关键观点2: 基于Paddleocr的刻度OCR识别
使用Paddleocr的预训练模型进行刻度数标的OCR识别,并剔除错误的OCR结果,选定最符合的表盘刻度。
关键观点3: 图片透视变换
以指标尾部关键点为原点建立极坐标系,进行透视变换。通过确定四个刻度点在透视变换后的坐标,进行透视变换。
关键观点4: 算法优化
针对无法识别出刻度的情况进行优化,如补全0刻度,让指针位于0-0.4之间。还介绍了其他优化措施。
文章预览
向AI转型的程序员都关注公众号 机器学习AI算法工程 整体流程: 2. 基于YOLOV8的表盘指针和刻度数标的目标检测和关键点检测 2.1 指标数据集的制作 我使用labelme进行yolov8数据集的制作。首先使用矩形框选指针的整体结构,然后使用控制点依次点选指标的尾部和头部。值得注意的是控制点的点选顺序应该保持一致。后续需要将labelme格式的标注文件转化成yolo格式。 2.2 刻度数标数据集的制作 2.3 模型训练 3. 基于Paddleocr的刻度OCR识别 3.1 使用Paddleocr的预训练模型 将上一步检测出的刻度数标进行OCR识别,这里我使用 Paddleocr,具体安装参考官方说明 3.2 剔除错误的OCR结果,以及选定最符合的表盘刻度 在需要检测的图片中,压力表的种类有很多,有的刻度范围在0-1.6,有的刻度范围在0-1。我们需要明确具体检测的压力表的正确刻度属于是哪一种。下面是我例举
………………………………