问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

OCR光学字符识别技术详解

创作时间:

作者:

@小白创作中心

OCR光学字符识别技术详解

引用

1

来源

1.

https://www.china-vision.org/cases-detail/220783.html

什么是OCR光学字符识别？

OCR（Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

在工业领域，光学字符识别（OCR）是一项机器视觉任务，包括从图像中提取文本信息。OCR技术提供高精度的文本识别，并且对中等颗粒图形噪声无懈可击。它们还适用于识别使用点阵打印机制作的字符。该技术为部分遮挡或变形的字符提供了令人满意的结果。

识别过程的效率主要取决于文本分割结果的质量。大多数识别案例都可以使用提供的一组识别模型完成。在其他情况下，可以轻松准备新的识别模型。

OCR光学字符识别技术步骤

为了实现准确的识别，有必要进行仔细的文本提取和分段。从图像获取文本的总体过程包括以下步骤：从图像中读取文本；获取文本位置；从背景中提取文本；分段文本；使用准备好的OCR模型；字符识别。

获取文本位置

文本的位置是固定的，它由称为掩码的框描述。例如，个人身份证是按照正式规范制作的。每个数据字段的位置是已知的。经过良好校准的视觉系统可以拍摄文本位置几乎恒定的图像。

文本位置不是固定的，但它与输入图像上的特征元素或特殊标记（光学标记）相关。要获取文本的位置，必须找到光学标记。这可以通过模板匹配、1D 边缘检测或其他技术完成。未指定文本的位置，但可以通过图像阈值轻松地从背景中分离字符。然后可以使用 Blob 分析技术找到正确的字符。

从背景中提取文本

文本提取过程中的主要复杂情况可能是光线不均匀。某些技术（如光规范化或边缘锐化）有助于查找字符。

原始图像
光规范化后的图像
使用 Fourier 变换进行低频图像阻尼后的图像
使用不均匀的光线采样图
经过光规范化处理的不均匀光线图像

此时，已提取的文本区域已准备好进行分段。

分段文本

文本区域分割是将区域拆分为行和单个字符的过程。只有当每个区域包含一个字符时，识别才可能实现。

使用区域形态过滤器将文本拆分为行的过程
当文本文本行分开时，每行必须拆分为单独的字符
使用拆分区域得到多个字符的字符分割

接下来，提取的字符将从图形表示形式转换为文本表示形式。

调用OCR模型库

通过调用OCR模型库，使识别到的字符以文本形式与模型库进行比对，匹配数据相似的模板，得出准确的字符信息。

字符识别

通常来说需要选择适当的字符规范大小，来分类字符的大小。

规范化后字符

热门推荐

老虎与大象：两种截然不同的野生动物对比

老虎与大象：两种截然不同的野生动物对比

八字命理学中的"鬼"：从概念到化解方法

八字命理学中的"鬼"：从概念到化解方法

手部皮肤为什么会变得粗糙？

手部皮肤为什么会变得粗糙？

如何让骑行的双腿更强壮，骑得更快 | 适合骑行者的 13 种腿部训练

如何让骑行的双腿更强壮，骑得更快 | 适合骑行者的 13 种腿部训练

未婚人群人工流产干预是为减少青少年非意愿怀孕

未婚人群人工流产干预是为减少青少年非意愿怀孕

绿色出行时代：10万元预算下电车与燃油车的全方位对比

绿色出行时代：10万元预算下电车与燃油车的全方位对比

如何控制不良团队风气

如何控制不良团队风气

张继《阊门即事》：道尽战乱之苦，向往平淡生活

张继《阊门即事》：道尽战乱之苦，向往平淡生活

董宇辉虾仁事件：直播电商的“皇帝新装”何时能脱下？

董宇辉虾仁事件：直播电商的“皇帝新装”何时能脱下？

云盘泄密事件有哪些

云盘泄密事件有哪些

明代成为知县后，怎么规划职业道路晋升更快？

明代成为知县后，怎么规划职业道路晋升更快？

我的世界更新：四人座骑！官方光影等实用功能上线

我的世界更新：四人座骑！官方光影等实用功能上线

A股绿色周报：7家上市公司暴露环境风险三达膜控股公司被罚62.5万元

A股绿色周报：7家上市公司暴露环境风险三达膜控股公司被罚62.5万元

中医药综合疗法治疗老年肛肠疾病术后便秘

中医药综合疗法治疗老年肛肠疾病术后便秘

Excel交互式图表制作指南：从基础到进阶

Excel交互式图表制作指南：从基础到进阶

强行平仓与强制平仓，理解金融交易中的风险控制机制

强行平仓与强制平仓，理解金融交易中的风险控制机制

汽车安全配置详解：主动与被动安全系统全解析

汽车安全配置详解：主动与被动安全系统全解析

时隔7年重大更新，HDMI 2.2 官宣！

时隔7年重大更新，HDMI 2.2 官宣！

《刺客伍六七》第三季樱花篇：热血与浪漫的完美融合

《刺客伍六七》第三季樱花篇：热血与浪漫的完美融合

欧冠决赛猜想：主角最好是拜仁+凯恩，这样打皇马巴萨曼城有流量

欧冠决赛猜想：主角最好是拜仁+凯恩，这样打皇马巴萨曼城有流量

浅谈汉字的演变、美学和文化内涵

浅谈汉字的演变、美学和文化内涵

OBD检测新政来袭：你的车年检合格吗？

OBD检测新政来袭：你的车年检合格吗？

人生必读的5本经典好书，越早读到越早开窍

人生必读的5本经典好书，越早读到越早开窍

单日最高客流105万人次观音桥商圈为何能这么火？

单日最高客流105万人次观音桥商圈为何能这么火？

血友病A和血友病B的区别

血友病A和血友病B的区别

水保学院方怒放研究员团队在黄土高原淤地坝规划研究中取得新进展

水保学院方怒放研究员团队在黄土高原淤地坝规划研究中取得新进展

清明祭：历史渊源、文化内涵与现代传承的研究报告

清明祭：历史渊源、文化内涵与现代传承的研究报告

《最后生还者2》剧版：艾比艾莉镜像复仇，暴力循环如何撕裂人性？

《最后生还者2》剧版：艾比艾莉镜像复仇，暴力循环如何撕裂人性？

秦风民韵之黄陵面花

秦风民韵之黄陵面花

历史上真实的赵云的战绩和成就有哪些？

历史上真实的赵云的战绩和成就有哪些？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号