ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版( 二 )


于是, 我认识到“同等对话”很重要 。 如果我想要实现小康家庭的生活, 那我去找全球商业大亨请教, 可能起不到什么效果, 反而去跟楼下五金店的老板拉拉家常, 能有所收益 。
现在, 我弄明白了OCR识别 。 同时, 我也想起之前的迷茫和无助 。 现在, 或许还存在很多曾经的我, 我要自己帮一下自己 。
本文会讲整个OCR的完整流程, 以及其中的难点和解决方案(思路以及术语关键词) 。 如果你是程序员的话, 我在专业版里, 还有代码详解 。
OCR这个行业, 如果无法入门, 掉头就走, 一旦入门, 爱不释手 。
好了, 前言我说完了, 也算是导读, 如果觉得本文适合你, 可以继续往下看了 。
二、OCR识别的全流程(科普版)OCR是一个简称, 全称叫Optical Character Recognition, 中文是:光学字符识别 。
它的本质是:把图像形状转变为文本字符 。
下面说一下, 我在教育行业是如何应用OCR的 。
信息化教学越来越普及, 很多教学素材都要搬到信息化平台, 比如试卷试题 。 那么, 纸质的试卷要电子化, 就会用到OCR识别技术 。

ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版

文章插图

上面那样做投影, 拆不出单个字符 。 因为一篇文档的字, 就像城墙一样, 磨砖对缝, 无法切分 。
但是, 换成对一行文本进行投影分析, 就可以了 。 看下面这个图, 非常之清晰 。
ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版

文章插图

通过投影之间的间隙, 我们就可以把每个字符切割开来 。
2.2.4 切字有了行与列切分的方法, 相信把字符切出来, 应该是不难的 。 其实就是很简单, 代码也不复杂 。 全都是数组的分析 。
那么切出来的字, 最终是这样 。
ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版

文章插图

不是白纸黑字吗?为什么都变成了黑底白字呢?
其实, 这是故意的 。 为的就是要方便OCR进行识别 。 我们都知道(也可能不知道), 在RGB色值中, 0代表黑色, 255代表白色 。
不管计算机的算力多么强大, 一秒钟能运算多少亿万次, 它的底层还是二进制, 也就是101010 。 你可以简单地理解成它只认识数字 。 你看到字母A是A, 计算机没有你那么厉害, 计算机偷偷地在显示器上输出A这个图案, 然后心里暗自记下这个物体是65 。
因此, 任何文本、图片、音视频, 最终都要被解析成数字, 这样计算机才能干活 。
扯这些有什么用?你在逃避什么?黑白颠倒的问题呢?
别急, 马上 。 我们希望计算机识别图片上的字, 而不是背景 。 所以, 把背景置为黑色, 也就0, 把字符变成白色, 也就是255, 这样有利于计算机更专注于分析字符的痕迹 。 因为, 0默认是忽略掉的 。
你看, 说着说着, 就谈到了人工智能的机器学习 。 哈哈, 又转场了, 真爽 。
2.3 识别字符图片究竟是怎么变为字符的?它还能自己学习 。
ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版

文章插图

计算机通过学习一些样本之后, 遇到一些从未遇到过的同类样本, 也能正确地识别出结果, 这很神奇 。 我想了一夜也没想明白 。
ocr图像识别技术 一文讲通OCR文字识别原理与技术全流程科普版

文章插图

第二天, 我带着孩子去公园, 公园门口有一对大狮子 。 孩子指着狮子说, 狗!我说, 哦, 那不是狗, 那是狮子, 跟狗有点像是不是 。 又走了一段路, 公园里又出现一个麒麟的雕塑 。 孩子指着它说, 狮子!我说, 那不是狮子 。 孩子说, 是狗 。 我说也不是狗, 它叫:麒麟 。 我感觉到, 孩子的大脑在反向矫正信息, 这就是监督学习 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。