表格文本图像的自动识别文献综述

 2022-08-12 11:23:17

一、表格文本图像的自动识别与人机交互

随着信息处理技术和通信技术的飞速发展,越来越多的纸面信息通过数字采集采集设备转换成电子图像,再转换成文本格式,从而使这些信息能够快捷传播、储存和查取。但是现有的表格文本图像识别系统大多以牺牲一定的算法精度来换取运算速度来满足移动端的需求,针对移动设备设计兼顾性能和效率的轻量模型是未来发展的重要方向。因此,研究如何对表格文本图像进行分析和处理,以便高效、快捷、准确地获取数字表格文本是一项十分有意义的研究课题。

(一)表格文本图像识别的发展历史

OCR(Optical Character Recognition)的概念诞生于1929年,由德国的科学家Tausheck首先提出,并且申请了专利。几年后,美国科学家Handel也提出了对文字进行识别的想法,但这种梦想直到计算机诞生后才变成为现实。现在这一技术已经由计算机来实现,OCR的意思也就演变成为利用光学技术对文字和字符进行扫描识别,并将其转化为计算机内码。

据记载,第一个OCR软件是在1957年开发的ERA(Electric Reading Automation)。它是基于窥视孔方法实现的,识别的速度是每秒120个英文字母。在此以后,世界范围内广泛地进行着OCR技术的研究和开发工作。从OCR技术的发展历程来看,可分为三个阶段:

第一阶段:第一代OCR产品出现于60年代初期,NCR公司、Farrington公司、IBM公司分别研制出了自己的OCR软件。最早的OCR产品应该是IBM公司的IBM1418。它只能识别印刷体的数字、英文字母及部分符号,并且必须是指定的字体。

第二阶段:第二代OCR产品是基于手写体字符的识别,前期只限于手写体数字的识别,从时间上来看,是60年代中期到70年代初期。IBM公司于1965年便在“纽约世界博览会”上展出了其OCR产品-IBM1287。第一个实现手写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的,两年后NEC公司也推出了同样的系统。到1974年,信函的分拣率达到92%~93%,并且广泛地应用在现实生活中,发挥着较好的作用。

第三阶段:第三代OCR产品主要解决的技术问题就是对于质量较差的文档及大字符集的识别,例如汉字的识别。最先投入汉字识别研究的日本东芝公司,于1983年发布了其识别印刷体日文汉字的OCR系统-OCR-V595,其识别速度为每秒70~100个汉字,最高识别率达到99.5%。

表格文本图像识别算法发展历史

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版