首页 >> 秤盘

汉王OCR技术在金融行业的应用方案0致冷器

锦富五金网 2022-10-21 15:40:17

汉王OCR技术在金融行业的应用方案

汉王OCR技术在金融行业的应用方案 2011年12月09日 来源: 随着中国加入WTO,金融领域的传统优势逐渐削弱,面对国外同行巨大的竞争压力,尽快实现金融电子化已迫在眉睫。在金融电子化的趋势下,信息技术手段已成为金融行业新的业务增长点。快捷、准确、高效地实现银行日常业务的信息化、缩短每笔业务的操作时间、保存客户原始信息并对其进行电子认证,所有这一切都可以通过日益完善的OCR技术加以解决。事实上,国外OCR技术已在金融、保险、税务等领域广为应用。在日本,金融行业中大量的存单、储单、保单以及户籍登记等都是通过OCR技术来实现的;在美国,大规模的人口普查、针对个人的信贷业务、个人所得税申报等也都采用OCR技术。目前,在我国随着OCR识别技术的发展,OCR技术正逐步向行业应用方向迈进。

OCR技术的广泛应用,创造了巨大的社会价值。随着扫描设备及技术的成熟,在金融、证券、保险、税务、数字化图书馆等领域推广、普及OCR技术已成为可能。而OCR识别表格技术以其高速、准确、低成本的特点,成为相关行业建立影像索引并替代人工工作的重要手段。报表业务电子化处理系统在提高银行经营管理水平、降低运营成本、对外开展电子商务等新业务、寻找银行业务新的增长点等方面都具有很大的促进作用。

北京汉王科技公司凭借在OCR识别研发的技术优势,结合金融领域的行业特点,开发出符合银行、证券行业应用的OCR产品,如手写体数字、汉字识别;印刷体汉字、数字、复杂表格理解;非表格内的数字(字符)植出等技术,经过市场的检验,日趋成熟,已达到行业应用的水平。并在哈尔滨、青岛、宁波、上海的工行系统中得到广泛的认可和应用。

一.OCR技术简介

1.OCR技术简介

OCR技术是光学字符识别的缩写(Optical Character Recognition)。OCR通过扫描、摄像等光学输入方式将汉字报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术,广泛应用于大量文字资料、材料、票据、档案卷宗、文案的录入和处理领域。适合于有大量录入、保存、查阅电子文档需求的个人或单位。 OCR工作原理如下图所示: 2. OCR技术包括:

*图像处理技术

*文本理解技术与还原技术

版面理解

文字图像的分割

版面的完全还原

*识别技术

印刷体:汉字、字母、数字、符号

手写体:汉字、字母、数字、符号

*签名鉴别:

*表格/票据处理技术

3.文本型OCR技术的工作流程:

扫描→图像处理→版面分析→识别→校对→版面还原→数据存储

4.表格/票据OCR的工作流程:

扫描→图像处理→表格定位→表格检出→识别→校对→表格还原→数据存储

5.评价OCR技术的标准

*一般文本OCR

识别率

识别速度

版面理解正确率

版面还原满意度

*表格/票据OCR

识别率或整张通过率

识别速度

二.OCR技术在金融领域的应用

1.金融票据处理: 银行系统存单、储单、支票、内部流转票据等

2.大批量表格/票据处理的工作流程:

表格整理→扫描→图像处理→表格定位→表格输出→识别→纵校→横校→版面还原→数据入库

3.票据识别中常遇到的问题

*噪声干扰: 背景、底纹、污渍等

*识别区域重叠:打印或填充部分与原文字部分重叠

*识别区域漂移:表格形变、套打错位等

*粘连字符分割:如手写体的分割

*易混淆字符的准确区分

通过定制、重新设计票据, 可解决大部分问题, 大幅度提高票据处理能力.

4.票据定制中的设计要点:

*设计一组/一对/多重定位标志

*识别部分四周留有一定空白, 尽量避免重叠情况

*避免手写部分出现粘连, 尽可能有利于分割(以框或线的形式分割手写部分)

*识别字符集尽量不用易混的字符对如:

O/0,b/6, B/8, g/9, l/1

5.严格管理,为票据识别创造好的条件:

*对用户进行规范填写的教育

*要有制度,操作员要严格把关, 不合格票据不能接收或传递

*要有制度,保证票据整洁不褶皱

四. 汉王OCR在金融行业的技术特点:

*表格识别可直接还原成PTF、PDF、HTML等格式文档;

*可以对图像嵌入文本、横排和竖排文本、表格文本进行自动版面分析;

*可以自动判断、拆分、识

长沙治疗白癜风医院好不好

大连看男科医院哪家好

宁波好的遗精医院

皮肤病医院成都

徐州阳痿医院哪家好

友情链接