This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on ...This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on computer clusters, for the purpose of dynamically improving the recognition precision of the digitized texts of a million volumes of books produced by the China-US Million Books Digital Library (CADAL) Project. The practice of this center will provide helpful reference for other digital library projects.展开更多
引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的...引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。展开更多
目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberr...目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberry Pi 4B作为边缘节点,使用视频采集卡、摄像头、平板计算机等搭建硬件环境。其次,基于卷积循环神经网络(convolutional recurrent neural network,CRNN)优化OCR模型,通过软硬件协同方式实现医疗终端视频流处理与数据提取。最后,采用FineBI工具实现交互界面设计与数据库链接。结果:经实验验证,该平台的硬件环境可靠、稳定,优化后的OCR模型文本识别准确率提升,且采用该平台能够实现对医疗设备数据的快速、自动化采集。结论:采用该平台能够为医护人员提供全面、准确的医疗救治装备数据支撑,有利于提升医疗救治效率。展开更多
目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字...目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。展开更多
在现代社会,发票作为一种重要的证明凭证,被广泛应用于各个行业。传统的发票录入和处理方式,依靠人工手动识别并输入信息,不仅效率低下、成本高昂,而且容易出现误差。光学字符识别(optical character recognition,OCR)技术和二维码识别...在现代社会,发票作为一种重要的证明凭证,被广泛应用于各个行业。传统的发票录入和处理方式,依靠人工手动识别并输入信息,不仅效率低下、成本高昂,而且容易出现误差。光学字符识别(optical character recognition,OCR)技术和二维码识别技术已经成为自动化发票录入和处理的重要手段。基于OCR和二维码技术,实现发票的自动识别,将识别的发票信息录入关系型数据库管理软件中方便后续处理,提高企业财务管理的信息化程度和准确性,为企业改进管理和提高效益提供技术支持。展开更多
为提升办公效率,增加文档数据信息录入、数据整合准确性,引入光学字符识别(Optical Character Recognition,OCR)技术,可有效地实现文档智能化运用。文本针对OCR识别技术基本特征、在不同行业中应用现状、技术优势等方面进行分析,重点关...为提升办公效率,增加文档数据信息录入、数据整合准确性,引入光学字符识别(Optical Character Recognition,OCR)技术,可有效地实现文档智能化运用。文本针对OCR识别技术基本特征、在不同行业中应用现状、技术优势等方面进行分析,重点关注OCR识别技术的功能升级,研究其在文档智能化领域的应用,以期能够增加OCR识别技术的扩展性。展开更多
基金Project supported by China-US Million Books Digital Library Project
文摘This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on computer clusters, for the purpose of dynamically improving the recognition precision of the digitized texts of a million volumes of books produced by the China-US Million Books Digital Library (CADAL) Project. The practice of this center will provide helpful reference for other digital library projects.
文摘引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。
文摘目的:设计一种基于光学字符识别(optical character recognition,OCR)模型的医疗救治装备数据采集平台,以实现应急灾害救援条件下医疗数据的自动化采集。方法:该平台以医疗物联网“感知—网络—平台”架构为基础构建。首先,选取Raspberry Pi 4B作为边缘节点,使用视频采集卡、摄像头、平板计算机等搭建硬件环境。其次,基于卷积循环神经网络(convolutional recurrent neural network,CRNN)优化OCR模型,通过软硬件协同方式实现医疗终端视频流处理与数据提取。最后,采用FineBI工具实现交互界面设计与数据库链接。结果:经实验验证,该平台的硬件环境可靠、稳定,优化后的OCR模型文本识别准确率提升,且采用该平台能够实现对医疗设备数据的快速、自动化采集。结论:采用该平台能够为医护人员提供全面、准确的医疗救治装备数据支撑,有利于提升医疗救治效率。
文摘目前通信机房图片归档,人工操作占据了主导地位,然而这种方式存在效率低、易出错等缺陷。在此背景下,文章提出了一种基于光学字符识别(Optical Character Recognition,OCR)模型的通信机房图片归档系统。该系统通过自动识别图片中的文字信息,分析图片所属的机房位置,进而按照机柜位置分类归档图片,实现自动化管理。经过测试,该系统的归档准确率达到了98%以上,显著提高了通信机房图片归档的效率。
文摘在现代社会,发票作为一种重要的证明凭证,被广泛应用于各个行业。传统的发票录入和处理方式,依靠人工手动识别并输入信息,不仅效率低下、成本高昂,而且容易出现误差。光学字符识别(optical character recognition,OCR)技术和二维码识别技术已经成为自动化发票录入和处理的重要手段。基于OCR和二维码技术,实现发票的自动识别,将识别的发票信息录入关系型数据库管理软件中方便后续处理,提高企业财务管理的信息化程度和准确性,为企业改进管理和提高效益提供技术支持。
文摘为提升办公效率,增加文档数据信息录入、数据整合准确性,引入光学字符识别(Optical Character Recognition,OCR)技术,可有效地实现文档智能化运用。文本针对OCR识别技术基本特征、在不同行业中应用现状、技术优势等方面进行分析,重点关注OCR识别技术的功能升级,研究其在文档智能化领域的应用,以期能够增加OCR识别技术的扩展性。