-
题名基于UCI数据集的OCR光学字符识别
被引量:3
- 1
-
-
作者
史素霞
常婉秋
宋志英
-
机构
河北政法职业学院建设工程与法务系
中国农业大学土地科学与技术学院
农业农村部农业灾害遥感重点实验室
-
出处
《科技创新与应用》
2022年第35期50-53,共4页
-
文摘
该文通过实验利用公开规范的UCI数据集通过3个步骤建立字符识别模型,一是基于主成分分析,提取UCI记录中有较好识别效果的变量因子;二是基于逐步回归,初步建立字符识别模型;三是基于BP神经网络,对识别模型的各参数进行优化。结果表明,UCI数据集中记录的16个参数变量可以通过7个主成分因子进行很好的描述;初步建立的回归识别模型显著性水平等于0.05;通过BP神经网络的学习优化,最终建立的识别模型精度为87.5%。总体来说,数据的预处理和神经网络的学习精度是字符识别精度的关键,可以通过对大量UCI数据集进行训练,提高字符识别的精度。
-
关键词
字符识别
主成分分析
逐步回归模型
BP神经网络
UCI数据集
-
Keywords
character recognition
principal component analysis
stepwise regression model
BP neural network
UCI dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-