基于SVM手写体汉字识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采用递归算法可以计算出16维小波特征
笔画密度投影算法
按照以下公式计算笔画密度投影特征:
Mh1 , Mh2 ,, Mh24 Ms1 , Ms2 ,, Ms24 M Mp1 , Mp2 ,, Mp24 Mn1 , Mn2 ,, Mn24
其中Mh1~ Mh24,Ms1~ Ms24,Mp1~ Mp24, Mn1~Mn24分别表示00,900,450 和1350 方向 线扫描投影笔画灰度累加值。
统计预测结果,得出预测准确率。
结束
2018/11/11
福州大学毕业设计答辩讲稿
14
结果分析
参与实验的共有7个手写体汉字,每个汉字120个样本,其中训练集 100个样本,测试集20个样本。
准确率(%) 120 100 80 60 40 20 0 训练集 小波多网格算法 测试集 训练集 测试集 训练集 复合特征 测试集 复合特征 小波多网格算法 笔画密度投影算法 笔画密度投影算法
去噪和缩放
细化
特征提取算法
1. 小波多网格算法:16维 2. 笔画密度投影算法:96维 3. 特征融合算法:小于或等于112维
2018/11/11
福州大学毕业设计答辩讲稿
10
小波多网格算法
计算图像的质点坐标 :
m n m n G i c ( i , j ) / c(i, j ) i i 1 j 1 i 1 j 1 G m n m n G j c ( i , j ) / c(i, j ) j i 1 j 1 i 1 j 1
准确率(%)
结果总结
实验结果表明,使用特征融合的方法可以有 效结合两种算法的优点,目前一些有脱机手写体 汉字识别功能的产品总体识别率仅有30%左右, 因此本实验结果证明本文提出的方法是可行的且 有一定的实用价值。
谢谢!
2018/11/11
福州大学毕业设计答辩讲稿
17
1. 小波多网格特征提取法 2. 笔画密度投影法
3. 复合特征
分类识别算法
1. 支持向量机算法 2. LIBSVM工具
2018/11/11 福州大学毕业设计答辩讲稿 4
图像预处理
图像二值化
去噪 分割与缩放 细化
2018/11/11 福州大学毕业设计答辩讲稿 5
预处理前
源自文库 二值化和锐化效果
计算变换子图中4个网格的灰度平均值 :
p k H t1 ci, j / p k , t 1,2,3,4 p n H t 2 ci, j / p n k , t 1,2,3,4 k m k H ci, j / m p k , t 1,2,3,4 t 3 m n H t 4 ci, j / m p n k , t 1,2,3,4
特征融合算法
将两种方法提取出来的特征数据 合在一起,去除一些冗余维的数据, 形成新的特征数据。
SVM模型训练与测试
开始 读取特征数据
根据特征的分类标签,随机选取 100个标签作为训练集,其余的作 为测试集
对每个子集用svmscale工 具进行缩放
用svmtrain工具 训练模型
用svmpredict工具就训练的模型 对训练集和测试集进行预测,生 成*.predict结果文件
研究背景
联机手写体汉字识别:难度小,发展成熟 脱机手写体汉字识别:难度高,有待发展
研究意义
理论意义 :促进相关学科的发展与完善以及各 学科的相互融合与借鉴 应用价值 :促进人机交互,加快信息流动,创 造巨大的经济效益
2018/11/11
福州大学毕业设计答辩讲稿
3
研究方法
特征提取算法
基于SVM的手写体 汉字识别
姓名: 学号: 高长进 030601504
福州大学数学与计算机科学学院
2018/11/11
福州大学毕业设计答辩讲稿
1
研究目的
脱机手写体汉字识别作为汉字识别领域 中最难的课题,具有相当的研究价值和发 展前景。 为了探寻进行脱机手写体汉字识别的更 加实用有效的方法,本文讨论了利用支持 向量机SVM对脱机手写体汉字进行识别的 方法。