# Chinese_OCR **Repository Path**: yangdashi/Chinese_OCR ## Basic Information - **Project Name**: Chinese_OCR - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-11-06 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Chinese_OCR ### 项目结构: 1、ChineseRecognition.py
使用12层卷积层神经网络
2、ChineseRecognition_sample.py
使用5层卷积层的神经网络
3、GenerateWords.py
生成字体图像的文件
4、Segmentaion.py
对待识别图像,进行单字切割的类
5、chinese_labels
字符集
6、chinese_fonts
存放字体的目录
7、predict
存放待预测图片和预测结果的目录
### 运行项目步骤: 1、生成循环及测试数据 ``` python GenerateWords.py --out_dir ./dataset --font_dir ./chinese_fonts ``` 2、训练模型 使用含12层卷积层的神经网络来训练 ``` python ChineseRecognition.py --mode=train ``` 使用含5层卷积层的神经网络来训练 ``` python ChineseRecognition_sample.py --mode=train ``` 3、测试模型 ``` python ChineseRecognition_sample.py --mode=test ``` 4、预测模型 ``` python ChineseRecognition_sample.py --mode=predict --predict_dir=./predict --to_predict_img=toPredict.png --predict_result=predict.result ``` ### 项目预测的流程: 1、待预测图片toPredict.png是一篇文章的截图
2、执行预测模式,先对进待预测图片进行单字切割,结果存成一个list数组,list数组中每个元素为待预测图片中一行文字的list
3、对list中每个汉字进行识别,并且把结果输出到predict.result文本中
### 在测试集上的正确率: top 1 accuracy 0.999 top 5 accuracy 0.999 更多深度学习、机器学习、统计学习的内容可以观看我的博客 [段逍遥的博客](https://blog.csdn.net/u011070767)