光学字符识别(OCR)

OCR是指对图片中的文字进行查找、提取、识别的一种技术。
一般步骤:
文字检测、文字识别
评估指标
拒识率(召回率)、误识率、识别速度、稳定性
CTPN
步骤:
检测文本:16像素小区域,每个proposal(提议)使用10个锚点高度在11-273之间(0.7).细粒度的文本提议
利用RNN连接多个proposal。使用双向LSTM利用前后两个方向的信息对proposal进行连接
边沿细化。
缺陷:针对极小尺度文本检测有遗漏,对非文本的水平的检测效果并不好。
SegLink  segment和link
(x,y,w,h,
文字识别技术
CRNN (CNN + RNN) +CTC
网络结构:

特征提取
将特征图拉伸成特征向量
序列标注
转录
除掉重复值,修改错误值,误差使用前向算法进行反向传播,应用随时间反向传播(BPTT)进行计算
网络训练
使用随机梯度下降(SGD)进行训练。梯度由反向传播算法计算。




全部评论
看不懂,好高深啊
点赞 回复 分享
发布于 2022-10-24 14:38 山西

相关推荐

程序员牛肉:小牛肉来也! 基本破不了局了,我给你的建议是适当放弃秋招,投递大厂的日常实习之后赶明年的春招。 在没有实习的情况下,你的项目经历给面试官的作用就是提供提问点方便面试官来提问八股以及场景题而已。因此你现在简历的写法不太对,要着重突出项目中使用的技术点,而不是像你现在这个写的很宽泛。 最好是“基于xxxx技术解决了xxxx问题,解决了xxxx边缘场景问题”。最好是这样写,方便面试官对你的简历进行提问。 最后的最后,问题其实不在你。今年的秋招确实比较寒冬一点,所以找不到是正常的。要做好打持久战的准备。
Java学习交流
点赞 评论 收藏
分享
评论
点赞
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务