问题描述:
最近项目系统开发,使用到了相关证件的信息提取、识别,由于是学校科研使用,选择了百度云OCR文字识别的API。具体的相关识别身份等证件的代码将在另一篇文章中叙述,最近真的太忙了,草稿箱中还有两篇文还没发.......周末一定要发了其中的关于文字识别的文章。这个问题就是出现在调用身份证识别接口出现的,身份证上其他信息都可以识别出来,准确率还是可以的,但是身份证号码识别不出来,下图是识别出来的结果。
问题原因:
通过不同身份证图片大量对比实验, 考虑到有可能是图片信息质量等相关问题,对图片进行了实验,其中包括彩色、黑白等进行了分析。发现用真实的身份证就可以很好的识别出来身份证号码等相关信息。因此进行了查证,原来,百度OCR身份证识别,对身份证号码有个校验机制,如果使用假的身份证是识别不出来身份证号码的,返回就是“ ”。在经过彩色转黑白等一系列图片的试验,我的内心竟然毫无波动,竟然有点想笑。 最后附一张真实身份证的识别结果。