车牌识别及验证码识别的一般思路 本文源自我之前花了2 天时间做的一个简单的车牌识别系统。那个项目,时间太紧,样本也有限,达不到对方要求的95%识别率(主要对于车牌来说,D,0,O,I,1 等等太相似了。然后,汉字的识别难度也不小),因此未被对方接受。在此放出,同时描述一下思路及算法。 全文分两部分,第一部分讲车牌识别及普通验证码这一类识别的普通方法,第二部分讲对类似QQ 验证码,Gmail 验证码这一类变态验证码的识别方法和思路。 一、车牌/验证码识别的普通方法 车牌、验证码识别的普通方法为: (1) 将图片灰度化与二值化 (2) 去噪,然后切割成一个一个的字符 (3) 提取每一个字符的特征,生成特征矢量或特征矩阵 (4) 分类与学习。将特征矢量或特征矩阵与样本库进行比对,挑选出相似的那类样本,将这类样本的值作为输出结果。 下面借着代码,描述一下上述过程。因为更新 SVN Serv er,我以前以 bdb 储存的代码访问不了,因此部分代码是用 Reflector 反编译过来的,望见谅。 (1) 图片的灰度化与二值化 这样做的目的是将图片的每一个象素变成 0 或者 255,以便以计算。同时,也可以去除部分噪音。 图片的灰度化与二值化的前提是 bmp 图片,如果不是,则需要首先转换为 bmp 图片。 用代码说话,我的将图片灰度化的代码(算法是在网上搜到的): 1 protected static Color Gray(Color c) 2 { 3 int rgb = Convert.ToInt32((double) (((0.3 * c.R) + (0.59 * c.G)) + (0.11 * c.B))); 4 return Color.FromArgb(rgb, rgb, rgb); 5 } 6 通过将图片灰度化,每一个象素就变成了一个0-255 的灰度值。 然后是将灰度值二值化为 0 或 255。一般的处理方法是设定一个区间,比如,[a,b],将[a,b]之间的灰度全部变成255,其它的变成0。这里我采用的是网上广为流行的自适应二值化算法。 1 public static void Binarizate(Bitmap map) 2 { 3 int tv = ComputeThresholdValue(map); 4 int x = map.Width; 5 int y = map.Height; 6 for (int i = 0; i < x; i++) 7 { 8 for (int j = 0; j < y; j++) 9 { 10 if (map.GetPixel(i, j).R >= tv) 11 { 12 map.SetPixel(i, j, Color.FromArgb(0xff, 0xff, 0xff)); 13 } 14 else 15 { 16 map.SetPixel(i, j, Color.FromArgb(0, 0, 0)); 17 } 1...