联机手写汉字识别方法
1、笔输入笔(式)输入也叫做手写输入。它的用途是在一块跟计算机连接的书写板上写字,即时把字符输入计算机。必须指出的是,笔输入的作用不只是输入字符的图形,还要据此对该字符加以识别,并用机内代码来表示,以便于对输入的文字作进一步处理。联机手写汉字识别有时叫做“笔(式)输入”。顾名思义,这是用笔把汉字“写”入计算机,而不是用键盘“敲”入计算机。改敲为写,既不需要死记每个字的编码,而是像通常写字那样,用笔把字直接写入计算机,更符合中国人书写的习惯,也实现了汉字实时输入的要求;此外,这种输入方法既可以用于办公室内,也可以用于室外或其他特殊场合,是一种易学易用的较好的汉字输入方法。
2、笔画编码法笔画编码法是IBM公司的E.F.Yhap等人1981年提出的。这种识别方法的基本思想是:汉字结构分为笔画、字根和单字三个层次。笔画是构成单字的基本单元(基元),若干笔画构成一个字根;字根是组成汉字的基本部件,相当于拼音文字中的字母,按照一定规律把若干个字根加以组合,就构成一个单字。
3、汉王笔汉王笔是中国科学院自动化所研制成功的一种笔式输入系统,它是.国内外最早投入市场、获得广泛应用的产品。汉区痊鹳矾王笔所采用的笔段,共11种,叫做广义笔段,所有楷书汉字都由这些广义笔段以不同长短和不同结构组成。根据对汉字字形分析可以看出,组成汉字的笔段的相互位置可分为连接型与分离型两大类:两个分离笔段的相对关系有左上、中上、右上、右中、右下、中下、左下和左中,共8种;相连两个笔段则有9种连接方式。利用这17种笔段之间的稳定关系,可以建立一种规则来确定两个笔段的优先次序。这种规则可以表示为一种映射。这样,一个汉字的笔段串只与该汉字中的各笔段的类型、笔段关系以及映射有关,而与笔顺没有关系。基于上述方法实现的联机手写汉字识别系统能适应不同的笔顺变化,而且具有“学习”功能,除能识别约12000个手写楷书汉字(包括国标6763个字和部分繁体字)以及各种字母、符号之外,使用者还可以任意定义1000~1500个字模,以不同文件名存放在软盘中,随时调出使用。例如,用户可以定义某一种图形代表一个汉字词、组,书写时只要在书写板上画这个简单图形,就可输入相应的词组。这样既提高了识别速度,也可使识别率有所改善。这种笔输入技术最近又扩展到日文和韩文识别,效果甚佳。
4、文通笔“文通笔”在解决上述笔顺和连笔的两个问题上做了一些努力,取得了一些成果,并在全国评测中获得较好的评价。取得这些进展的原因,一方面是由于计算机技术的迅速发展,机器资源已经不是制约识别算法的主要矛盾,设计者不必过分担心计算机的容量和速度的问题,可以更大胆地设计一些具有较高的抗干扰能力的算法;另一方面,在识别算法上,文通笔的研制者提出了一种富有创造性的结构法与统计法相结合的新技术,较好地解决了单纯的结构识别方法难以适应手写汉字字形及笔顺变化的问题。下面扼要介绍这种算法的要点。