规范顺手汉字电脑输入法
本发明针对以上的缺点和不足,经过苦心研究,反复试验,克服重重困难,终于完成本发明。本发明的基本内容及其新颖性、先进性、有益效果如下:1、汉字简体字取自《新华字典》中的简体字,比国家GB2312-80码即GB码中的简体字多1018字,含全部GB码中的简体字。简体字范围的扩大,方便了广大用户,当用户输入GB码之外的简体字的时候,不要来回转换输入法了。
2、部件取自国家GF3001-1997规范部件或整字,为减少汉字拆分次数,提高打字速度,降低重码率,增加了几个常用的便于汉字拆分的自造部件,自造部件通过双码输入成为规范部件,例如“身”双码为“tt”,“发”双码为“xy”,就象五笔字型中的“犭、礻、衤”通过补码才规范一样。本发明有的部件,五笔字型没有的为57个,五笔字型有的,本发明没有的为18个,部件的增多使汉字拆分更直观明了,并缩小了汉字的平均编码长度,提高了打字速度。
3、分区整齐,部件在键盘上的分布规律性强,75%的部件按其首笔画和笔画数科学地分布在字母键上,部件笔画数与键位序数和手指序数相对应,符合人们的指法习惯和思维习惯,好记且顺手,其余的部件按相似性分布,也好记。
4、汉字拆分规则只一条,即“见字就拆,完全按照国家语委颁布的《现代汉语通用字笔顺规范》规定的书写笔顺拆分,且最大优先”,既规范,又容易掌握。所有汉字均按书写笔顺拆分,有利于人们掌握正确、规范的汉字书写笔顺。
5、汉字输入方法简单,输入汉字时,按第一、二、三和末的顺序将汉字拆成相应的部件,输入部件所在的字母键,满四码,汉字直接上屏;不满四码,按空格键上屏,部件字和非部件字输入方法一样按拆分直接输入,重码字后加n键输入,输入方法的简单化,提高了汉字的录入速度,适合广大电脑用户使用,有利于形码输入法的普及。
6、词条数目巨大,高达50400余条,最长词条为了15个字,可输入中间带逗号的词条,均用四码输入,实现了字、词双快的目标,大大提高了汉字的录入速度。
7、发明了万能键“n”键的功能,“n”键上没有部件,“n”键用作识别码的好处是:使重码字的输入方法简单化,不要考虑汉字的未笔画和字型结构了,二码字加上n,不会和三码、四码字重码,三码字加上n,不会与四码字重码,杜绝了由于加上识别码而产生新的重码字的现象,降低了重码率,并且加上n键的四码字,不占用词条的四码空间,因为词条是按部件编码的,使词条的编码空间更大。本发明的所有特殊功能均通过“n”键输入,特殊功能有:可输入238个不成简体字的组字部件;通过对简体字拆分,可输入与之对应的繁体字、异体字、繁体偏旁字,共计3535字,均是《新华字典》中有的;可用键盘输入特殊符号、标点符号、数字序号、数学符号、汉语注音字符、实虚线和箭头、不同粗细的横竖线、字型结构虚线框、制表符、希腊字母、俄文字母、日文平假名、片假名、重叠字;可查看225个汉字的拆分示例;可查看哪些三码、四码字可用二级简码输入;可查看哪些四码重码字可用三级简码输入不重码;可查看、输入部件助记顺口溜。这些特殊功能的使用方法都很简单,查看功能可帮助用户快速学会汉字拆分,节省学习时间和过程;能输入繁体字和特殊字符,方便了用户,当用户输入这些繁体字和特殊字符的时候,不要来回转换了。特殊功能的发明既解决了实际问题又不影响简体字和词条的快速输入。
本发明创造达到的技术指标:简体字比国家GB码中的简体字多1018字,简体字共计7781个字,众所周知,字数越多重码率就会越高,况且本发明的大部件多,部件分布规律性强,但是由于本发明各方面都比较先进,重码率并不高,重码字共计297对,重码率为3.82%,98版五笔字型的简体字有6763个,重码字为258对,重码率为3.81%(依据“规范王码汉字电脑输入法及其键盘”发明专利,公开号为1204080,申请号为98100684.1),总体来说本发明的重码率是很低的。本发明需要用数字键选取的简体字为329字,其中134字通过简码输入可不用数字键选取,剩下的195字可用特殊编码输入不重码,也就是说所有简体字均可不用数字键选取。词条数目高达50400余条。
本发明的目的就是要使形码输入法简单化,既要易学易会,又要高效快捷、功能强大,超过同类形码输入法。实现这一目标并不容易,本人遇到了重重困难,通过反复编码,反复实验,反复修改,费尽心思才得以实现。
本发明的使用方法以及攻克技术难关的技术措施如下:一、简体字库的选用本发明开始给汉字编码的时候,采用的是GB码,当我用本发明按《新华字典》上的简体字逐个输入时,发现大约有1163个字打不出来,尽管这些字总体上来说是生僻字,但地名用字对某些地区来说是常用的,人名用字对某些人来说是常用的,例如“镕”字,近十年来一直是常用字,但GB码的输入法就是打不出来,会GBK形码输入法的人很少,这给广大电脑用户带来了诸多不便。本发明为了方便广大用户,添加了1018个简体字,有145个字添加不上,因为电脑GBK字符集中没有这些简体字。添加这些简体字很不容易,GB码的输入法打不出这些字,GBK码的形码输入法我不会使,只好用GBK码的拼音输入法,有些字要翻几十页,很费劲,有些简体字根本就没有,但是我不知道,总怕漏掉,需查找好几遍,确实找不到,再查区位GBK代码集字符,更费劲。现在好了,用户使用本发明会“手到擒来”得到这些字。
二、部件的选用及其在键盘上的分布本发明把用来编码的组字部件称为“部件”,部件所在的字母键称为“部件码”。选用哪些部件用来编码以及这些部件如何在键盘上分布规律性最强、好记,且又相容性好,不至于产生大量重码字,这个问题一直是形码输入法研究的重大课题。五笔字型经过多年的改进,越来越完善,但常用部件“犭、礻、衤”至今还是不完整的,需要补码,“饣、、、千、、鸟、戋”常用部件没有选用,主要考虑的是重码率的问题,或者考虑的是如果放到其他区则显着不协调。发明创造就是要与众不同,你不敢用的有利于汉字拆分的常用部件,我就要用,本发明第一次编码选用了《新华字典》上的所有的偏旁部首,增加一些其没有的常用规范部件,完全按首笔画和笔画数分布在键盘上的五区五位上,安装好一检索发现重码率很高,我把重码字一一记录下来,反复研究,查找原因,部件该改的改,该删的删,该加的加,该移位的移位,但又要基本遵守其规律性和规范性,再编码,再检索,研究如何减少重码字,这样反复修改编码高达20次,大大降低了重码率,且又不失其规律性和规范性,达到了分区整齐,常用部件多,部件分布规律性强,相容性好,好记且顺手这一技术要求。
本发明将部件按首笔笔画即撇、点、横、竖、折分为五类,“捺”归“点”类,“提笔”归“横”类,“竖钩亅”归“竖”类。将英文键盘分为撇、点、横、竖、折五个区,区号分别为丿、丶、一、丨、乙,每区5个键,每个键称为一位,位号为1~5,每区的第一个键位在键盘的中间,很整齐。每类部件对应一个区。
每区的部件按其笔画数分布在5个键位上,第1键位为1笔画和5笔画以上的部件,第2键位为2笔画的部件,第3键位为3笔画的部件,第4键位为4笔画的部件,第5键位为5笔画的部件。部件的笔画数与键位数和手指序数相对应,部件如此分布,规律性很强,既好记又好打,输入汉字很顺手。这一规律分布的部件占总部件数的75%以上。
部分部件(附图中括号内的部件),或首笔画或笔画数与所在键位部件的分布规律有所不同,主要按相似性分布,如山部、水部、卄部,欠刀头像秃宝盖,一是为了好记,二是为了减少重码字。
少部分易分辨的与基本部件的笔画结构特征和笔画形态很相似的部件未列入基本部件键位图。如“牜”视同“牛”,“”视同“羊”,各种单笔画折均在“乙1”键位上。
部件按其分布规律及相似性记忆,很好记。如“日”,首笔画为“丨”,四笔画,它就在“丨4”上;“金”的首笔画为“ノ”,超过五笔画,在“ノ1”上;“、ク、刀”形态象“冖”,同“冖”在同一键位。
为加强记忆,现给出部件助记顺口溜,要结合基本部件键位图去记,注意缺头少尾的部件。
丿1T:金鱼缶豸(zhi)御九,身臼(jiu)丿2R:两撇人氏八登头丿3E:双人犬旁食单竹,千条夕反文叉丿4W:月夜气看毛手爪牛斤采丿5Q:白鸟包头禾用舟丶1Y:谁言辛鹿赢敝眷丶2U:两点病羊北方头,欠刀头象秃宝盖丶3I:三点水,兴光头,小广走之丶4O:四点水,六方门,文火衣丶5P:高立必宝心一1G:臣亥曹雨西套其车甫一2F:二十七匡丁在甘草厂一3D:三寸提手尧(yao)干大工弋(yi)一4S:五瓦夫戈青木一5A:古戋春,燎墙戊,土士王丨1H:虎头虫早卑下黑具头丨2J:两竖儿风卜下框几丨3K:川流口上步下丨4L:水止日?业头赤尾贝丨5M:田甲骨革贵,曾由四面目乙1B:乙鼠力绞丝乙2V:两折点框乃卫了万耳仓乙3C:幺弓女已改民也习丧皮子乙4X:巴眉微山两边倒,又发那乙5Z:母矛石艮官基本部件键位图(附图):三、拆字规则部件选用的不同及部件分布规律的不同,是区分形码输入法不同的显著标志,但拆字规则的不同也是区分形码输入法不同的显著标志。汉字的拆分规则很重要,如果拆分规则过于繁杂,不易掌握,即使部件易记,重码率低,也不会有很多人喜欢。拆分规则的制定,一是要考虑其规范性,有利于人们掌握正确的汉字书写笔顺,二是要考虑其简易性,易学易会,适合大众使用。五笔字型的拆分规则不易遵循、不易掌握:不能完全按照汉字书写顺序拆分汉字,不利于人们掌握正确的汉字书写笔顺,例如“式”拆分为“七、工、丶”,就不是正确的书写顺序,很不规范;“束”的拆分按“大含小”为“木、口”,而“夷”的拆分按书写顺序为“一、弓、人”,到底哪些字按“大含小”拆分,哪些字按书写顺序拆分,没有统一标准,让人无法遵循;有的同类型的字拆分不一样,“戌”的拆分是“戊、一”,而“戍”的拆分却是“戈、人”,为何不拆成“戊、丶”;并且汉字在拆分的时候还要考虑汉字的字型结构,判断其是连的,还是交的;是散的,还是连的;是取大优先,还是兼顾直观,用于判定识别码的未笔画也不是完全按照汉字的书写顺序的未笔画,总之其汉字拆分规则不易掌握。
为使汉字拆分简单化、规范化、易学易会,本发明的汉字拆分规则只有一条,即“见字就拆,完全按照汉字的书写笔顺拆分,且最大优先”,不考虑汉字的字型结构。每个汉字都要拆成部件可的笔画顺序,即“见字就拆”,单笔画字“一”、“乙”除外,最多拆出四个部件,按第一、二、三和末部件的顺序拆分,是部件的简体字在输入时同样要拆分,按其本身之外的部件拆分,拆分规则和输入方法同非部件字一样,例如部件字“用”,在输入“用”字时,“用”的拆分为“月、丨”,“见字就拆”符合人们的思维习惯。汉字书写顺序遵照《现代汉语通用字笔顺规范》,例如“困”字,按书写顺序拆成“冂、木、一”,很规范,有助于帮助人们掌握正确、规范的汉字书写顺序;本发明之所以完全按书写顺序拆分汉字,是因为这样很规范,易遵循,且又降低了重码率可的笔画顺序,我在采用不同拆分规则给汉字编码时发现:采用按书写顺序拆分汉字要比不按书写顺序按“大含小”的方法拆分汉字产生的重码字少。“最大优先”是指在拆字时以笔画最多的部件为准拆分,如“百”字,可拆成“丆、日”,或“一、白”,可见“白”的笔画数最多,“百”的正确拆分就是“一、白”;笔画数相同的,以笔画长度之和大的为准拆分,如“丈”字,“乂”比“ナ”大,“丈”的正确拆分是“一乂”,很容易掌握。
四、汉字的输入方法输入汉字时,将汉字拆成相应的部件,输入部件所在的字母键(即部件码),满四码,汉字直接上屏;不满四码,按空格键上屏。部件字和非部件字输入方法一样。具体输入方法如下:1、按拆分直接输入汉字按拆分输入第一、二、三和未部件码,即可得到所需汉字。满四码,直接上屏;不满四码的字处在候选字窗口的最前面,即第一位,按一下空格键即可上屏。
2、简码输入一级简码:为25个高频字,只用一码就可打出你要的字。记住这25个汉字所在的键位,输入时,按一下它所在的键即可。如输入“我”,按一下t键,再击空格键,就可以打出“我”字。
一级简码汉字的编码是:Q的、W月、E年、R人、T我、Y为、U头、I广、O有、P必A地、S不、D干、F在、G一、H上、J同、K中L是、:Z以、X发、C子、V了、B经、N、M国、《》?次一级简码:比一级简码多一码“n”,方式为:“所打字的对应键+n+空格键”。如“春”字,按“an”,再按空格键即可。这些字为次高频字,正常拆分输入时需用数字键选取,用此简码输入,简单不重码,解决了23个需用数字键选取的常用字,这是解决重码字的一种技术方法。“一”是一级简码,又设成了两码字,主要是为了输入两字词时使用。
次一级简码汉字的编码是:Q氏、W牛、E千、R八、T九、Y仁、U北、I江、O浅、P享、A春、S泰、D三、F历、G一、H戒、J几、K借、L慕、:Z矛、X玩、C好、V阿、B乙、N、M四、《》?
二级简码:按拆分顺序,只输入前两部件码即可得到所需汉字。
三级简码:按拆分顺序,只输入前三部件码即可得到所需汉字。大部分四码字可用三级简码输入。
3、部件码重码的字的输入方法形码输入法完全不重码是很难的,不同的形码输入法输入重码字的方法是不同的。本发明在字数增加、部件增多、部件分布规律性很强,输入方法简单的情况下,重码率却很低,主要采用了以下先进技术:对产生重码字较多的部件采用双码输入:例如:“”为“ee”、羽cc、米us、皮cx、甫gy。
按首笔画和笔画数分布的部件,如果哪个部件产生的重码字较多则把它强行分开:例如“王”和“木”在一起产生的重码字就较多,则把“王”分开。
本发明为了减少重码字,简化重码字的输入方法,节省四码空间,识别码只用一个“n”键,且“n”键上没有部件,重码字加上“n”后,不会产生新的重码字,也不会缩小词条的编码空间。重码字中有一个相比之下较为常用的字不加识别码,其余的加识别码,使用很方便。
重码字的输入方法如下:①二码重码字的输入两部件组成的汉字,输入完部件码后,如果候选字窗口中的第一个字不是你所要的字,你按一下n键,这时如果窗口中第一个字是你要的字,按一下空格键表示结束;如果还不是你要的字,再按一下n键,就可得到你要的字了。
②三码重码字的输入三部件组成的汉字,输入完部件码后,如果候选字窗口中的第一个字不是你所要的字,你按一下n键,就可打出你要的字。
③四码重码字(含加上识别码满四码的重码字)的输入主要靠简码解决,如果四码重码字的第二个字比第一个字常用,第二个字一定是简码字。例如输入“lukj”后,候选字窗口中出现的字为:1:冕2:晚,第一个字,按空格键上屏,或者不用管它,接着输入其他的字,“冕”会自动上屏;第二个字,可按键盘上方的数字键2选取。“晚”比“冕”常用,“晚”字是二级简码,输入“晚”时,按字母键lu键即可。又如输入“udnn”,出现的是1:兰2:头,“头”是一级简码字,输入“头”时按简码输入,不要按拆分输入。
掌握以上方法,基本上用不到数字键选字了,因为剩下的重码字大都是生僻字,有195个字。这些重码字是用特殊方法编码的,需要记忆,可以不学,遇见这些字就用数字键选取,或者记住几个常用点的字的输入方法。解决方法如下:1、按最后一个部件码重一码输入(68字),如“邯”字,输入“fv”后,再击一下v键,即可得到,又如“沥”字,输入“氵厂力力”的部件码,直接上屏。用此种方法输入的汉字有:芭虔兑邯昏妃禾坝钳指仿铅丘沾仨迂疵伧沥皿甾夯邛刈贲芷苜菥劢泗洎汊卟袼佤佴钍钆舫钌娈疝巳孑颀厍疔贔软馉槚坰旂玘訄礽怗杙牸鲌枓痁垱珉靖眊。
2、按最后一个部件码重两码(24字),如:栈→木戋戋戋(rddd),直接上屏。这类字有:戋沽汀祜仝栈钴茸亍舁钿钬氘茜伕甪冇瓩氥沚乂钇卩。
3、四码字的第四码改为n(38字),如:裂(gejn),直接上屏。这类字有:珂瓠厣跄踯裂魍颔钺貘钶囟粢腱麋屙謷阇鞥璠滆暅縠祎徛骙蓂糵酺廋薙鲷渰邅齆鮣噏韨。
4、容错码(22字),彀(aucx)、觳(auux)、苷(ffg)、甙(gfgy)、泔(ifg)、疳(ufg)、坩(afg)、簪(efjl)、笸(egkb)、篚(eghb)、笄(egf)、簌(egkr)、篰(epkv)、箑(egxl)、籥(ergf)、戎(dbty)、(ytj)、麾(yssw)、麽(yssv)、勹(rnn)、凵(vnn)、衤(ybhu)。
5、四连击(19字),铗(qqqq)、潸(wwww)、孖(eeee)、偾(rrrr)、钼(tttt);遒(uuuu)、沆(iiii)、袆(pppp);垇(aaaa)、艿(ssss)、卉(dddd)、厝(gggg);躏(hhhh)、兕(jjjj)、嘤(kkkk)、铀(mmmm);酯(zzzz)、龆(vvvv)、龀(bbbb)。
6、xnnn法(24字),魆(qnnn)、(wnnn)、铏(ennn)、弇(rnnn)、玍(tnnn);沘(ynnn)、泂(unnn)、汴(innn)、炆(onnn)、黼(pnnn);瑱(annn)、顸(dnnn)、茝(fnnn)、酞(gnnn);韭(hnnn)、襚(jnnn)、踶(knnn)、赈(lnnn)、踖(mnnn);郃(znnn)、鳀(xnnn)、鳉(cnnn)、鳣(vnnn)、鲀(bnnn)。
至此,每个字均可不用数字键选取。
五、词条的输入方法本发明的词条最长为15个字,中间可带逗号,无论多长词语均用4码输入,“一”和“乙”如果需要用两码,“一”的两码是“gn”;“乙”的两码是“bn”。词条数目越多,长词条越多,录入汉字的速度就赶快,例如录入“在天愿作比翼鸟,在地愿为连理枝”,按词条的录入方法输入“fgfs”四码就可打出,如果按单字逐个录入,并且能用简码的用简码,加上不满四码的字需用空格键上字,击键次数共计45下,可见用词条输入方法输入汉字的速度是相当惊人的。本发明的词条数为50400余条,均不和单字重码。本发明的词条是广义的,不局限于《现代汉语词典》中的词条,只要字与字之间能连用且较常用,不超过15个字符,不和字重码,均可认为是词条,例如:“你能、好得很、得很、我爱你、之间、想办法、均可、敬请、场上比分是、比去年同期增长”,总之,你在候选字窗口中看到的词条,均可用输入词条的方法直接输入,打字时,尽量用词条输入,以提高打字速度。
词条编码规则是:①两字词编码规则:每字取其前两部件码组成。
②三字词编码规则:前两个字各取第一码,最后一字取前两码。
③四字词编码规则:每个字各取第一码。
④多字词编码规则:取第一、二、三字的第一码和最后一字的第一码。
六、万能键N键的功能及使用方法万能键的功能及其使用方法是本发明的又一大特色,n键上没有部件,不影响简体字和词条的输入,通过它可以完成很多特殊功能,满足不同用户的需要。
1、用作识别码,形式为:“XXN、XXNN、XXXN”。X代表N键之外的25个字母,下同。
2、用于次一级简码(25字),形式为:“XN”。
3、用于输入组字部件(238个),形式为:“NX”。组字部件在键盘上完全按其首笔画和笔画数分布。如“衤”首笔画是“丶”,5笔画,在“丶区”的第5个键上,输入“np”,再用键盘上方的数字键选取,是几按几;“叒”首笔画是折,超过5画,在第一个键上,按“nb”,如果需要翻页,按键盘上方的“-”键和“+”键,或者按“PageUp”键和“PageDown”键。
GB码中的偏旁部首有46个,有两种输入方法,一是这一种,另外一种是按其单笔画拆分,取第一、二、三和未笔画,如重码,后加识别码n,或nn。例如:“丿”编码为“tnn”,“扌”编码为“ghgn”,“疒”编码为“ygtg”。
4、用于输入98版《新华字典》中的繁体字、异体字、繁体偏旁字(3535字),形式为:“n+简体字拆分的第一、二和末部件码”,如输入“紅”字,按“n、纟、工”,即“nbd”;输入“偉”字,“偉”是“伟”的繁体字,按“n、亻、二、丨”即“nrfh”即可。如有重码用数字键选取,每组重码字最多为10个。本发明主要是为了快速输入简体字,繁体字如此输入,既简单又不影响简体字和词条的输入。缺点是你必须知道繁体字对应的简体字是如何写的。
5、直接按“n”键,可查打特殊符号(43个)。
6、按“nn”,可输入标点符号(39个),主要是键盘上没有的标点符号。
7、按“nna”,可查看汉字的拆分示例(225字)。由于部分部件不能输入,示例中的部分部件用与它相似的部件代替,“乙”代表各种单笔画折。
8、按“nns”,可查打一些重叠字(81字)。如“囍、虤、骉、惢”。
9、按“nnd”,可查打汉语注音字符(37个)。
10、按“nnf”,可查打一些数学符号(54个)。
11、按“nng”,可查打数字序数(82个)。
12、按“nnh”,可查打一些点、实线、虚线、曲线、箭头(54)。
13、按“nnj”,可查打一些不同粗细的横线、竖线(15个)。
14、按“nnk”,是一些字型结构虚线框(15个),输入后,放大才能看全。
15、按“nnl”,为制表符(76个)。
16、按“nny”,可输入希腊字母(48个)。
17、按“nnu”,可输入俄文字母(66个)。
18、按“nni”,输入日文平假名(83个)。
19、按“nno”,输入日文片假名(86个)。
20、按“nnr”,可查看哪些三码、四码字可用二级简码输入(179字)。
21、按“nne”,可查看哪些四码重码字可用三级简码输入(90字)。这些字要用三级简码输入,否则,你就得用数字键选取。
22、按“nnn”,可查看部件助记顺口溜(25条),接着按某一字母键,可输入某一键上的部件顺口溜。如按“nnnt”,可打出T键上的部件顺口溜。
23、按“nnnn”(10条),为本输入法的输入方法的简介。