优胜从选择开始,我们是您最好的选择!—— 中州期刊联盟(新乡市博翰文化传媒有限公司)
0373-5939925
2851259250@qq.com
我要检测 我要投稿 合法期刊查询
您的位置:网站首页 > 优秀论文 > 文学论文 > 正文

创建笔画数字模式,探索汉字新的字序

作者:唐维建,唐维强,唐倩琳来源:《文化产业》日期:2024-11-02人气:299

汉字是中国人发明的记录汉语的文字书写系统,也是世界上唯一被沿用至今的古老文字,在漫长的历史过程中,人们不断的创造新的汉字以满足生产和生活的需要,有的字义也会随之变化。汉字的词汇义项众多,通用假借频繁,初学者不易把握字义,因此提供音韵、注解、例句等等的工具书运用而生。

《说文解字》是由东汉文字学家许慎于公元121年编著而成的,它开创了部首检字的先河,经唐宋明清等几个朝代都对部首排检法做过多次的改进。此后的1900,人们一直不断地探究着更简易、更合理、更巧妙的汉字排序法……

,字典和辞书常用的是音序排列法、部首笔画排列法、号码排列法。

1.音序排列法,同音字的排序有分歧,不知音的字是无法检索的。

2.部首排列法,无论在立部还是归部都未统一。查一个字要分别在部首目录、检字表、正文三个区域寻找才能完成。

3.笔画排列法,相同笔画数的汉字存在二义性。

4.号码排列法,笔形和代码之间没有理据,规则比较复杂,重码字较多。

现行的排检法或多或少的有些缺点,根据多年的实践和研究,我们提出一种新的“笔画形状数字模式”。

一、笔画形状的数字模式

现行汉字的笔画形状分类方法很多,最常见一种分类是将笔形分为31个,其中包括基本笔形6个和派生笔形25个。

目前,现行的汉字笔画分类、命名还不统一,有把二三十种笔形归入“横、竖、撇、捺、折”五种基本笔画类型的,还有个别笔形归类不当的问题(如把“竖钩”归入“竖”)。为了呈现内聚、均匀的风格,在有些字中有的笔画要发生形变,规范字形中笔画形变任意性的现象时有发生,这表明我们在笔画这个层次上整理工作做得不细,规范水平还有待提高。

刚开始研究汉字时,因整理分类笔画、编写记忆口诀而陷入泥淖,挣扎在漫长的瓶颈期内……后来,经过认真思考、热烈讨论、仔细研判,我们像考古队员一样,将断裂、散乱且有残缺的几十个汉字笔画修复、整理成(4大脉系)10串“(逻辑)链条”,并组建一个理据性的汉字笔画形状数字模式。 

笔画形状分类分级示意图的诠释及主要特点:

1.左侧的第0123组笔画形状的尾梢是顺时针旋转,右侧的第456789组的笔画形状的尾梢是逆时针旋转。

2.(左侧的)第0组与(右侧的)第4组的笔画形状其左右大致对称的。第1组与(整体顺时针旋转90º的)第6组也是左右大致对称的;同理,对照第2组与第7组、第3组与第8组也是如此。

3.从笔画形状的外部轮廓上看,整齐一致,协调美观。10个组的图形都有着高度的相似性。

4.同一组的笔画形状有依次递增的明显特征。

5.依据分类、分级关系,只要记住4个笔画(即第0146组的第1个笔画),再借用联想方法,便能记住每个笔画的形状所在位置及其排列顺序。

看,这一排排、一摞摞笔画就像超市货架上摆放的“香蕉”,顺溜、整齐又好看。假如你想,从中随机选取两个笔画并互换一下位置,就会有乱套和不适的感觉。这说明,笔画形状的确有自然天成之美。

二、笔画的标号、代号和名称

“据形系联”(许慎语),这句话现用于区分笔画上也很合适的。我们以“相同尾梢”作为标准来,先划分笔画的类别,同类中再按照笔画形状的折点数量、单体长度来排列次序,并编制了笔画的标号、代号、名称表。

笔画的标号、代号、名称表(表1)的说明:

横向叠层的有10个组,纵向并列的有5个级(组内序号),全表共5010×5)个笔画。其中“(现行)笔画”25个,占位率50%;“准笔画”(笔画家族的“新生儿”,当前为预备梯队22个,占位率44%;“泛笔画”(前两项之和;文中多用此义)47个,占位率94%;还有空位(L1Y1F1有名无实的)3个,占位率为6%

05个笔画,对应的标号(左上角)是0102030405;对应的代号(右上角)是P1P2P3P4P5;对应的名称(左下角)是撇一、撇二、撇三、撇四、撇五。其余的9个组也以此类推。

每一个笔画都是两位数字的标号,它由组号、级号组成,组号在十位上、级号在个位上(这里的标号也具有序号功效);代号由该笔画的拼音首字母、组内序号两项组成;名称由该组名、组内序号两项组成。

标注*的笔画有P1P2P5S1S2S3X2X4L2L4D1D2D3H1H2Y3F3T2T419个,可作有些汉字的第一笔;未标注的笔画则不能用作汉字的第一笔。

笔画全集、例字表(表2)中笔画折点样式的解读:(表2  图片来源:作者自绘)

1.折点之处有停顿,通常是墨迹加重、加宽(最常见的一种)如:“又”的第1笔的折点、“台”的第14笔的两个折点。

2.折点之处无明显的折角(也称“弯”,书写时不做停顿、平滑而过。如:“儿”的第2笔的第1个折点、“朵”的第2笔的第2个折点。

3.折点之前由粗变细、之后由细变粗,折点在最细的部位。如:“队”(左耳刀旁)的第1笔的第2折点,尤其是“巡”的第123笔的折点(印刷宋体似连非连,有的手写楷体则是完全分开)。

4.折点的重叠区域有意延长、墨迹似有“漂移”的现象,如:“乡”(1画字)的第24折点、“之”(2画字)的第2笔的第2折点、“专”(3画字)的第3笔的第3折点、“水”(3画字)的第3笔的折点。本条放宽了“折点”的定义范围,也因此产生了“准笔画”,并使“泛笔画”的数量大幅的增加。

增加了几个一笔画,如:N2N3N5D3D4等等,还有两个一笔画成了单体的汉字:“了”(L4)、“乡”(P5)。

有些汉字的笔画数量有所减少,如“红”的笔画数从6画变成5画、“飨”的从12画变成9画。

请注意:“マ”与“厶”,看似有些相像,其实二者的笔画数不一样。“マ”是一笔画;“ㄙ”是由  ”和“丶”组合的,书写时中间要有一收笔(笔尖离开纸张),不是一笔画,它的笔画数是两个。

三、用笔画的标号给汉字排序

两个或两个以上的汉字列放在一起就有一个排队、排序的问题。

汉字查字法或称排检法,从编者方而来说是排序,从使用者方而来说是检索。排序要合理、简易、科学,检索才能轻松、准确、快捷,甚至,仅依靠扫视(直接翻页寻找)就能查到要查的字。

2021年3月1日,教育部、国家语委联合发布实施的《通用规范汉字笔顺规范》(GF0023-2020)为社会通用层面的汉字教学与研究、信息处理、排序检索、辞书编纂等提供重要依据。

一个汉字,先按笔顺排列其全部的笔画,并在每个笔画上面加注其相应的标号,再把这些标号串联起来就是该字的序号(相当于该字的身份证号码)。

排序规则:选出定量的汉字,先对比以上汉字的第1个笔画的(两位数)标号,按标号从小到大的排序。如果有几个汉字的第1个笔画的标号相同,就对比它们的第2个笔画的标号,照样从小到大的排序。以此类推,直到把选出的全部汉字都排序结束为止。

也可以用代号给汉字排序,代号排序和标号排序的规则大致相仿。这两种排序方法得出的汉字顺序是一模一样的。

举例:

中:丨(11S1)、┐(12S2)、一(61H1)、丨(11S1)。

号序:1112611111126111

②代号序:S1S2H1S1SS2HS

国:丨(11S1)、┐(12S2)、一(61H1)、一(61H1)、丨(11S1)、一(61H1)、丶(51D1)、一(61H1)。

号序:11126161116151611112616111615161

②代号序:S1S2H1H1S1H1D1H1SS2HHSHDH

给下面一句话的8个字排序:“她用新华字典查字”。

她:520161221172;②D2PHX2SY2

用:0122616111;②PX2HHS

新:51615101616121515101016111;②DHDPHHXDDPPHS

华:011101726111;②PSPY2HS

字:5151023461;②DDP2L4H

典:1112611111610151;②SS2HSSHPD

查:611101411112616161;②HSPNSS2HHH

字:5151023461;②DDP2L4H

8个字的顺序是:1华、2用、3典、4字(出现了两次)、5新、6她、7查。

以上示范了所抽样的)汉字的新的“字序”、“字典序”,此排序方法的优点是准确、清晰,人们从视觉上、逻辑上都可轻松地分辨出汉字的先后顺序。

汉字的排序方式及其使用的范围:一是笔画阿拉伯数字标号的排序,适用于计算机汉字信息处理技术应用;二是笔画代号的排序,适用于字典正文、图书档案资料的标注及索引;三是笔画名称的排序,适用于学校汉字汉语教学。

四、汉字的检索

编排工具书索引、编制图书档案资料、排列姓名次序,以及汉字信息处理等,都需要有一个合理、巧妙的汉字字序排列法,以便查找。

汉字笔画有50个,可用作单字第一笔的只有19个,因此字典的正文也划分成这19个区域。

在字典正文页眉处位置列出本页第一个和最后一个汉字的代号序,并给两个代号序之间加上一个连接号。如某页第一个字是“贺”,则写“X2PSS2HSS2PD”。

汉字的“第1部件”都应标注在本页页眉位置,同时,也可标注在汉字左侧的空白位置,以便使用者查寻汉字。

要查找某个字,从该字的第1笔画、第1部件开始,直接翻页,用扫视法可查寻到。如:要查“笑”字,先从字典正文找到第1笔画——“撇”、再找到第1部件,这样,就能查到“笑”字。

采用上述的汉字检索方法,字典本可以取消检索表的。但是,为了让使用者有个适应过程,可设立一个(过渡性的)检索表。把检字表划分成19个(第1笔画的)区域,再按汉字的笔画数量从少到多区分若干类,同类的汉字也按照(上述的)字序排队。如“笑”字排在“撇”区的“10画”区内。

五、汉字信息处理

光学字符识别法(OCR)就是把文字看作一个小的图像,采用图像扫描仪等设备对文稿进行扫描,把文稿上的文字变成强弱的两种电信号,再变成二进制数01储存于计算机。

另外,还有统计模式识别方法,这两种方法使用的效果并不理想。

在笔画(形状)的数字模式里,笔画的分类和编号带有显著的“数理感”,如果能在汉字的每一个笔画上都“暗记”其标号,而形成一种“逻辑模式识别法”,也许会优于光学字符识别法、统计模式识别法。

如果采用汉字新的字序,通过调试或升级软件,或许能将“交换码”与“内部码”这两种码合并或统一,可使计算机的智能识别、汉字信息处理变得更加轻松快捷。


文章来源:  《文化产业》  https://www.zzqklm.com/w/wy/32640.html

网络客服QQ: 沈编辑

投诉建议:0373-5939925    投诉建议QQ:

招聘合作:2851259250@qq.com (如您是期刊主编、文章高手,可通过邮件合作)

地址:河南省新乡市金穗大道东段266号中州期刊联盟 ICP备案号:豫ICP备2020036848

【免责声明】:中州期刊联盟所提供的信息资源如有侵权、违规,请及时告知。

版权所有:中州期刊联盟(新乡市博翰文化传媒有限公司)

关注”中州期刊联盟”公众号
了解论文写作全系列课程

核心期刊为何难发?

论文发表总嫌贵?

职院单位发核心?

扫描关注公众号

论文发表不再有疑惑

论文写作全系列课程

扫码了解更多

轻松写核心期刊论文

在线留言