给个常用汉字修改意见!加油!在线等待!
1.制定《通用规范汉字表》的意义
中国现代汉字的规范化是在20世纪上半叶酝酿的。新中国成立后,在国务院的直接领导下,这项工作开创了崭新的局面。自20世纪50年代以来,国务院语言文字主管部门和其他有关部门先后发布了多项汉字规范,初步实现了社会用字的规范化,促进了我国教育、文化和科技的发展。近20年来,随着国家现代化和信息化的快速推进,汉语语言生活发生了巨大变化。语言文字规范与社会发展和人民生活联系的广度和深度是前所未有的。在新的时代和形势下,过去的规范已经不能完全适应现代语言生活的需要。因此,重新审视以往的汉字标准化工作,制定新的可行的规范是非常必要的。
《通用规范汉字表》的制定是为了适应国家信息化发展的需要。世纪之交,中国实施创新型国家战略,信息化成为实现这一目标的重要支撑。语言文字标准化是国家信息化的基础。只有以规范的汉字为传播载体,才能保证信息传播的速度和可靠性。
通用规范汉字表是为适应当代语言生活的需要而制定的。随着科学技术的发展和教育水平的提高,科技术语的用词范围不断扩大,并迅速进入日常生活。印刷业告别了“铅火时代”,激光照排成为出版的主要手段。计算机广泛应用于古籍整理和词典编纂。计算机字体缺字、错别字直接影响印刷、出版和信息传播的质量和社会效益。在社会生活中,政府部门和服务行业(如户籍、邮政、金融、保险)的信息存储和检索已经数字化。姓氏、地名中的不规范、生僻字影响了很多行业的信息系统建设和政府的社会管理,也给一些相关人员的日常生活带来了极大的不便。制定适应现代语言生活的汉字规范,已成为关系人民生活和广大人民群众需求的大事。
《通用规范汉字表》的制定是为了适应国家语言文字法的需要。5438年6月+2000年10月颁布的《中华人民共和国通用语言文字法》规定“国家推广普通话,推广规范汉字”,并进一步明确“国家机关以普通话和规范汉字为官方语言文字”,“学校及其他教育机构通过汉语文课程教授普通话和规范汉字。使用的汉语教材应当符合国家通用语言文字的规范和标准,汉字是公共服务行业的基本服务用字。这部法律的颁布,把汉字的规范纳入了法律层面,需要为一般的社会应用提供一个明确的“规范汉字”的模式。制定词表,整合优化现有汉字规范,消除不同规范词表之间的矛盾,整合零散规范,明确“规范”的政策导向和法律效力,确定“规范汉字”法律概念在一般层面的外延,使《国家通用语言文字法》所指的“规范汉字”在一般社会的一般层面得以实施,是保证这部法律顺利实施的重要举措。
2.制定通用规范汉字表应遵循的原则。
通用规范汉字表的制定遵循以下四个原则:
(1)注意与原有规范的衔接,保持汉字体系的基本稳定。字表的制定,既坚持了简化汉字的基本方针,也遵循了1986国务院批准的《关于废止简化汉字第二方案(草案)和纠正社会用字混乱的通知》中指出的“今后对汉字简化要慎重,使汉字形体在一段时间内保持相对稳定”的原则。经过几十年的实践,现有的《第一批异体字整理表》、《简化字汇总表》、《常用印刷体汉字字表》、《常用现代汉字表》、《常用现代汉字表》等汉字规范值得继承和吸收。单词表继承了这些规范的原则和主要内容。在详细调查和认真分析的基础上,充分考虑了全民的历史习惯和社会的接受程度,本着便民利国的原则进行了必要的修改。
(二)坚持实事求是的科学精神,遵循汉字结构和演变规律。在词表编制过程中,邀请了国内多位资深语言学家主持和参与工作,反复听取了其他多位语言学家和相关领域专业人士的意见,注意吸收汉字和汉字史研究的最新成果,采用科学的统计方法,获得可靠的数据;同时还广泛吸收基础教育、古籍整理、辞书编纂、印刷出版、计算机信息处理等部门的实践经验,遵循汉字构造演变规律,充分考虑汉字应用的现实,尽可能提高汉字规范化的科学性和可行性。
(三)广泛听取各界意见,照顾不同领域对汉字的需求。字表的制定坚持群众路线,通过各种方式广泛听取广大人民群众的意见,特别是基础教育、文化普及等领域反映的意见,尽量满足不同领域、不同文化程度的群众对汉字使用的不同要求。
(四)适当考虑台湾省、香港、澳门地区使用汉字和国际化的需要。汉字流行于两岸四地,也跨越国界,传播到世界各地。词表的制定应正视使用汉字的不同国家和地区简繁字形并存的客观现实,兼顾汉字使用现状和国际化的多种需求,尽量避免扩大不同国家或地区之间汉字使用的差异,以利于相互沟通和交流。
3.通用规范汉字表的性质
汉字规范化一直是我国新文化建设的一项重要基础工作。《通用规范汉字表》是《中华人民共和国通用语言文字法》的配套标准,是体现国家用字政策的主要标准。经国务院批准,由教育部和国家语委发布。
《通用规范汉字表》的说明第二条规定:“通用规范汉字表是记录近代汉语的一套通用规范文字,体现了近代通用汉字的数量、等级和字形的规范。”这个定义的解释可以从以下三个方面来理解:
规范化是词表的首要特征和本质属性。词表给出了确定的字数和词级,实现了字体和用词的标准化。表格中指定了三个级别的字符集。每一级字集中收集的字和前缀都经过了严格的选择和按规则排列,完全可以成为我国社会通用领域的汉字正字法,在字体上具有唯一的标准作用。
现代性是单词表的第二个特征。词表的分类和词汇的收集基于现代应用,收集的词汇主要选自现代汉语语料库,充分考虑了现代语言和写作生活的需要。现代课文中的文言文语录和中小学语文教材中的文言文,是当今文化传承和学习所必需的,需要用简化字印刷,属于现代汉字范畴,也已列入字表。
普遍性是词表的第三个特点。在现代社会使用的汉字领域,一些生僻字或生僻字不需要规范。经过规范,8300字都是现代社会需要的常用字。词表按通用程度分类:一级词表最通用,二级次之。三级词表虽取自专业领域,但这些词与国计民生的信息传播密切相关,在计算机存储和阅读中也具有通用性。
4.《通用规范汉字表》发布后如何在相关领域实施?
通用规范汉字表的制定是为了方便人民群众和各行各业更好地使用汉字。在各个领域的使用中,根据各自的特点和实际需要,可以采用既遵循规范,又有一定灵活性的实现方法:
(1)专业古籍印刷、书法、匾额等手书,可以使用繁体字和继承字。为了便于社会解读,也为了印刷编辑部门有据可依,古籍印刷中使用的繁体字也应及时整理。在相关标准制定之前,建议采用历史上使用过的汉字,即字体要有历史使用的基础;当有多个字形可以使用时,尽量选择流量大、容易识别的字形;不要发明新词或改变字体。
(2)基础教育语文新课程标准规定小学识字量为3500个。这3500个字应该采用《通用规范汉字表》的一级字表。但根据教学需要,当应用子集需要在3500个常用字的范围内进行细分时,如第一、二、三期分别要学多少个字,教育管理部门可以根据不同年龄段儿童的认知特点,以汉字的必要属性为参数,通过科学研究,生成适用的应用字表。需要强调的是,《通用规范汉字表》只给出了宋体的标准字体,而我们小学语文教材中1-3年级的课文和各年级的生字都是楷体,两种字体在笔画形状上略有不同。在楷书字体没有新的标准之前,还是会使用原来的楷书字体。
(3)表外的话可以根据需要使用。使用的表外字有繁体字部分的,按规定不得类推简化。为保持体系的一致性,确需简化类比的,如对新的化学元素使用文字,可报国家语言文字主管部门批准。
(4)词表公布后,如有未收录的姓氏用字,可向国家语言文字主管部门申报,经专家审定和有关部门确认后,及时补充到词表中。
(5)使用汉字的工业产品,特别是信息产品,应遵守汉字规范原则,不应违反字表。因为产品的更新需要一定的周期,所以在词表公布后,对于不符合词表规定的产品用词的变更可以有一个过渡期,在此期间要积极采取措施,尽快达到国家规范。
5.通用规范汉字表中汉字分类的理据,一、二级汉字表中的字数和收字数。
词表作为国家标准,将面向所有用户。所有用户的受教育程度不同,交流范围不同,行业需求不同,对汉字的使用要求必然不同。而且汉字本身的使用频率差异很大,普及程度也不一样。因此,词表只能反映汉字的实际使用情况,照顾不同人群的需求,提高词表的实用性。
词表共有8300个词,根据其普遍性分为三个层次。每一级词表的字数,每个词的标准字体,部分词的使用范围都有明确的规定。一级词表* * *收录了3500个词,是一般社会领域使用频率最高的常用词集合,主要满足基础教育和文化普及的用词需求。二级词表* * *收词3000个,常用于一般社交领域,但使用频率明显低于一级词;一、二级词表包含6500个词,主要满足现代汉语文字印刷出版的需要。三级词表* * *包含1800个词,是中小学语文教材中姓氏、地名、专业术语、文言文中未进入一、二级词表的常用词,主要满足与公众生活密切相关的特殊领域用词需求。
常用词是使用频率最高的词,涵盖了大部分常用的语言材料,人们在阅读和写作时经常用到。常用词一定要足够多,但是越多越好。准确确定常用字的数量并获得它们对于汉字信息的传递、识字教学、字书编写等应用都具有重要意义。理论上,通用规范汉字表的制定是基于“汉字效用递减率”这一重要原则。频率反映了汉字的具体使用情况,单个汉字的使用频率并不是均匀分布的。随着词频的下降,汉字的覆盖率在下降。当词频下降到一定程度,覆盖率基本不增加。因此,通过掌握以下数据,可以大致统计出常用汉字的数量:(1)从某通用语料库中检测出的汉字使用频率降序排列表;(2)每个频率段的语料库中包含的不重复汉字的数量的增量;(3)每个频率段覆盖范围的增加。
为了得到这些数据,选取什么样的语料,选取多少字数的语料进行统计,将直接影响统计结果的代表性、客观性和准确性。制定通用规范汉字表,选用国家语委《现代汉语平衡语料库》作为基础语料库。根据时间和领域平衡的原则,本语料库收录了2009-2002年9191万个汉字,不重复8181个汉字。同时,北京语言大学的《现代新闻媒体动态流通语料库》(收集1-2002、15种报刊3.5亿字)和《通用规范汉字表》课题组建立的《教育科学综合语料库》(收集1951-2003)同时还参考了平面媒体、网络媒体、音频媒体、教育资料的海量语料库基于对这些语料库的统计和分析,得出了《通用规范汉字表》一级和二级词表的分类、词量和收词的基本结果。
在确定一级和二级接收的字数和字数时,总是以客观的统计数据为主要判断依据。但由于汉字本身及其使用的强烈人文性,汉字字符集的界限并不清晰,但存在一定数量的“临界词”。只有手动调整这些“关键词”,才能更科学地反映汉字使用的实际情况。在确定一级词表时,进行了如下人工干预:(1) 10大写数词,22个主干词,31省(直辖市)缩略词和常用对联词的部分漏字补全;(2)增加《儿童文学语料库》(1949之后出版的适合基础教育阅读的各类体裁儿童文学语料库570万汉字)口语高频词;(3)提出300个词频在3201到3500之间的词,在中小学教师中进行问卷调查,用增加的词替换掉这些词,将替换掉的词减少到二级词表中。人工干预调整的字数占3%左右。在确定二级词表时,主要是对备选词表中的词逐一进行检查和识别,排除备选词表中与现代意义相差甚远、与其他词有物理纠缠的词,用三级词表中出现频率相对较高的词进行弥补。
与原《现代汉语常用词表》中的3500个词相比,有103个词,但在不同语料库中的覆盖率比原常用词中的覆盖率高0.09% ~ 0.22%。与原《现代汉语通用词表》中的7000个词相比,第一、二词表中的6500个词减少了500个词,但在不同语料库中的覆盖范围基本不变。之所以字数减少,覆盖率不变,是因为汉字规范化在中国几十年来取得了成效,适用性差的字自然被淘汰,社会用字相对集中。同时可以看出,通用规范汉字表中的选字和量化数据是优化的,方法是科学的,程序是合理的。
6.通用规范三级汉字表建立的原因和性质。
通用规范三级汉字表的建立主要是为了在通用层面上满足特殊领域的汉字需求。由于信息化带来的用字日益增多,通用规范汉字表如果仅限于基本的常用字,虽然可以满足日常生活中用字的需要,但无法解决计算机存储和特殊领域用字的问题。因此,有必要添加一些与公众生活密切相关的特殊词语。《通用规范汉字表》除了基本的常用字外,还增加了三级字,并对中小学教材中的姓氏、名字、专业术语、文言文等适当增加了用字,有效解决了这四个领域信息处理的漏字问题。
三级词虽然不能按照词频和覆盖率收集到一个均衡的语料库中,但还是属于普通级的。这个问题需要从两个方面来解释:
首先,我们需要充分理解“普遍性”这个概念。“普及”包括两个层面:一是印刷,二是阅读。能进入均衡语料库的汉字,既有知名度。但也有一些汉字,不是经常打印,而是经常阅读。比如营养学中的医学名称和专业词汇,只用于专业领域的印刷,但读者却可以达到千家万户。再比如,基础教育语文教材中使用的少量文言文不属于社会常用字,但教材每年都要印刷,师生和家长都要面对,阅读人口几乎达到了千家万户。这些字也需要统一字体,输入规范。
第二,在信息时代,“普遍性”的概念发生了实质性的变化。除了人用,还要考虑电脑的存放和使用。在汉字以手写为主的时代,这些特定领域的用字即使标准不确定也不会有太大问题。在计算机和互联网时代,那些凭借词频在一般语料库中难以找到的词,在人们的日常生活中并没有失去通用性。基于汉字的信息,有的是流通领域的热门,有的是储备领域的必备。比如名字,除了名人,在社会一般层面都不会用太多;地名,除了大城市和著名景点,在社会一般层面的使用量有限,不能按照词频和使用量来收集。而无处不在的邮政、金融、交通等事业,如身份证、学历证、医保、产权证等证件,都要预留可能使用的汉字。如果这些词在信息处理上不规范,也会造成社会信息存储和使用的混乱。这些特定领域的词汇很难收集,需要从特定领域提供的特定词汇中收集。专业领域的常用语是对一般社会常用语的不可或缺的补充。
7.通用规范三级汉字表的原则、范围和具体来源。
在确定通用规范三级汉字表的用词接受度时应坚持以下三个原则:(1)从汉字应用的具体事实出发,需要有文字或文档的来源,或者由相关职能部门提供用例及来源;(2)必须音义完整,命名用词要适合命名;(3)要保证其普遍性,不接受用处不大的生僻字。收字范围具体包括:姓氏和名字用字、地名用字、专业术语用字、中小学教材文言文用字。
(1)用于姓氏和名字的字符。中国是一个多民族国家。姓氏不仅体现了族群的传承和血缘关系,也成为每个公民的称谓符号,其字不可随便更改。为了保证信息传播的可靠性,词表要尽可能多地为姓氏收集词语。至于名字用的汉字,现在还挺混乱的。有些名字即使在已经扩充到7万多字的计算机国际编码字符集里也很难找到。导致二代身份证因为字体不完整而无法制作,给一些人的生活带来很大不便。《通用规范汉字表》不能改变现有姓名使用中的混乱和麻烦,但可以为以后的命名(主要是新生儿)和更名提供一些好用的字,可以引导人们减少生僻字的使用,避免用错别字命名。因此,需要尽可能地收集所有的姓氏,从已有的名字中选取足够的适合命名的汉字,以保证个人名字在社会上的有效流通。
(2)地名中使用的词语。地名中使用汉字往往不是全国通用的,但对当地居民来说是常用字。在省级区划范围内,乡级以上地名用字必不可少。由于方言之间的关系,经常产生各种“方言词”或自创词,造成用词混乱。如今,户籍、邮政、金融等行业的信息存储和检索已经全面数字化,地球卫星定位系统得到广泛应用,地名用字混乱会给相关行业带来信息堵塞的后果,不言而喻。
(3)科技术语中词语的使用。由于科学技术的发展,教育水平的提高和科学知识的普及,许多科技术语迅速进入了人们的日常生活。就拿记录化学元素的汉字来说,很多都是用在药物的名称上。当处方不是手写而是电脑记录的时候,这些文字就成了医生、药剂师、患者和家属之间交流的载体。还有很多农药、化肥、室内装修材料都需要用学名来宣传推广。至于化妆品和清洁剂的使用,饮食健康的讲解,天气的收集和预报等。,一旦进入科学普及领域,都将受到普遍关注。特别是各专业教材的编写和印刷都会用到这些词。
(4)中小学教材中的文言文。规范汉字主要写在现代汉语文本中,但传统、历史、现代并不绝缘。现代文会引用文言文作品,中小学语文教材会收录一些优秀的文言文作品。前者可以收集在一般的平衡语料库中,但为了保证教材印刷的规范性,需要收集语文教材中文言文的词语。
这四个方面既是信息时代使用汉字的重要领域,也是信息传播中容易缺少汉字的领域。具体收到的字数如下:
姓、名共930字,主要来源于1982、18省市抽样普查数据,以及公安部提供的部分姓、名,并适当补充了部分古姓和有影响的古人名。
地名用字465个,主要来源于民政部提供的乡镇以上地名用字、国家测绘局提供的部分村名和部分自然实体名称,以及常用汉语工具书中标注为“地名”的用字。
科技术语276个字,主要来源于国家科技术语审定委员会提供的中医、植物学、遗传学、冶金学、微生物学、土壤学等56个大类,中国社会科学院语言研究所提供的科学技术、人文社会科学等33个大类。
中小学文言文教材用字362个,主要摘自字表开发工作组建立的“中小学文言文教材语料库”(从1949至2007年中小学语文与文言文普及语料库中收集了560万个汉字)。
以上四个方面用词合并复制后,去掉已经进入一、二级词表的词,再去掉难词、错别字、异体字,* * *为1800词。因为三级词是由四个词组合并剔除重复后得到的,所以三级词的属性并不都是单一的,有些词在多个领域可能有不同的属性。
8.《通用规范汉字表》中异体字的处理
严格异体字的定义应该是:音义相同,记词功能相同,只是形状不同,在任何语境下可以互相替换,不影响表达意义的一组字。可见,从功能上看,异体字是汉字的冗余,只是增加了记忆的负担,需要规范。195565438+2005年2月22日,《第一批异体字整理表》的说明指出:“自实施之日起,全国出版的报纸、杂志、书籍停止使用表中括号内的异体字。但如果需要原话重印古籍,可以破例。”这一解释明确了异体字属于“不规范字”的范围,在一般水平上书写现代汉语课文时不能使用。然而,变体列表中确定的一些“变体”不是严格意义上的变体。将这些词全部纳入“不规范词”的范围并取消,有时不利于准确表达意思。
详见中国语言文学网(网址:)。