首先有个现象,就是国内很多学者受传统观念影响,习惯把「文字学 (graphemics)」当「汉字学 (Chinese graphemics)」来用[1],即使沙宗元先生在《文字学术语规范研究》(2008) 中注意到这个现象,其标题中的「文字学」也仍是延续传统,实际上指「汉字学」。因此邓章应先生指出:「区分汉字学研究与文字学研究,不仅对于汉字研究的深入有作用,更重要的是,这将促使我们关注和思考汉字以外的文字系统,并由此研究文字的普遍规律和细微特征,促进普通文字学和比较文字学的研究。[2]」
汉字确实有它的特殊性。赵毅衡先生指出,汉语与世界上其他语言相同,规约性 (conventionality)[3]占主导,但是汉字却不然。汉字是世界上唯一现存的非表音文字。表音文字 (phonogram) 是纯规约性的,因为表音文字不可能表现除了声音之外的任何其他形象。可能任何文字都起源于象形 (pictogram),却不约而同转向表音。汉字也起源于象形,但迅速摆脱象形,发展出复杂的构词法,系统内部出现有效的指示秩序。可能因为民族疆域过大,方言复杂,对文化统一的需要太大,而表音文字随方言而变化的像似性[4]做不到这点,唯有汉字强大的规约性迎合了帝国的需要:当欧洲各地语言演变成独立的语言并使用不同的字母系统,独立的语言和文字进而促成独立的文化,独立的文化创造独立的民族国家,而汉字确保了中国文化的稳定延续以及国家统一的观念。汉字从像似符号,演变出指示符号,再演变出规约符号。汉字曾经同时保持三者的并列,但现在汉字的像似性已经不复存在,逐渐向纯规约性 (表音) 发展。[5]
赵毅衡先生给符号 (sign) 下了一连串的定义:「符号是携带意义的感知:意义必须用符号才能表达,符号的用途是表达意义。反过来说,没有意义可以不用符号表达,也没有不表达意义的符号。」「意义就是一个符号能被另外的符号解释的潜力,解释就是意义的实现。」「意义必用符号才能解释,符号用来解释意义。反过来,没有意义可以不用符号来解释,也没有不解释意义的符号。」「符号就是意义,无符号即无意义,符号学即意义学。」[6]符号学的符号 (sign) 与我们的所理解的符号 (symbol)[7]不太一样,下文中的「符号」一词按后者理解,以符合我们的心理习惯。
汉字学入门一定少不了裘锡圭先生的《文字学概要》[8]。秉承著「名不正则言不顺」的传统,自然要给文字下定义,裘先生指出语言文字学者对「文字」这一概念有广义和狭义的两种定义:(狭义) 文字是记录语言的符号;(广义) 人们用来传递信息的、表示一定意义的图画和符号[9] 。因为传统的汉语文献里历来是「文字」这个词称呼记录语言的符号,所以裘先生采取狭义的定义。要明确文字的定义,我们必须先给语言下个定义。语言是一个符号系统[10],它的声音 (语音) 和意义 (语义) 都是符号[11]。前面说了汉语与世界上其他语言都是规约性占主导的,语音和语义的结合完全由社会约定俗成,语音和语义之间又具有任意性的。语言属于听觉符号,语音与语义的规约性使得语言与其他声音有所区别。语言同时具有指示性,语言能够代表现实现象。语音、语义和现实现象之间的关系如下图所示:
图 1 (重画了一幅《语言学纲要》(叶蜚声, 徐通锵, 1997)第28页的图,原图「符号」特指语言,故改为了「语言」)
进一步可以得到语言的一个简单的定义:语言是音义结合的符号系统[12]。一般又把「音义结合的符号系统」简称为「音义结合体」。我们如果将语言进行分割 (segmentation),会分出很多片段,对每个片段再继续分割,就会分出很多更小的片段,当一个小片段不能再进行分割或分割后不再有意义 (没有意义就只是一段声音) 就认为这个小片段是最小的音义结合体,我们把这样的小片段称为语素 (morpheme) 。进而得到定义:语素是最小的音义结合体[13],语素是最小的语法单位。我们把词 (word) 的定义一并给出:词是最小的能够独立运用[14]的音义结合体,词由语素构成,词是比语素高一级的语法单位。
语法单位剩下的两级从略,我们回来看文字。根据《文字学概要》可以得到了「字」的两种不同的理解[15]:
同时也要指出,汉语中「文字」一词有两个意思,一是指一个个的字,一是指记录语言的文字符号的体系[16]。于是我们有必要区分一下这两个意思:文字符号体系我们仍称为「文字 (writing system)」,而将文字的基本单位称为「字位 (grapheme)」[17]。第 ② 种「字」的理解明显是指汉语字位,所以我们将「汉字 (Chinese character)」理解为汉语字位,且必要时需强调与汉语书写系统的区别。字位是最小的有意义的书写符号,这显然对任何文字都适用。第 ① 种「字」的理解有学者用书面语位与之对应[18][19][20]。我们可以想象,当文字被造出时,文字与语言之间形成指示性和规约性。语言可以脱离文字,但文字不能脱离语言,就是索绪尔 (Saussure) 等人强调「语言是第一性的,文字是第二性的」。索绪尔《普通语言学教程》:「语言和文字是两种不同的符号系统,后者唯一的存在理由是在于表现前者。[21]」赵元任《语言问题》:「凡视觉符号,用来代表语言的就是文字。[21]」文字是视觉符号,其与其他图形 (graphics) 的区别在于文字是要代表语音的。
根据字位所代表语音结构的不同,可以将文字进行分类[22][23]:
图 2
图3(平假名(左)、片假名(右))
特点是一个假名就是一个字位,一个字位代表一个音节(syllable)。根据日语的特点,也可以说一个假名代表一个音拍/摩拉(mora)。 @黑之圣雷 君提到彝文,但没说清楚是什么彝文,传统彝文(classical Yi)确实是所谓表意文字,按上面的分类叫语素音节文字,但 1974 年由我国相关部门进行规范化形成的现代彝文(modern Yi),或更严谨地称为凉山规范彝文(Liangshan Standard Yi),是音节文字(1980 年定为凉山彝族自治州凉山彝语官方文字)。
图 4(凉山规范彝文)
谚文又称韩字(한글)或朝鲜字(조선글),也是一种音节文字,但不同于其他音节文字,谚文可以明确地表现辅音和元音,这跟下面要介绍的元音附标文字很像,但谚文的元音不是附加性的。
图 5(谚文)
2. 辅音文字(abjads)或辅音字母文字(consonantal alphabets / consonantaries)的典型代表有叙利亚字母(Syriac)、希伯来字母(Hebrew)、阿拉伯字母(Arabic)等:
图 6(靠右三列。其他几列已无人使用。前两列的文字其实属于语素文字里的语素辅音文字。)
特点是一个字母是一个字位,一个字位代表一个辅音音位。以希伯来文为例:
图 7(希伯来文,שלום,shalom )
希伯来文是从右往左书写的,所以要从右往左看。一个字母代表一个辅音,如上图 ש(sh)、לו(l)、ם(m),而实际拼读的时候会在辅音间加上应有的元音,如上图 a、o,这样才能拼读出 שלום(shalom,你好)这个单词。注意到上图最下面的书写形式在原上加了点“装饰”,这是在提示元音(其中字母 לו 左边的 ו 也提示了元音 o),因此希伯来字母很接近下面要介绍的元音附标文字(abugidas)。
3. 元音附标文字(abugidas)或音节字母文字(alphasyllabaries)的典型代表如下图:
图 8
特点是一个字母是一个字位,一个字位代表一个音位或音节,以辅音为主体、元音以附加符号形式标出。如天城文:
图 9 (以字母 क 为主体)
@多邻国Duolingo 的回答《世界主要的文字系统有哪些?》的内容更详细,请参考。
4. 全音位文字(alphabets)就是一般意义的字母文字,我们熟悉的字母文字如拉丁字母、希腊字母、西里尔字母等:
图 10
特点是一个字母是一个字位,一个字位代表一个音位,可以是辅音也可以是元音。如英语:
图 11(英文 cab)
音位文字即常说的拼音文字,或字母文字,它们之间的关系大家可以参考《字母的名称是怎么来的?》里的“世界字母谱系图”。
5. 语素音节文字(morphosyllabary)的典型代表就是汉字。按习惯我们这里将“汉字(Chinese characters)”或简称“字”理解为汉语字位。汉字有一个特点,就是一般一个字代表一个语素。而古汉语中又往往一个语素构成一个词(即单纯词)的情况居多,于是有了一个字代表一个词的印象,像英语单词有叫单字的情况就是基于这个道理。但由于通假的情况存在,汉字其实在使用时是起到表音的作用,即一个汉字也代表一个音节,如“我”、“它”、“其”等字。在汉文化影响下古代很多民族创造了各种汉字变体(derivatives of Chinese character),如喃字(Chữ nôm,13世纪-今)、契丹文(10世纪-12世纪)、女真文(12世纪-16世纪)、西夏文(1036-1502)、壮字(Sawndip,约7世纪-今)等。契丹文有两套,即契丹大字、契丹小字,女真文衍生自契丹大字,和西夏文一样现除研究者和爱好者外已经无人使用。喃字由于没有实现标准化,因此一般有多种写法,图 9 中的 chữ 常写作“⿰宁字”正是因为“宁”能起到表音的作用。喃字不是越南官方书写系统,只在特殊场合下使用。壮字一般称方块壮字或古壮字,区别于拉丁壮文或拼音壮文,随着拉丁壮文的推广和普及,方块壮字使用者越来越少。
上一篇
下一篇