漢字是語素文字,總數非常龐大。漢字總共有多少字?到目前為止,恐怕沒人能夠答得上來精確的數字。
關于漢字的數量,根據古代的字書和詞書的記載,可以看出其發(fā)展情況。
秦代的《倉頡》、《博學》、《爰歷》三篇共有3300字,漢代揚雄作《訓纂篇》,有5340字,到許慎作《說文解字》就有9353字了,晉宋以后,文字又日漸增繁。據唐代封演《聞見記·文字篇》所記晉呂忱作《字林》,有12824字,后魏楊承慶作《字統(tǒng)》,有13734字,梁顧野王作《玉篇》有16917字。唐代孫強增字本《玉篇》有22561字。到宋代司馬光修《類篇》多至31319字,到清代《康熙字典》就有47000多字了。1915年歐陽博存等的《中華大字典》,有48000多字。1959年日本諸橋轍次的《大漢和辭典》,收字49964個。1971年張其昀主編的《中文大辭典》,有49888字。
隨著時代的推移,字典中所收的字數越來越多。1990年徐仲舒主編的《漢語大字典》,收字數為54678個。1994年冷玉龍等的《中華字!罚兆謹蹈求@人,多達85000字。
如果學習和使用漢字真的需要掌握七八萬個漢字的音形義的話,那漢字將是世界上沒人能夠也沒人愿意學習和使用的文字了。幸好《中華字!芬活愖謺锸珍浀臐h字絕大部分是“死字”,也就是歷史上存在過而今天的書面語里已經廢置不用的字。
有人統(tǒng)計過十三經(《易經》、《尚書》、《左傳》、《公羊傳》、《論語》、《孟子》等13部典籍),全部字數為589283個字,其中不相同的單字數為6544個字。因此,實際上人們在日常使用的漢字不過六七千而已。
-----------漢語簡介
漢語,Hanyu,Chinese Language。ㄖ斓挛)
世界主要語言之一。屬漢藏語系,是這個語系里最主要的語言。除了中國大陸和臺灣省以外,漢語還分布在新加坡、馬來西亞等地。以漢語為母語的人大約有 9.4億。漢語是聯(lián)合國的工作語言之一。
漢語的標準語是近幾百年來以北方官話為基礎逐漸形成的。它的標準音是北京音。漢語的標準語在中國大陸稱為普通話,在臺灣稱為國語,在新加坡、馬來西亞稱為華語。
語音 漢語的音節(jié)可以分析成聲母、韻母、聲調3部分。打頭的音是聲母,其余的部分是韻母,聲調是整個音節(jié)的音高。把聲調也看成音節(jié)的組成部分,是因為漢語的聲調是辨義的。例如“湯、糖、躺、燙” 4個字的聲母都是 [tʻ],韻母都是[aŋ](方括弧里是國際音標,表格里的國際音標省去括弧),只是因為聲調不同,意義就不一樣,在語言里分別代表 4個不同的語素(最小的有意義的語言單位),在書面上寫成 4個不同的字。
聲母都是輔音。最復雜的韻母由介音、主要元音和韻尾 3部分組成。韻尾有的是輔音,有的是元音。北京音的輔音聲母有22個。介音有
、、[y]3個。輔音韻尾有[n]和[ŋ],元音韻尾有和。在組成音節(jié)的聲母、介音、主要元音和韻尾 4部分里,只有主要元音不能沒有,其余 3部分都不是必須出現的。這種情形可以從表 1音節(jié)的成分舉的例字里看出來。北京話的聲母見表 2北京話聲母,北京話的韻母見表 3北京話韻母。
以上說的是每個字單說時的聲調。連讀的時候,某些聲調會發(fā)生變化。例如兩個上聲字相連,前一個會從原來的 214調變成35調,變得跟陽平調一樣。此外,有些字連讀時讀得很短,并且失去了原來的聲調。這種字調叫輕聲,例如“石頭”的“頭”,“我們”的“們”。
傳統(tǒng)的注音方法是反切。反切用兩個字來注一個字的音。前一個字(反切上字)定被反切字的聲母,后一個字(反切下字)定被反切字的韻母和聲調。例如:“耐,奴代切”,“奴”跟“耐”的聲母相同,“代”跟“耐”的韻母和聲調相同,所以就用這兩個字來注“耐”字的音。由于語音的演變,古代字書上的反切跟今音有的相合,例如上邊舉的“耐,奴代切”([n(ú+t)ài=nài])。有的不合。例如:“東,德紅切”,“東”與反切下字“紅”的聲調不同!芭,薄紅切”,“蓬”與反切上字“薄”的聲母不同,與反切下字“紅”的韻母也不同。
1918年由當時的教育部頒布的國語注音字母是利用漢字字形制定的一套拼音字母。這套字母把主要元音與韻尾合在一起用一個符號表示(例如:ㄠ=[au],ㄢ=[an],ㄤ=[aŋ]),體現了傳統(tǒng)的聲母韻母兩分的精神。注音字母廣泛流傳,影響很大。臺灣省一直沿用至今。
聲調是一個音節(jié)發(fā)音時音高的高低升降的型式。北京話的聲調有陰平、陽平、上聲、去聲 4種型式。如果把音高分成五度,北京的陰平是從五度到五度的平調,陽平是從三度到五度的升調,上聲是從二度下降到一度再升到四度的曲折調,去聲是從五度到一度的降調。關于北京話的聲調見表(表4北京話聲調)。
1958年公布的漢語拼音方案采用拉丁字母(表2北京話聲母、表3北京話韻母)。自1978年開始,中國人名地名一律改用漢語拼音字母拼寫,取代了威妥瑪式等各種舊拼法。
語法 漢語的語素絕大部分是單音節(jié)的(手│洗│民│失)。語素和語素可以組合成詞(馬+路→馬路│開+關→開關)。有的語素本身就是詞(手、洗),有的語素本身不是詞,只能跟別的語素一起組成復合詞(民→人民│失→喪失),F代漢語里雙音節(jié)詞占的比重最大。大部分雙音詞都是按照上面提到的復合方式造成的。
把漢語跟印歐語系的語言相比較,可以看出漢語語法上的一些重要的特點。漢語和印歐語的一個明顯的區(qū)別是沒有形態(tài)變化。這主要指以下兩種情形。第一,印歐語的動詞和形容詞后頭可以加上一些只改變詞根的語法性質(轉化成名詞)而不改變其詞匯意義的后綴,例如英語的-ness、-ation、-ment之類。漢語沒有此類后綴。第二,印歐語的動詞有限定式和非限定式(不定式,分詞,動名詞)的區(qū)別。漢語沒有這種分別。這種差異使得漢語語法在以下兩個重要方面跟印歐語語法大異其趣。
首先,在印歐語里,詞類的功能比較單純。例如名詞只能充任主語和賓語,形容詞只能充任定語和表語,定式動詞只能充任謂語里的主要動詞。在漢語里,由于動詞和形容詞不變形,無論在什么句法位置上出現,形式都一樣。這就造成了詞類多功能的現象。例如形容詞既可以充任謂語(這兒干凈)、定語(干凈衣服)和補語(洗干凈),又可以充任主語(干凈最要緊)和賓語(他不愛干凈)。
詞類多功能的必然的結果是相同的詞類序列有時代表不同的句法結構。例如“出租汽車”可以理解為一個名詞性詞組(=出租的汽車),也可以理解為“動詞+賓語”的結構。由于這種現象的存在,漢語語法著作比起印歐語語法著作來,更著重句法結構關系的分析。
由于漢語詞類多功能,劃分詞類時,手續(xù)要復雜一些。過去有人認為漢語沒有詞類。這種說法是不對的。
其次,印歐語的句子和分句里必須有定式動詞,而詞組(短語)里要是有動詞的話,只能是非限定形式,不能是限定形式。因此,句子和分句是一套構造原則,詞組是另一套構造原則。漢語的動詞沒有限定式和非限定式的對立,動詞不管用在哪里,形式都一樣,因此句子的構造原則跟詞組的構造原則是一致的;句子不過是獨立的詞組而已。正是因為這一點,有的漢語語法著作采用一種以詞組為基點的語法體系,即在詞組的基礎上描寫句法,而不是像印歐語法那樣以句子為描寫的基點。
漢語句法結構的特點還表現在主謂結構和動補結構(或稱述補結構)上。漢語的主謂結構跟印歐語的句子或分句不同,構造比較松散。這表現在主語后頭可以有停頓(因此書面上往往用逗號點斷),或者加上語氣詞(這個人吶,很會說話)。特別值得注意的是口語里常常沒有主語。
主謂結構的另一個特點是可以充當謂語。例如:
中國地方真大。
這個人我從前見過他。
這兩句的謂語“地方真大”和“我從前見過他”本身都是主謂結構。這種句式不但現代漢語里有,古漢語里也有,《孟子·離婁下》:“匡章通國皆稱不孝焉”;《史記·蒙恬列傳》:“蒙恬者其先齊人也”,應該看成是漢語的基本句式的一種。
動補結構是現代漢語里非常重要的一種句法構造。印歐語里沒有跟它相對應的格式。簡單的動補結構是由兩個動詞或者一個動詞一個形容詞組成的(聽懂│切碎│染紅│洗干凈)。這種結構后頭可以帶動詞后綴“了”和“過”,語法功能相當于一個動詞。值得注意的是動詞和補語的組合極其自由。例如“洗干凈”是常說的,因為“洗”能導致的最自然的結果是“干凈”?墒浅恕跋锤蓛簟敝,也能說“洗臟了│洗破了│洗丟了”,甚至還可以說“把我洗胡涂了│把他洗哭了”。
從詞序方面看,漢語一個重要的特點是所有的修飾語都必須放在被修飾成分的前邊,所以修飾語不宜太長、太復雜。把外文翻譯成中文的時候,原文后置的修飾語都得提到前邊去。如果修飾成分比較多,句子就不太容易組織。這種時候,往往得把原來的長句拆成幾個短句,使修飾語適當分散或者轉成謂語。
文字 從目前我們能看到的最早的成批的文字資料──商代甲骨文字算起,漢字已有3000年的歷史。由于甲骨文字已經是相當成熟的文字體系,我們可以推斷漢字的發(fā)生一定遠在3000年以前。漢字的發(fā)展可以劃分為兩個大階段。從甲骨文字到小篆是一個階段;從秦漢時代的隸書以下是另一個階段。前者屬于古文字的范疇,后者屬于近代文字的范疇。大體說來,從隸書到今天使用的現代漢字形體上沒有太大的變化。
從漢字跟漢語的關系看,漢字是一種語素文字。從漢字本身的構造看,漢字是由表意、表音的偏旁(形旁、聲旁)和既不表意也不表音的記號組成的文字體系。
文字是記錄語言的。就漢字跟它所要記錄的對象漢語之間的關系來看,漢字代表的是漢語里的語素。例如[tàn kāu]的[kāu]、[kāu iàu]的[kāu]和[tʻiàu kāu]的[kāu]讀音相同,意思不一樣,是3個不同的語素,分別由 3個不同的漢字“糕、膏、高”(蛋糕、膏藥、跳高)來表示。從這個角度看,漢字可以說是一種語素文字。
漢字起源于圖畫。在漢字產生的早期階段,象形字的字形跟它所代表的語素的意義直接發(fā)生聯(lián)系。雖然每個字也都有自己固定的讀音,但是字形本身不是表音的符號,跟拼音文字的字母的性質不同。象形字的讀音是它所代表的語素轉嫁給它的。隨著字形的演變,象形字變得越來越不象形。結果是字形跟它所代表的語素在意義上也失去了原有的聯(lián)系。這個時候,字形本身既不表音,也不表義,變成了抽象的記號。如果漢語里所有的語素都是由這種既不表音也不表義的記號代表的,那么漢字可以說是一種純記號文字。不過事實并非如此。漢字有獨體字與合體字的區(qū)別。只有獨體字才是純粹的記號文字。合體字是由獨體字組合造成的。從構造上說,合體字比獨體字高一個層次。因為組成合體字的獨體字本身雖然也是記號,可是當它作為合體字的組成成分時,它是以有音有義的“字”的身份參加的。合體字可以分成以下3類:
①形聲字。形聲字由表示意義的形旁和表示讀音的聲旁兩部分組成。拿構造最簡單的形聲字來說,形旁和聲旁都是由獨體字充當的。作為形聲字的組成部分,這些獨體字都是有音有義的字。不過形旁只取其義,不取其音,例如“鳩”字的偏旁“鳥”;聲旁則只取其音,不取其義,例如“鳩”字的偏旁“九”。
由于字義和字音的演變,有些形聲字的形旁或聲旁現在已失去了表意或表音的功能。例如“球”本來是一種玉的名稱,所以以“玉”為形旁,F在“球”字不再指玉,這個形旁就沒有作用了。再如“!弊直緛硪浴懊俊睘槁暸。由于字音的變化,現在“海”和“每”的讀音相去甚遠,聲旁“每”也就不起作用了。有的時候,形旁和聲旁都喪失了原來的功能,例如“給、等、短”。這一類字已經不能再作為形聲字看待了。
形聲字和非形聲字之間并沒有明確的界限。造字之初,形聲字和它的聲旁的讀音本來就不一定密合。發(fā)展到現代漢字,出入就更大了。有人拿7500多個現代合體漢字進行統(tǒng)計。就普通話讀音來說,合體字跟聲旁完全同音(聲母、韻母、聲調全同)的不到 5%。聲母、韻母相同而聲調不同的約占10%。只有韻母一項相同的約占20%。如果我們只把前兩類看作形聲字,那么形聲字大概只占通行漢字的15%。如果把以上三類全看作形聲字,形聲字大概會占通行漢字35%的樣子。要是把標準再放寬或者完全根據來歷確定形聲字,那么通行漢字中形聲字的百分比還要高得多。
、诤象w會意字。古人說“止戈為武”,“人言為信”。對于“武”、“信”兩個字來說,這種解釋是錯誤的。不過漢字體系里確實有按照這種方式造成的字,例如“不正為歪”,“不好為孬”。這一類字的特點是會合偏旁的字義來表現整個合體字的意義。這種字為數很少,只有個別的例子。
以上兩類合體字里的偏旁有的有表意作用,有的有表音作用。下邊一類的情形不同。
、酆象w記號字。這一類合體字的偏旁既不表意,也不表音。這主要有兩種情形。一是由于字音和字義的變化,原來的聲旁和形旁已經不再表音、表意了。例如上文舉過的“給、等、 短”一類字。 另一種情形可以舉“章”字為例。 按照漢代許慎《說文解字》的分析,“章”字從“音”從“十”。 可是現在一般人說“立早章” (以區(qū)別于“弓長張”)的時候,是把它分析成“立”和“早”兩部分。其實從古文字看,“章”本來是一個獨體象形字,跟“音、十、立、早”都沒有關系。
漢字用來記錄漢語已經有3000年以上的歷史,一直沿用到今天,沒有中斷過。在如此長的歷史時期里,漢字不僅為人們的現實生活服務,而且記錄下極其豐富的文化資料;甚至跨越國界,被日本、朝鮮、越南等鄰國借去記錄非漢語語言。
另一方面,長期以來也不斷有人批評漢字的缺點,主要是說漢字難認、難寫、難于機械化(印刷排版、打字等)。因此在掃盲、兒童識字教育、文化傳播等方面,都不如拼音文字效率高。
跟拼音文字比較起來,漢字有它的短處,但是也有它的長處。漢字最大的長處就是能夠超越空間和時間的限制。古今漢語字音的差別很大。但由于2000年來字形相當穩(wěn)定,沒有太大變化,字義的變化比較小,所以先秦兩漢的古書今天一般人還能部分看懂。如果古書是用拼音文字寫的,現代人就根本無法理解了。有些方言語音差別也很大,彼此不能交談,可是寫成漢字,就能互相了解,道理也是一樣的。
近年來,有的心理學家通過實驗,指出兒童學習漢字似乎比學習拼音文字還容易些,至少不比學拼音文字難。這方面的研究剛剛開始,目前還難以得出明確的結論。不過有一點是清楚的。討論這個問題,必須把認漢字、寫漢字和用漢字三者區(qū)別開,不能混為一談。三者之中,認最容易、寫就比較難。例如繁體字“龜”和“龍”特點鮮明,很容易認識,要記住怎么寫就難多了。用漢字比起認和寫都要難得多。所謂會用,就是要學會區(qū)別同音字,知道哪種場合下用哪個。例如“唯、惟、維” 3個字同音!熬S持”“維護”只能寫“維”,不能寫“惟”,而“思維”也可以寫成“思惟”!拔┆殹、“惟恐”可以寫“惟”,也可以寫“唯”;可是“唯心論”、“唯物論”又只能寫“唯”,不能寫“惟”。
50年代開始進行簡化漢字的工作。1986年重新公布的《簡化字總表》規(guī)定了2200多個簡化漢字(包括用簡化偏旁類推的字)。這項工作目前已告一段落,今后在一個時期內將保持穩(wěn)定,不繼續(xù)簡化。因為不斷簡化會破壞文字的穩(wěn)定性,而且簡化一批字以后,原來的繁體字并不能廢除。結果是漢字的總數有增無減,反而加重了學習和使用的人的負擔。
關于文字拼音化問題,長期以來一直有爭論。從理論上說,任何自然語言都可以用拼音文字記錄。但是由于漢語方言分歧,在推廣普通話的工作沒有取得廣泛、切實的成效以前,改用拼音文字會給方言區(qū)的人帶來很大的困難。此外,由于漢字歷史悠久,大量的文獻都是用漢字記錄的。一旦改弦易轍,勢必在文獻的廣泛利用上造成一定困難,在社會心理和民族感情上也可能引起波動。
方言 中國幅員遼闊,人口眾多,方言情況復雜。下邊把漢語方言粗分為官話和非官話兩大類來說明。官話分布在長江以北地區(qū)和長江南岸九江與鎮(zhèn)江之間沿江地帶以及湖北、四川、云南、貴州4省,包括北方官話、江淮官話、西南官話幾個方言區(qū)。官話區(qū)域的面積占全國3/4,人口占全國2/3。官話方言內部的一致程度比較高。從哈爾濱到昆明,相距3000公里,兩地的人通話沒有多大困難。非官話方言主要分布在中國東南部,包括吳方言(江蘇南部,浙江大部)、贛方言(江西大部)、湘方言(湖南大部,廣西壯族自治區(qū)北部)、粵方言(廣東大部,廣西壯族自治區(qū)東南部)、閩方言(福建,臺灣,廣東的潮州、汕頭、海南地區(qū))、客家方言(廣東省東部和北部,福建西部,江西南部,臺灣)。非官話區(qū)域比官話區(qū)域面積小,可是方言差別大,彼此一般不能通話,甚至在同一個方言區(qū)內部(例如浙南吳方言與蘇南吳方言之間、福州話和廈門話之間),交談都有困難。
漢語方言之間語音上的差別最大,詞匯次之,語法方面的差別最小。語音的差別在聲母的繁簡、輔音韻尾的多寡以及調類的區(qū)分上表現得特別明顯。例如吳方言塞音聲母有濁塞音[b、d、g]、不送氣清塞音[p、t、k]和送氣清塞音[pʻ、tʻ、kʻ ]3套,官話方言只有后2套。廣州話輔音韻尾有[m、 n、ŋ、p、t、k]6個,蘇州話只有[n、 ŋ、?]3個,北京話只有[n、ŋ]2個。廣州話有陰平、陽平、陰上、陽上、陰去、陽去、上陰入、中陰入、陽入9個調類。北京話有陰平、陽平、上聲、去聲4個調類。煙臺話平聲不分陰陽,所以只有平聲、上聲、去聲 3個調類,是聲調系統(tǒng)最簡單的方言之一。
由于現代方言的調類與古調類之間有相當整齊的對應關系,所以通常就用平、上、去、入等古調類的名稱來標記現代方言調類。要注意的是方言的調類名稱相同,并不表示調值相同。例如北京話的陽平是升調(35),天津話的陽平是高平調(55),而漢口話的陽平則是曲折調(214) 。
上文說漢語方言語音的差別大,詞匯和語法的差別小。這是從大體上說的。從細處看,詞匯和語法上相異之處也并不少。拿詞匯來說,政治、文化、科學方面的詞是全國性的,可是日常生活里用的詞有許多是地方性的,因方言而異。拿語法來說,方言之間在詞法方面的差異比較明顯。例如人稱代詞和指示代詞的形式、形容詞的后綴、動詞和形容詞的重疊式、象聲詞的構造以及名詞后綴“子”和“兒”的表示方式(例如“兒”杭州話用成音節(jié)的語素表示,而廣州話和溫嶺話用變調表示)等等在不同方言里有時有相當大的差別。
方言之間句法上的差別可以舉“把”字句和反復問句為例!鞍选弊志涫枪僭拝^(qū)方言里十分重要的一種句式,可是粵方言和吳方言都沒有這種句式。例如北京話用“把”字的句子(把衣服洗干凈),廣州話往往要用“動詞+賓語”的說法(洗干凈件衫)。在大部分官話方言里,反復問句的形式是“ V不V”(V代表動詞,例如:去不去│認得不認得)?墒窃谀承┙垂僭捄臀髂瞎僭(例如昆明話)以及一部分吳方言(例如蘇州話)里,反復問句的形式是“可 V”(可去│可認得)。
歷史 方言反映歷史。漢語方言之間語音的差別大,語法和詞匯的差別相對說來比較小。同樣,古漢語和現代漢語之間也是語音的差別大 , 語法和詞匯的差別小。從總體上看,從上古音(先秦時代)到中古音(隋唐時代)再演變到現代北京音,經歷了逐漸趨向簡化的過程。在先秦時代,塞音聲母和塞擦音聲母都有濁音、不送氣清音和送氣清音三套。鼻音聲母也分清濁兩套。很可能還有[kl-、 pl-、gl-、bl-、sn-、st-、sk-]等形式的復輔音。所有的音節(jié)都以輔音收尾,沒有開音節(jié)。輔音韻尾除了見于現代方言(例如廣州話)的[m、 n、ŋ、p、t、k]之外,還有[b、d、g]。到了隋唐時代,復輔音聲母和清鼻音聲母早已消失,輔音韻尾也只剩下了[m、 n、ŋ、 p、t、k]。只是塞擦音和擦音卻按發(fā)音部位的不同分化為舌頭、舌面和卷舌三套。在現代北京音里濁塞音和濁塞擦音都清化了,輔音韻尾只有[n]和[ŋ]兩個。
聲調的演變是另一種情形。隋唐時期只有平、上、去、入 4個調類。在現代方言里,同一個古調類有時以聲母的清濁為條件分化成陰陽兩類。因此有些方言調類的數目比隋唐時期多,許多非官話區(qū)的方言就是如此。
隋唐以來,在調類的分合上發(fā)生過兩件大事。一是在許多方言里,古全濁聲母上聲字跟古去聲字合為一類。二是官話方言的入聲韻尾消失以后,入聲字分別歸入平、上、去三聲。北京話就是如此。
分析諧聲字和經典的注音,可以發(fā)現上古漢語有過以變調和/或變化聲母的清濁作為轉變詞性(包括分別自動詞和使動詞)的手段的痕跡。在句法方面,先秦漢語的一個明顯的特點是否定句和疑問句里的代詞賓語要提到動詞的前邊去(吾誰欺│不我欺)。
宋元時期漢語語法發(fā)生了一些重要的變化。例如動詞詞尾“了” 和“著 ”的產生、動補結構的產生等等!傲恕焙汀爸痹瓉矶际莿釉~,后來意義逐漸虛化,終于演變?yōu)樵~尾。動補結構〔包括不帶“得”的(染紅)和帶“得”的(染得紅)兩類〕也是在這個時期才定型的。
詞匯演變的主要趨勢是雙音節(jié)詞的不斷增長。本來在先秦漢語里占優(yōu)勢的單音節(jié)詞逐漸雙音節(jié)化。這種趨勢近百年來尤為明顯。據統(tǒng)計,在 180萬字的現代文資料里,一共出現了3萬多個不同的詞,其中70%以上是雙音節(jié)詞。
書面語和口語
書面語和口語的差別一直相當大。在“五四”時期白話文運動以前,書面語和口語的區(qū)別實際上是古今語的區(qū)別。以唐宋時代為例,當時人口里說的是白話。筆下寫的是文言,即以先秦諸子和《左傳》、《史記》等廣泛傳誦的名篇為范本的古文文體。這種情形往上大概可以推到兩漢時期。往下一直延續(xù)到20世紀初葉。孫中山1925年立的遺囑就還是用文言寫的。不過2000 年來作為書面語的文言本身也在變化。仿古終歸難以亂真,后世人模仿古語不可能不受當時口語的影響。有人指出韓愈的文章里就有明顯的不合先秦語法的地方。清代桐城派古文家模仿先秦文和唐宋古文家的文章,結果當然更為駁雜。清末梁啟超用一種淺顯的文言文寫政論文章。由于通俗易懂,風行一時,為報章雜志所廣泛采用。目前臺灣、香港以及海外中文報刊多數仍舊沿用這種文體。
“五四”運動時期開展的文學革命提出了反對文言文、提倡白話文的主張。這場運動席卷全國,影響深遠。短短幾年之間,白話文學就站穩(wěn)了腳跟。不過這種白話文學作品的語言并不是真正的口語,而是拿北方官話做底子,又受到明清白話小說相當大的影響,還帶著不同程度的方言成分以及不少新興詞匯和歐化句法的混合的文體。魯迅的作品可以作為這種文體的典型的代表。
以上說的是文學作品 。至于新聞報道、 政府文告、公文、商業(yè)合同、甚至私人信件,往往還是用的文言。這一方面是傳統(tǒng)習慣使然,另一方面也是因為文言文有簡括的優(yōu)點。這種情形,就全國范圍來說,一直延續(xù)到40年代末。1949年中華人民共和國建立以后,文言文才完全讓位給白話文。除了打電報和有意擬古以外,沒有人再寫文言了。
上文指出,現代書面漢語是包含許多不同層次的語言成分的混合體。無論從句法上或詞匯上看都是如此。拿句法來說,書面語句式除了跟口語相同的那一部分之外,有的是從文言來的,后來漸漸融化在書面語里,成為書面語句式的一部分。例如“進行、加以、予以、給予”是書面語用得十分頻繁的幾個動詞。這些動詞原來的意義已經虛化,主要的功能是放在雙音動詞前邊以適應句法和節(jié)奏上的要求。這種句法構造來源于文言!斑M行”的前身是“行”(另行議處),“加以”的前身是“加”(嚴加管束),“予以”和“給予”的前身是“予”(不予追究)。在文言句法里,“行、加、予”前邊必須跟一個單音副詞配合,造成雙音節(jié)構造,后邊的動詞也必須是雙音節(jié)的。在現代書面語里,這幾個動詞都雙音節(jié)化了,后邊還是要求跟雙音節(jié)的動詞,語法上的制約是一脈相承的。
現代書面語開始形成的時候,曾經從舊白話小說的語言里繼承了一些句式。這個階段現在已經結束。我們能看到的只是一些遺跡。例如“在+處所詞”的構造可以放在動詞前頭(“在臺上坐著”),也可以放在動詞后頭(“坐在臺上”)。在北京話里,前置的“在”用“跟”、用[āi] 或是 [tǎi],后置的“在”用[·tə],都不用“在”。用“在”的說法是從舊白話小說里繼承下來的。
有些書面語句式是受外國語(英語、日語、俄語等)的直接或間接(通過翻譯作品)的影響產生的。在這方面可以舉一個影響全部書面語句式的重要語法現象作為例證。上文曾經提到,漢語里主語和謂語關系松散。句子的主語往往可以不說出來。有些句子甚至根本沒有主語,F代口語和古漢語都是如此?墒乾F代書面語要求句子在形式上都要有主語。如果沒有,就會感到結構不完整,邏輯上不周密。這顯然是受了印歐語的影響。
書面語在詞匯方面的特點是雙音詞的比重大。書面語雙音詞除了從文言里繼承下來的一部分以外,大都是19世紀末葉以來 100多年間新出現的。其中一部分是從日文轉借過來的,另一部分是新造的。新創(chuàng)造的詞大都是利用原有的語素 (書面上就是漢字) 造成的復合詞。這種構詞方式是能產的,生命力很強。
漢語研究 在中國傳統(tǒng)的語言學領域里,音韻學、文字學、訓詁學都有輝煌的成就。最古的按字義編排的字典《爾雅》是戰(zhàn)國時代編的。東漢許慎的《說文解字》是最早的按漢字偏旁編排的字典,同時也是第一部對漢字的結構作出全面、系統(tǒng)的分析的著作。在古代的韻書里,隋代陸法言的《切韻》(601)地位特別重要。無論是研究現代方言,還是上推《切韻》以前的音韻系統(tǒng),都是重要的資料。9世紀開始出現的韻圖(《韻鏡》、《七音略》、《切韻指掌圖》等)是一種表示整個音韻系統(tǒng)及聲韻調三者配合關系的表格。從現代語言學的角度看,描寫漢語的音韻系統(tǒng),這種性質的表格是不可缺少的。古音的研究在清代有飛躍的進步。段玉裁首先指出諧聲字系統(tǒng)跟《詩經》用韻基本上相符。清代學者根據這兩種材料給上古音韻母分部,取得了顯著成績。到了王念孫、江有誥,這項工作幾乎已經達到了頂點,可以補充修改之處已經不多。在訓詁學方面,清代學者也有重大貢獻。段玉裁《說文解字注》和王念孫《廣雅疏證》可以說是這方面的代表作品。
語法學方面,中國學者向來著重虛詞的研究。清代王引之的《經傳釋詞》是最有影響的著作。馬建忠(1845~1900)的《馬氏文通》出版于 1898年。這是第一部系統(tǒng)地研究漢語語法的書。
20世紀上半葉,古音研究取得了重要進展。主要的成績是對中古音和上古音的構擬。這方面工作的開創(chuàng)者是瑞典學者高本漢。其后李方桂在上古音研究上也作出了重要貢獻。
《馬氏文通》研究的對象是古漢語,F代漢語語法的研究是從 20世紀開始的。呂叔湘 《中國文法要略》(1942~1944)和王力《中國現代語法》(1943)兩部書反映了前半個世紀漢語語法研究達到的水平。丁聲樹等《現代漢語語法講話》(1952)雖然是通俗性著作,但是在近年來的語法研究上有一定的影響。60年代以來,漢語語法研究進步很快。趙元任《中國話的文法》(1968)是這個時期比較重要的著作。
在歷史語法學方面,呂叔湘《漢語語法論文集》(1955;增訂本,1984)里的一部分論文開創(chuàng)了近代漢語語法的研究。王力的《漢語史稿》中卷(1958)和日本太田辰夫《中國語歷史文法》(1958)也是這方面有影響的著作。
趙元任《現代吳語的研究》(1928)是第一部用現代語言學方法調查方言的報告。這部書對以后的方言調查工作有重要影響。1956~1957年起在全國范圍內進行了一次方言調查。1979年創(chuàng)辦了專門性的方言刊物《方言》,對方言調查和方言研究起了推動的作用。
20世紀考古方面的重大發(fā)現──商代甲骨文字和戰(zhàn)國、秦、漢簡帛的出土,為古文字研究提供了大量珍貴的資料,促進了這一門學科的發(fā)展。
參考書目
李榮:《語音常識》,文化教育出版社,北京,1955。
朱德熙:《語法答問》,商務印書館,北京,1985。
Yuen Ren Chao, A Grammar Spoken Chinese,University of California Press, 1968.
裘錫圭:《文字學概要》,商務印書館,北京,1987。
中國社會科學院、澳大利亞人文科學院合編:《中國語言地圖集》,第一冊,朗文出版(遠東)有限公司,香港,1988。
Fang-Kuei Li, Archaic Chinese, in The Origins of Chinese Civilization,University of CaliforniaPress, 1983.
-----------漢字簡介
漢字是漢語書寫的最基本單元,其使用最晚始于商代,歷經甲骨文、大篆、小篆、隸書、楷書(草書、行書)諸般書體變化。秦始皇統(tǒng)一中國,李斯整理小篆,“書同文”的歷史從此開始。盡管漢語方言發(fā)音差異很大,但是書寫系統(tǒng)的統(tǒng)一減少了方言差異造成的交流障礙。
東漢許慎在《說文解字》中將漢字構造規(guī)律概括為“六書”:象形、指事、會意、形聲、轉注、假借。其中,象形、指事、會意、形聲四項為造字原理,是“造字法”;而轉注、假借則為用字規(guī)律,是“用字法”。
三千余年來,漢字的書寫方式變化不大,使得后人得以閱讀古文而不生窒礙。但近代西方文明進入東亞之后,整個漢字文化圈的各個國家紛紛掀起了學習西方的思潮,其中,放棄使用漢字是這場運動的一個重要方面。這些運動的立論以為:跟西方拼音文字相比,漢字是繁瑣笨拙的。許多使用漢字國家即進行了不同程度的漢字簡化,甚至還有完全拼音化的嘗試。日文假名的拉丁轉寫方案以及漢語多種拼音方案的出現都是基于這種思想。中國大陸將漢字筆劃參考行書草書加以省簡,于1956年1月28日審訂通過《簡化字總表》,在中國及新加坡使用至今。臺灣則一直使用繁體中文。
目前在使用漢語的地區(qū),大都使用兩種規(guī)范漢字,分別是繁體中文(繁體字)和簡體中文(簡體字)。
--------------------------------------------------------------------------------
漢字,是記錄漢語的文字系統(tǒng),并仍然或曾經在日語和朝鮮語、越南語中使用。漢字是世界上最古老的文字之一,擁有4500年以上的歷史。狹義地說,它是漢族的文字;廣義地言,它是漢字文化圈共同的文字。
漢字是承載文化的重要工具,目前留有大量用漢字書寫的典籍。不同的方言都使用漢字作為共同書寫體系,因而漢字在歷史上對中華文明的傳播起到了重要作用,并成為東南亞文化圈形成的內在紐帶。在漢字發(fā)展過程中,留下了大量詩詞、對聯(lián)等文化,并形成了獨特的漢字書法藝術。
一個漢字一般具有多種含義,也具有很強的組詞能力,且很多漢字可獨立成詞。這導致了漢字極高的“使用效率”,2000左右常用字即可覆蓋98%以上的書面表達方式。加之漢字表意文字的特性,漢字的閱讀效率很高。漢字具備比字母文字更高的信息密度,因此,平均起來,同樣內容的中文表達比其他任何字母語言的文字都短。
目前的漢字體系分為繁體字和簡體字,前者用于臺灣、香港、澳門和北美的華人圈中,后者用于中國大陸和新加坡以及東南亞的華人社區(qū)。通常說來,兩種漢字書寫系統(tǒng)雖然有差異,常用漢字的個體差異不到25%。
由于漢字書寫復雜,“漢字落后論”的說法存在了很長時間,認為漢字是教育及信息化瓶頸,并有“漢字拉丁化”甚至廢除漢字的推動行為,F在一般認為漢字也有突出優(yōu)點,初始學習難度雖大,但掌握常用字后不存在類似海量英文單詞的繼續(xù)學習問題,且其表意特性也能充分調動人腦的學習能力。在計算機輸入問題基本解決后,“漢字落后論”及“漢字拉丁化”已實際上逐漸被大多數人拋棄。
目前漢字系統(tǒng)已經基本穩(wěn)定,但漢字的規(guī)范化、生僻字的自然消亡仍在繼續(xù)進行。
關于漢字編碼
為進行信息交換,各漢字使用地區(qū)都制訂了一系列漢字字符集標準。
、 GB2313字符集,收入漢字6763個,符號715個,總計7478個字符,這是大陸普遍使用的簡體字符集。楷體-GB2313、仿宋-GB2313、華文行楷等市面上絕大多數字體支持顯示這個字符集,亦是大多數輸入法所采用的字符集。市面上絕大多數所謂的繁體字體,其實采用的是GB-2313字符集簡體字的編碼,用字體顯示為繁體字,而不是直接用GBK字符集中繁體字的編碼,錯誤百出。
② BIG-5字符集,收入13060個繁體漢字,808個符號,總計13868個字符,目前普遍使用于臺灣、香港等地區(qū)。臺灣教育部標準宋體楷體等港臺大多數字體支持這個字符集的顯示。
、 GBK字符集,又稱大字符集(GB=GuóBiāo國標,K=擴展),包含以上兩種字符集漢字,收入21003個漢字,882個符號,共計21885個字符,包括了中日韓(CJK)統(tǒng)一漢字20902個、擴展A集(CJK Ext-A) 中的漢字52個。Windows 95\98簡體中文版就帶有這個GBK.txt文件。宋體、隸書、黑體、幼圓、華文中宋、華文細黑、華文楷體、標楷體(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字體支持顯示這個字符集。微軟拼音輸入法2003、全拼、紫光拼音等輸入法,能夠錄入如镕镕炁夬喆嚞姤赟赟?龑昳堃慜靕臹等GBK簡繁體漢字。
BIG-5 (繁體中文)與GB-2313 (簡體中文),編碼不相兼容,字符在不同的操作系統(tǒng)中便產生亂碼。文本文字的簡體與繁體(文字及編碼)之間的轉換,可用BabelPad、TextPro或Convertz之類的轉碼軟件來解決。若是程序,Windows XP操作系統(tǒng),可用Microsoft AppLocale Utility 1.0解決;Windows 2000的操作系統(tǒng),大概只有用:中文之星、四通利方、南極星、金山快譯之類的轉碼軟件方能解決了。
④ GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582個漢字,共計27533個漢字。宋體-18030、方正楷體(FZKai-Z03)、書同文楷體(MS Song)宋體(ht_cjk+)、香港華康標準宋體(DFSongStd)、華康香港標準楷體、CERG Chinese Font、韓國New Gulim,以及微軟Windows Vista操作系統(tǒng)提供的宋黑楷仿宋等字體亦支持這個字符集的顯示。Windows 98支持這個字符集,以下的字符集則不支持。手寫輸入法逍遙筆4.0版支持GB18030字符集及方正超大字符集漢字的錄入。
、 方正超大字符集,包含GB18030字符集、CJK Ext-B中的36862個漢字,共計64395個漢字。宋體-方正超大字符集支持這個字符集的顯示。Microsoft Office XP或2003簡體中文版就自帶有這個字體。Windows 2000的操作系統(tǒng)需安裝超大字符集支持包“Surrogate更新”。
⑥ ISO/IEC 10646 / Unicode字符集,這是全球可以共享的編碼字符集,兩者相互兼融,涵蓋了世界上主要語文的字符,其中包括簡繁體漢字,計有:CJK統(tǒng)一漢字20902個,CJK Ext-A 6582個,Ext-B 42711個,共計70195個漢字。SimSun-ExtB(宋體)、MingLiU-ExtB(細明體)能顯示全部Ext-B漢字。至今尚無單獨一款字體能夠顯示全部70195個漢字,但可用海峰五筆、新概念五筆、倉頡輸入法世紀版、新版的微軟新注音、倉頡輸入法 6.0 版(單碼功能)等輸入法錄入。Ext-C還有2萬多個漢字。詳情請參閱香港中文大學網站、馬來西亞倉頡之友網站、福建陳清鈺個人網站。
⑦ 漢字構形數據庫2.3版,內含楷書字形60082個、小篆11100個、楚系簡帛文字2627個、金文3459個、甲骨文177個、異體字12768組?梢园惭b該程序,亦可以解壓后使用其中的字體文件,對于整理某些古代文獻十分有用。
如果超出了輸入法所支持的字符集,就不能錄入計算機。如果沒有相應字體的支持,則顯示為黑框、方框或空白。如果操作系統(tǒng)或應用軟件不支持該字符集,則顯示為問號(一個或兩個)。在網頁上亦存在同樣的情況。
關于Unicode
由于各國國家標準字集所收的漢字字數、常用字的差異,雖然象中國兩岸GB/BIG5字集常用字基本類似,轉換后閱讀并不成問題,但是這種編碼轉換的混亂關系,對文字交流始終是一種障礙。因此相關國家的標準化組織和文字工作者經過共同努力,終于在93年完成了包含中日韓(CJK)漢字的Unicode 漢字標準ISO 10646.1。 Unicode是完全雙字節(jié)表示的多國文字編碼體系,編碼空間0x0000-0xFFFF。 ISO 10646.1漢字標準使用編碼0x4E00-9FA5,共包含20902個漢字。其中: 大陸(S)提出的漢字17124個,臺灣(T)提出的漢字17258個; S與T的并集,即中國(C)提出的漢字為20158個。 日本(J)提出的漢字為12157個,中國未提出的690個(Ja); 韓國(K)提出的漢字為7477個,其中中國未提出的90個(Ka); Ja與Ka并集共744字。 支持Unicode編碼的相關電腦系統(tǒng)軟件,如Unix, Win95已有推出,但是由于Unicode的ASCII碼是用雙字節(jié)編碼(即一般電腦系統(tǒng)中的單字節(jié)ASCII碼前加 0x00),同時其漢字編碼與各國的現有編碼也不兼容,造成現有的軟件和數據不能直接使用,所以目前完全使用Unicode軟件系統(tǒng)的用戶并不多,大多數只將它此作為一個國際語言編碼標準來使用。
-----------成語簡介
成語,chengyu,idioms(周祖謨)
語言詞匯中的一部分定型的詞組或短句。漢語成語有固定的結構形式和固定的說法,表示一定的意義,在語句中是作為一個整體來應用的。例如:
言簡意賅 勇往直前 相反相成 實事求是
誨人不倦 經年累月 千鈞一發(fā) 緣木求魚
削足適履 七手八腳 細大不捐 坐井觀天
成語有很大一部分是從古代相承沿用下來的,在用詞方面往往不同于現代漢語。其中有古書上的成句,也有從古人文章中壓縮而成的詞組,還有來自人民口里常說的習用語。有些意義從字面上可以理解,有些從字面上就不易理解,特別是典故性的。如“汗牛充棟”、“虎踞龍蟠”、“東山再起”、“草木皆兵”之類,在漢語成語里占有一定的比例。漢語歷史悠久,成語特別多,這也是漢語的一個特點。
成語是一種現成的話,跟習用語、諺語相近,但是也略有區(qū)別。最主要的一點是習用語和諺語是口語性質的,成語大都出自書面,屬于文語性質的。其次在語言形式上,成語幾乎都是約定俗成的四字結構,字面不能隨意更換,而習用語和諺語總是松散一些,可多可少,不限于四個字。例如“快刀斬亂麻”、“九牛二虎之力”、“驢唇不對馬嘴”、“前怕狼,后怕虎”,這是常說的習用語;“百聞不如一見”、“真金不怕火煉”、“有志者事竟成”、“路遙知馬力,日久見人心”,這是一些經驗之談,表示一個完整的意思,屬于諺語一類。成語跟習用語、諺語是不一樣的。
成語大都有一定的出處。如“狐假虎威”出于《戰(zhàn)國策·楚策》,“鷸蚌相爭”出于《燕策》,“畫蛇添足”出于《齊策》,“刻舟求劍”出于《呂氏春秋·察今》,“自相矛盾”出于《韓非子·難勢》,都是古代的寓言。如“完璧歸趙”出于《史記·廉頗藺相如列傳》,“破釜沉舟”出于《史記·項羽本紀》,“草木皆兵”出于《晉書·苻堅載記》,“一箭雙雕”出于《北史·長孫晟傳》,“口蜜腹劍”出于《唐書·李林甫傳》,都是歷史上的故事。至于截取古書的文句用為四字成語的更為普遍。如“有條不紊”取自《尚書·盤庚》“若綱在綱,有條而不紊”,“舉一反三”取自《論語·述而》“舉一隅,不以三隅反,則不復也”,“痛心疾首”取自《左傳》成公十三年“斯是用痛心疾首,暱就寡人”,“分庭抗禮”取自《莊子·漁父》“萬乘之主,千乘之君,未嘗不分庭抗禮”,“奴顏婢膝”取自晉代葛洪《抱樸子·交際》“以岳峙獨立者為澀吝疏拙,以奴顏婢膝者為曉解當世”, “胸有成竹”取自宋代蘇軾《文與可畫筼筜谷偃竹記》“畫竹必先得成竹于胸中”。諸如此類,不勝枚舉。其他采用古人文章成句的也為數很多。如“憂心忡忡”出自《詩經·召南·草蟲》,“外強中干”出自《左傳》僖公十五年,“以逸待勞”出自《孫子·軍爭》,“水落石出”出自蘇軾《后赤壁賦》,“萍水相逢”出自唐代王勃《滕王閣序》,“牢不可破”出自唐代韓愈《平淮西碑》。
在人民口里常說的一些四字習用語也可以歸入成語里來。如“咬文嚼字”、“拖泥帶水”、“陽奉陰違”、“不三不四”、“心直口快”之類,與成語的結構相同。在成語中也有些是接受外來文化而出現的。如“天花亂墜”、“當頭棒喝”、“不可思議”、“不二法門”都是。
成語一般都是四字格式,不是四字的較少。如“五十步笑百步”、“ 欲速則不達”、“ 醉翁之意不在酒”。成語一般所以用四個字,這與漢語本身句法結構和古漢語以單音詞為主有關系。
四字的語法結構主要有以下幾種形式:
主謂式:名副其實、盛氣凌人、杞人憂天、胸有成竹;
動賓式:好為人師、莫名其妙、視為畏途;
聯(lián)合主謂式:天翻地覆、水落石出、手舞足蹈;
聯(lián)合動賓式:知己知彼、養(yǎng)精蓄銳、防微杜漸、發(fā)號施令;
聯(lián)合名詞式:粗心大意、南轅北轍、鏡花水月;
聯(lián)合動詞式:突飛猛進、勇往直前;
動補式:逍遙法外、問道于盲;
兼語式:以鄰為壑、令人生畏。
成語的結構是多種多樣的,上面只是簡單舉例的性質。成語在語言表達中有生動簡潔、 形象鮮明的作用。它的本身就有不少比喻和對比以及加重的措辭方法。如“陽奉陰違”、“外強中干”、“五光十色”、“一知半解”、“七嘴八舌”、“患得患失”、“不寒而慄”等各有妙用。所以文學家對成語的運用都非常注意。
-----------能認識4000左右就很不錯了