構詞學
研究啲詞語同埋佢哋嘅形成 From Wikipedia, the free encyclopedia
Remove ads
構詞學(粵拼:kau3/gau3 ci4 hok6),貼近英文名[e 1]噉意譯可以叫語言形態學,係語言學其中一個最重要嘅分科,專門研究字詞嘅結構同埋字詞係點樣組成嘅。構詞學最基本嘅概念係形態素:形態素簡單講即係有意思嘅最細單位,一嚿形態素再斬細啲就唔會再有原先個意思。構詞學家憑住呢啲概念,分析人腦點樣運用形態素砌字詞出嚟[註 1]。
語言嘅構詞功能可以大致分兩類:詞形變化同構詞衍生;詞形變化包括一隻字詞變樣,表達件事幾時發生、啲物體有幾多件、或者係個詞喺語句入便扮演咩角色... 等嘅資訊;而構詞衍生就涉及同啲字詞加詞頭或者詞尾,創造出有新意思嘅字詞。
構詞仲會影響語言嘅其他部份。例如一個字詞可以點做詞形變化,好多時都受制於佢喺句法當中嘅角色;除此之外,一隻語言嘅構詞法則仲會影響佢嘅演變進程——事實表明,一隻語言嘅使用者造新詞嗰陣,往往會受制於自身語言嘅構詞法則,而新詞創造係語言演變嘅重要一環。
Remove ads
概念:詞素
内文:詞素
構詞學研究嘅係字詞、字詞嘅內部結構、以及字詞係點形成嘅。响 2024 年,不列顛百科全書係噉嚟形容構詞學嘅[1]:
字詞呢個概念定義有些少含糊[2][3]。語言學上研究構詞,通常會由形態素(又有叫詞素)呢個概念出發。形態素一詞意譯自英文
- morpheme(近似粵拼:mo1 fim4)
——呢隻字詞取自希臘文 morphē [4],即係希臘文入便形態、形狀噉嘅意思[5]。定義上,形態素係指可以有意思嘅最細可能單位,唔一定能夠自成一隻字詞。一嚿形態素再拆細啲就唔會再有意思,或者會冇咗原先嗰個意思。
詞素例子
用英文做例,想像以下嘅字詞[6]:1.2
——當中 re- 呢嚿嘢本身唔能夠自成一隻字詞,但係可以帶有再...噉嘅意思,同時 re- 再斬細件啲就唔會再有乜嘢意思可言。所以 re- 喺英文入面係一嚿形態素[7]。其他歐洲語言都可以用噉嘅方法嚟想像。
形態素呢個概念源自歐美,但係好似粵語噉嘅漢語,都可以用類似嘅思路嚟諗,例如 dei6(漢字作哋)呢嚿一段音節長嘅嘢,粵語可以有[8]:
粵拼 漢字 ngo5 dei6 我哋 nei5 dei6 你哋
等嘅字詞,當中哋表示咗眾數嘅意思,而 dei6 拆細佢變做例如 ei6 就會冇咗原先嗰個意思。粵語哋同英文 re- 有啲相似嘅係,佢哋正常講嘢嗰陣唔會單獨噉出現,意思指眾數嗰個哋出現親都係掕喺一個代名詞後面,而意思指再...嗰個 re- 出現親都係掕咗喺一個動詞前面。
界定啲詞彙—
基本原則
構詞學家做研究嗰陣,往往會跟從以下呢幾條原則(下面用咗國際音標[e 5])[10]:1.5.2:
- 兩嚿嘢,如果佢哋喺所有情況下意思同發音[註 3]都一樣,就算係同一款形態素。
- 兩嚿嘢,就算佢哋嘅發音唔同都好,如果佢哋意思一樣而且分佈上冇重疊[註 5],都算係同一款形態素。
- 用英文做例子,英文啲名詞如果係眾數,通常最尾都要加個 /s/、/z/、/əz/ 等[註 6] ——例如可以睇睇 seat(一個座位)變 seats(多個座位;個尾讀 /s/)、 hedge(一埲籬笆)變 hedges(多埲籬笆;個尾讀 /əz/)... 等嘅字詞變化。雖然呢啲標示眾數嘅形態素發音唔同,但係佢哋意思一樣,都係表達眾數,而且佢哋分佈上冇重疊—— seats(/s/ 尾)冇得話換做 seates(/əz/ 尾),反之亦然,所以呢幾嚿標示眾數嘅形態素,可以當係同一款形態素噉睇。形態素變體[e 6]正正就係指緊發音唔同但係意思一樣嘅形態素,英文入便表示眾數嘅 /s/ 同表示眾數嘅 /əz/ 係同一款形態素嘅變體。
- 一隻形態素,有可能其中一個變體係零(符號 Ø)。
等等。
Remove ads
字詞同詞位
定義爭拗

『字詞』對講嘢嘅人嚟講有『心理上嘅真實性』,令佢哋(講嘢嘅人)能夠討論某字詞係咩意思,討論隻字詞喺某一個社交場合入便適唔適用,等等。[12]
世上所有主流語言入便都有「字詞」呢個概念:無論係受過專業訓練嘅語言學家抑或係唔識寫字嘅人,都能夠直覺意識到「字詞」係啲乜。但係有關呢個概念具體嚟講要點界定,廿一世紀初嘅語言學界仲未有咩共識可言。有啲人主張字詞可以界定做「包含最少一個形態素、可以單獨噉存在嘅語言單位」,根據呢條思路,指「動作進行中」嘅緊就係一嚿形態素,但唔係一隻字詞,因為佢喺正常講嘢嗰時冇得單獨存在。根據呢種觀點,一隻字詞會有以下呢啲特徵[13][14] —
- 一隻字詞會係對答嗰陣嘅最短可能答覆——
- 如果一句句子要變,一隻字詞係「能夠郁動,同時郁咗又唔會搞到句嘢文法唔啱」嘅最細單位。
- 冇得透過加插音段或者短語成份嚟拆散,或者係「要再變長啲有難度」嘅單位當中係最大嘅。
- 一隻字詞入面啲形態素要有特定嘅次序,次序視乎語言而異,例如喺粵語入便,表示「進行中」嘅緊,一定要係掕喺動詞尾嘅,嘗試用緊游水嚟表達游緊水噉嘅意思係錯文法。
不過喺某啲語言當中,有人搵到有啲語言單位係「直覺上認為應該係一隻字詞,但冇得單獨存在」嘅[15]。除此之外,亦都有啲人主張要定義字詞,可以睇例如輕重讀嘅位置或者係一嚿物體喺文法上嘅角色[15]。
有陣時,唔同嘅字詞定義仲可以彼此有衝突[16]:2.2.1:即係例如有一隻「字詞」,按文法睇(睇佢加前綴同後綴嘅方式)算係一隻字詞,但係按音系字詞基準睇就應該當係兩隻字詞至啱。
註:字詞定義唔取決於書寫
响廿一世紀初嘅語言學上,要界定一隻字詞,係睇口語特性嘅,「呢個語言單位寫出嚟嗰陣係點」唔會影響佢算唔算係一隻字詞。
例如係音系字詞[e 7]嘅概念:音系字詞係指「按音系特徵嚟定義嘅字詞」[17];例如係英文噉,喺英文入面,每隻字詞都實有一個音節係重音嘅,而好似 hot dog(熱狗)噉,英式英文通常會係 hot 讀重音而 dog 就冇重音(想像大致似粵拼 hot1 dok4),喺呢種情況下,按音系字詞嘅觀點 hot dog 個 dog 唔可以視為一隻字詞,而要算係 hot dog 呢一隻字詞嘅第二橛——縱使喺書寫上,啲人成日會搵個空格隔開 hot 同 dog,令兩者望落似兩隻字詞[9]。
因此,喺粵語嘅字典裡邊,好似係今日或者咖啡等嘅語言單位有可能被視為「字詞」——今日同咖啡都係用咗兩隻漢字嚟寫,不過就算有一段嘢寫起上嚟用咗兩隻漢字,都唔等如段嘢可以當係有兩隻字詞。
詞位
内文:詞位
睇埋:原型理論
詞位[e 8]係構詞學上嘅一個重要概念。一隻語言入面嘅一個詞位會包含兩樣嘢[18]:
- 一個語音,多音節又得,單音節都得;
- 一個相應嘅意思或者文法功能;
- 一個詞位嘅形態,可以視乎身處嗰句語句嘅句法特徵而起變化(詞形變化)。而詞幹[e 9]就係指緊一個詞位當中「賦予嗰個詞位嘅意思、無論點做詞形變化都唔變」嗰一截[註 8]。
舉個例說明,想像以下呢兩個唔同嘅粵語詞位(當中啲語音係用粵拼寫嘅)。兩個詞位嘅語音(1)一模一樣,但係相應嘅意思(2)唔同,所以要當係兩個唔同嘅詞位,字典會將佢哋分開當係兩個唔同嘅 item 噉嚟處理[註 9]:
學習使用詞位並唔容易。學習者需要學相當大量嘅內隱知識,識得每隻字詞包含啲乜,同埋每隻字詞唔包含啲乜。舉例說明,好細個嘅細路(例如兩三歲嗰啲)就被指成日犯過度伸展同過度限制[e 10]呢啲失誤:過度伸展係指過度「擴展」一隻字詞可以包含咩事物,而過度限制就係指過度「限住」一隻字詞可以包含咩事物;想像一個三歲細路,佢過度伸展可能係會用蝴蝶一詞嚟指晒所有嘅昆蟲,連蜜蜂同蟬都用蝴蝶一詞嚟稱呼,而佢過度限制就可能會誤以為蝴蝶一詞淨係包黑或者橙色嘅蝴蝶,唔識得用蝴蝶一詞嚟指其他色嘅蝴蝶[19]。
Remove ads
字詞點變化
詞形變化[e 11]最基本上可以想像為「屬同一款詞位嘅字詞,因為要表達文法範疇而變樣」,當中文法範疇可以係隻動詞指嗰樣動作幾時發生、隻名詞指嘅物體有幾多個或者係隻名詞係陰性定陽性... 呀噉[20][21]。好似粵語等嘅漢語被指傾向少詞形變化,但係歐洲語言就有唔少詞形變化,例如:
文法範疇 例語言 字詞變化 時態:個動作係幾時發生嘅? 英文 speak(講嘢,現在式) → spoke(講嘢,過去式) 數量:名詞指嗰樣嘢,有幾多個? 英文 language(語言,單數) → languages(語言,眾數) 格:個名詞做緊句子邊部份? 拉丁文 rēx(國王,主格) → rēgem(國王,賓格)
詞形變化同構詞衍生[e 12]係兩個好相似嘅概念。兩個概念都係講緊一隻語言嘅使用者將啲形態素「黐埋一齊」。用幾隻比較簡單嘅英文字詞做例嘅話,想像以下呢啲情況:
language → languages (加 -s 變眾數) | talk → talked (加 -ed 變過去式) |
dance(動詞指跳舞) → dancer(名詞指舞蹈員) | Canton(名詞指廣州或廣東) → Cantonese(可作形容詞指粵式) |
當中前兩者屬詞形變化,而後兩者屬構詞衍生。籠統啲噉講,構詞衍生一般會引致一隻字詞意思「顯著改變」,可以令到隻字詞連詞性都唔同埋——例如 dance 可以係動詞或者名詞都得但 dancer 就實係名詞,而詞形變化就唔會有噉嘅情況—— talk 等嘅動詞就算變咗過去式,依然仲係動詞。除此之外,一隻字詞係咪要做詞形變化往往會受制於句法上嘅語境——例如一隻字詞係咪要變格,睇嘅係佢喺句子入便扮演咩角色,而構詞衍生就唔受制於呢啲嘢[6]:2.4。
亦有研究者指,喺英文同日文等嘅唔少語言當中,做構詞衍生嘅詞綴傾向接近詞幹,而做詞形變化嘅詞綴就傾向離詞幹遠啲[6]:6.2。好似係英文啲形容詞,加 -ize 可以變動詞,表示... 化嘅意思——例如 popularize 係普及化噉解,而普及化第三身單數會係 popularizes(-s 同詞幹之間隔咗 -ize)。
詞頭詞尾
詞形變化可以想像成構詞句法特徵[e 13]嘅實現。喺好多語言裡便,詞形變化涉及詞綴[e 14],用詞綴表達構詞句法特徵。顧名思義,詞頭係指加喺詞幹前嘅詞綴,而詞尾就係指加喺詞幹後嘅詞綴。
最簡單係一個詞綴實現一種構詞句法特徵(兩者有一對一嘅對應),但係有時一個詞綴可以同時對應幾種特徵(累積型),或者係一個特徵對應幾個唔同嘅詞綴(延伸型)。拉丁文就有累積型嘅變化,例如指愛嘅動詞[6]:6.1.1
字詞 意思 amō 我愛,現在式 amat 佢愛,現在式 amāmus 我哋愛,現在式 amor 我被愛,現在式
當中 -ō 表示隻字詞係現在式、主動語態、單數第一人稱,就算句子入便冇代名詞我,聽者都知句嘢係我愛嘅意思(而唔係我被愛或者我哋愛)——拉丁文齋靠一個詞綴,就表達好幾種構詞句法特徵[註 10]。而包括希臘文在內嘅多隻歐洲語言都有延伸型嘅情況。
詞幹變樣
構詞句法特徵嘅實現,有陣時會透過元音變換[e 17]嚟做,即係指字幹當中嘅元音出現變化,而非喺隻字詞前面或者後面加啲嘢。呢種情況喺英文以及其他日耳曼語言當中好常見,例如以下呢幾隻常用嘅英文動詞[6]:6.3.2:
意思 現在式 過去式 完成式 唱歌 sing sang sung 揸車 drive drove driven
有好多語言都有異幹互補[e 18]嘅情況,隻字詞嘅唔同形態望落完全唔同樣,例如英文
意思 現在式 過去式 完成式 去 go went gone
異幹互補之所以會出現,好多時係因為隻字詞嘅唔同形態詞源唔同。例如廿一世紀英文嘅 went 據考究嚟自中古英文嘅 wenden(可以具有離開或者轉向等嘅意思)——同 go 並唔係源自同一隻字詞。
根與規律
有關比較「另類」[註 11]嘅詞形變化或者構詞衍生方法,可以睇吓所謂嘅根與規律構詞[e 19]:如果話一隻語言採用根與規律構詞,即係佢一隻字詞嘅詞根淨係由若干個輔音組成,而啲輔音之間嘅元音(以及其他音節特性)就表示時態同詞性等嘅資訊。即係想像好似以下噉[22]:
- b-n-k(名詞銀行嘅詞根) →
- bank(單數,「一間銀行」) / bunuuk(眾數,「多間銀行」)
- k-t-b(動詞書寫嘅詞根) →
- katab-(過去式,主動,「某某人過去寫咗...」) / kutib-(過去式,被動,「某某本書過去被寫咗...」)
好多亞非語系[e 20]嘅語言都係用開根與規律構詞嘅。亞非語系主要分佈喺西亞同北非嗰一帶,比較多人知嘅成員包括咗希伯來文(當中聖經希伯來文係舊約聖經嘅書寫語言)、亞蘭文(據講係耶穌日常用嘅語言)同埋阿拉伯話等。
Remove ads
構詞句法學
内文:句法學
句法係語言學另一個重要科目,專研究語句,尤其係講字詞點樣組合埋一齊形成語句。當中組合係一個重點關鍵字,例如試諗吓紅綠燈,紅綠燈都係表達緊一啲意思——紅燈表達停車、黃燈表示就快行得而綠燈表示行得喇,但呢啲符號並唔會話以唔同方式組合,意思會唔同咗,所以「紅綠燈話」唔算係語言[23]。
- 文法格[e 21][27][28]:喺好多語言入便,名詞都可以做詞形變化嚟表示文法格;簡單講,話一隻名詞屬咩文法格,指嘅係隻字詞喺句子入便扮演乜嘢角色——係句子嘅主語抑或係賓語?英文缺乏文法格變化,而呢點被指解釋得到點解英文要有高度規律化嘅語序,啲句子近乎永世都係主語行先、動詞緊隨其後、賓語就跟尾[註 12]。有關有顯著文法格變化嘅語言,可以睇吓英文以外嘅日耳曼語言(例子有德文)或者係斯拉夫語言(例子有捷克話同烏克蘭話)。
- 詞性改變:構詞衍生可以令一隻字詞嘅詞性有所變化,詞性變咗就表示句法角色跟住改變;用粵語想像嘅話,醫治一般係做動詞,但做咗構詞衍生變醫治者,隻字詞就會變名詞,而佢喺句子入便嘅位置(典型嘅粵語句子係主語-動詞-賓語噉嘅)亦要跟住改變。
- 一致特性[e 22]:指一隻字詞要做詞形變化,就住另一隻同佢相連嘅字詞。例如標準英文都有呢樣嘢[註 13],一隻動詞如果由一隻第三人稱嘅主語「做出」隻動詞就要變樣(主語動詞一致):
等等。
Remove ads
影響埋詞庫
詞庫[e 23]係指一隻語言裡便嗰啲詞彙嘅總和。例如粵語嘅詞庫包晒所有粵語口語有機會使用嘅詞彙——例如
- 叉燒包(caa1 siu1 baau1)
呢隻字詞粵語口語會用到,可以算係粵語詞庫嘅一部份[註 14]。除此之外,(例如)用同一隻語言但年紀唔同嘅人,用嘅字詞可能都唔多同,有陣時啲人可以齋靠聽一個人講嘢嘅用詞,就可以斷定佢嘅年齡[29]。
新詞[e 24]定義上係詞庫演變嘅一種,喺語言學上係語言演變嘅重要一部份。新詞嘅形成,好多時都係源自隻語言嘅使用者靠住各種構詞機制創造出新字詞嘅。例如[30]
- 詞綴化[e 25]:創造新詞嘅一種簡單方法,就係同已有字詞加一啲之前唔會加嘅詞綴(詞頭定詞尾都得);不過好多語言都會對「詞綴可以點樣黐法」設下一啲限制[註 15]。
- 混成詞[e 26]:由兩隻字詞嗰度各攞一橛,再拼埋一齊形成一隻新字詞,例如英文字詞 spork 係指叉羹噉解,當中隻字詞源自 spoon(匙羹)嘅 sp- 同 fork(餐叉)嘅 -ork 拼埋一齊而成嘅。
- 逆成詞[e 27]:攞住一隻現有嘅字詞,攞住隻字詞「望落似詞綴」嗰一截,形成一隻新字詞;例如有英文史嘅考究發現,edit(指編輯嘅舉動)呢隻字詞查實出現得遲過 editor(指從事編輯嘅人),而隻詞被指係因為啲人攞走 editor 嗰個 -or (似詞綴指... 者)而形成嘅。
等等。上述呢啲創造字詞嘅機制,可以想像成
輸入 → 輸出 詞位 1 詞位 2 editor edit
噉嘅過程[31]。
Remove ads
影響返音系
一隻字詞嘅構詞特性,往往能夠影響佢嘅音系特性。
同化[e 28]係講緊兩段相鄰嘅音段互相影響,其中一個音段喺某啲特徵上似咗另外嗰個,因而令到兩個音段變得更相似。例如喺英文入面,一隻動詞變過去式要加 /d/ 喺尾,但如果前面嗰個音節係濁音,表示過去式嘅 /d/ 往往就要變成 [t]。除咗噉,一隻字詞起構詞變化(例如係做詞形變化),可能會令佢觸犯隻語言嘅語音組合規律,所以隻字詞就要發音變化,就返呢啲語音組合規律[32]。
漢語當中就有所謂嘅形態素變調現象。形態素變調講緊一個形態素嘅聲調喺某啲語境或者意思下要改變,變到同單獨噉讀嗰陣唔同。呢種現象尤其常見於一隻合成詞最尾嘅音節。用廿一世紀初嘅粵語做例子,粵語嘅形態素變調被指通常出現喺語義上同細小嘅嘢、食物、疾病相關嘅字詞[33][34],通常都係由比較低音嗰啲聲調(3 4 5 6)變做高音啲嘅 1 2 [34]:p 2。以下係一啲被指有形態素變調情況嘅香港粵語字詞:
原字 正常讀音 變調例子 點變法? 環 waan4 耳環(ji5 waan2) 4 → 2 人 jan4 男人(naam4 jan2) 4 → 2 女 neoi5 港女(gong2 neoi2) 5 → 2 晚 maan5 今晚(gam1 maan1) 5 → 1 尾 mei5 包尾(baau1 mei1) 5 → 1
唔少喺粵語周圍嘅漢語都有噉嘅現象,例子有台山話,仲有係客家話嘅某啲方言呀噉[35]。
又例如係英文啲重讀[e 29]噉,英文字詞嘅詞尾被指可以分做兩大種:一種係會引致輕重讀規律起變化嘅,而另一種就唔會引致輕重讀規律起變化。例如一隻英文字詞如果加 -ian 做尾,就會令到隻字詞重音嘅位唔同咗[36]。
Remove ads
運算概念
睇埋:自然語言處理
教電腦處理語言構詞,會用到以下呢啲概念:
- 詞形還原:教部電腦學識「一隻字詞可以做詞形變化」,令到電腦識得將呢啲唔同樣當做同一隻字詞噉嚟分析;例如英文 house 同 houses 都係名詞指屋,後者係眾數,做詞形還原就會教部電腦知 house 同 houses 係同一隻字詞嘅唔同款[37]。
- 詞幹提取:部電腦攞一隻經過詞形變化嘅字詞做 input(例如 houses),跟住畀出隻字詞嘅詞幹做 output(例如 house)[38]。處理英文嗰陣,好似詞形還原同詞幹提取等嘅作業相對簡單,不過例如俄羅斯文或者拉丁文就會撈絞好多——呢啲語言有極複雜嘅詞形變化,可能一段詞綴表達好幾種唔同嘅文法意思[註 10]。
- 詞性標注:部電腦攞一段文本做 input,再畀出個 output,同段文本入面每隻字詞標明佢屬於乜嘢詞性,每隻字都標明咗佢係名詞定係動詞定係點。舉例說明,想像家陣個 input 係以下嘅粵文語句[39]:
等等。
Remove ads
仲可以睇
- 構詞類型:語言類型學嘅一部份,按照構詞嘅方式將語言分類做分析語同綜合語等嘅類型[40]。順帶一提,粵語等嘅漢語喺構詞類型上偏向分析語。
- 原型理論:呢套理論可以用嚟解釋人類點樣判斷「呢嚿物體,係咪屬於呢隻字詞所包含嘅範圍之內」。簡單講,人腦做嘅呢種判斷,可以想像成「攞面前嗰件物體,同心目中嘅典型對比」噉樣嘅過程。
- 構詞整平:一種語言演變現象,指一隻語言當中一條詞形變化法則普遍化嘅情況[41]——例如英文啲名詞變眾數,通常係要後面加 /s/ 或者類似嘅音嘅(一條詞形變化法則),廿一世紀有啲英文字詞唔跟呢條法則,例如男人(單數定眾數都係 /man/)噉,如果英文演變到男人變眾數要加 /s/ 嘅話,就可以算係出現咗構詞整平嘅情況[42]。
- 直接相關嘅語言學學科:音系學 · 句法學 · 語義學
- 生產率
- 文法範疇
- 資訊理論
學術文獻
英文文獻:
- Baayen, H. (1991). Quantitative aspects of morphological productivity (PDF). In Yearbook of morphology 1991 (pp. 109-149). Dordrecht: Springer Netherlands.
- Hockett, C. F. (1954). Two models of grammatical description (PDF). Word, 10(2-3), 210-234,呢篇論文喺構詞學界幾出名,講到所謂嘅 item-and-arrange(item-與-排列;簡化講主張構詞係形態素嘅組合)以及 item-and-process(item-與-過程;簡化講主張構詞係詞位嘅轉化)觀點。後者被指可以解釋到點解某啲語言可以唔用詞綴就做到構詞變化[43]。
- Narrog, H. (2007). Exaptation, grammaticalization, and reanalysis (PDF). California Linguistic Notes, 32(1), 1-26.
- Ouattara, K., Lemasson, A., & Zuberbühler, K. (2009). Campbell's monkeys use affixation to alter call meaning. PloS one, 4(11), e7808,依篇文有講到坎布馬騮同類之間嘅發聲溝通似乎有構詞——呢啲馬騮會喺自己發出嘅聲後面加「後綴」,改變嗰段聲嘅意思。
- Tse, S. K., Li, H., & Leung, S. O. (2012). Tense and temporality: How young children express time in Cantonese. Chinese Language and Discourse, 3(1), 35-56,講到粵語點樣表達時間。
參考
外拎
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads