語料庫語言學興起于20世紀80年代,是一門新興學科,它致力于文本的檢索、取樣、分析以及統(tǒng)計。語料庫的工具如Word Smith, AntConc等都可以為文本,尤其是具有情節(jié)性的文學文本的分析提供重要的理性依據(jù)。本文將通過語料庫語言學的研究方法,主要運用AntConc軟件中Word List, Concordance, Concordance Plot, Keyword List以及File View等工具來分析杰克·倫敦的《荒野的呼喚》的文本內(nèi)容和主題,語言特點和情節(jié)發(fā)展等幾個方面。
論文關鍵詞:語料庫檢索,語言特點,情節(jié)發(fā)展
隨著自然科技突飛猛進的發(fā)展, 計算機技術也正逐漸被應用于語言類人文學科的領域。語料庫語言學作為一門新興的邊緣學科, 很好地結(jié)合了自然科學與文學, 近年來語料庫語言學正以其獨特的優(yōu)勢得以迅猛發(fā)展。語料庫工具可以對任何一篇文學著作進行分析無論其長短難易。無論是否看過文本內(nèi)容,語料庫語言學可通過強大的加工、分析以及統(tǒng)計功能, 就文本的主題、人物以及情節(jié)發(fā)展進行趨理性地分析, 剔肉取骨,使在短時間內(nèi)把握文本的核心骨架成為可能,甚至通過語料庫的加工分析可以發(fā)現(xiàn)直觀情況下所不能發(fā)現(xiàn)的某些規(guī)律。
本文通過使用AntConc工具對文本進行提綱挈領式的分析研究,如Word List通過詞頻進行排序,詞頻由高到低一目了然;通過類符型符比type/token可以判斷出文本詞匯量的豐富程度,類符型符比高說明文本的詞匯量大;檢索功能concordance可以將所有包含被檢索詞的句子片斷羅列出來,方便對被檢索詞所處情景進行分析;檢索情節(jié)concordance plot可以直觀地再現(xiàn)被檢索詞在整個文本中的位置及疏密程度?傊,語料庫強大的檢索工具可以通過各種功能分析統(tǒng)計出文本中詞語的出現(xiàn)頻率,文本中詞匯量的大小以及在全文本的各個章節(jié)關鍵詞( 人物, 事物等) 出現(xiàn)的疏密程度等。另外一個文本還可以通過與另一個文本的對比分析其主題詞表展示一個文本區(qū)別于其他文本的獨特之處。
以往的文學鑒賞家對于著作本身的研究,僅僅局限于對原文斟詞酌句的研究, 分析言外意, 得出對文學作品中的情節(jié)轉(zhuǎn)化與人物塑造的理解與闡述。這種傳統(tǒng)的鑒賞方法秉承了文學研究的精髓, 為我們鑒賞佳作提供了很好的土壤。然而, 不容忽視的是, 其帶有很強的主觀性, 不免會出現(xiàn)一些偏頗。因此, 引進理性主導的語料庫檢索研究, 能夠很好地從客觀的視角對文進行分析和加工, 從而提供更加令人信服的鑒賞成果, 再結(jié)合傳統(tǒng)的主觀鑒賞, 無異于為文學鑒賞錦上添花的同時, 更輸入了新鮮的血液。[5]
本文用杰克•倫敦的《荒野的呼喚》作為文本, 主要運用AntConc中的wordlist, Concordance等工具來分析小說的大體內(nèi)容,語言特色, 情節(jié)發(fā)展, 以及人物塑造等幾個方面, 達到對原著更加理性化的分析, 從而為文學名著的研究開辟一個更新、更深入的途徑。
二、運用語料庫軟件AntConc從三個角度對小說《荒野的呼喚》進行直觀而深入的分析
表1《荒野的呼喚》中出現(xiàn)頻率在前54位的單詞
名次
頻率
單詞
名次
頻率
單詞
名次
頻率
單詞
1
2111
the
19
215
were
37
103
up
2
1469
and
20
214
they
38
101
Thornton
3
861
of
21
196
He
39
100
one
4
698
was
22
181
not
40
99
or
5
664
to
23
176
at
41
96
did
6
637
a
24
170
s
42
93
man
7
620
he
25
157
The
43
91
when
8
523
his
26
155
them
44
84
back
9
507
in
27
152
by
45
83
no
10
359
Buck
28
143
out
46
81
It
11
302
him
29
139
from
47
80
could
12
299
that
30
132
but
48
78
an
13
296
it
31
129
into
49
77
upon
14
294
with
32
124
which
50
76
They
15
273
had
33
118
dogs
51
75
dog
16
228
as
34
113
down
52
75
so
17
218
on
35
111
their
53
74
day
18
217
for
36
105
all
54
73
time
通過AntConc中Word List, Concordance Plot等工具分析主題及文本內(nèi)容
通過對表1頻率前54名的人稱代詞的觀察 “he” 出現(xiàn)620次, “his” 523次, “him” 302次, “it” 296次, “they” 214次, “He” 196次, “them” 155次,“their”111次, “It” 81次, “They” 76次,發(fā)現(xiàn)出現(xiàn)的人稱代詞全部是男性而前54名中沒有女性人稱代詞的出現(xiàn),說明文本涉及的主要角色是男性,而且有很多男性, 否則作者不會如此頻繁使用男性代詞主格、賓格和物主代詞以及復數(shù)形式。再通過對名詞的觀察分析 “Buck” 出現(xiàn)359次第10名也是第一個名詞, “dogs” 出現(xiàn)118次, “Thornton” 出現(xiàn)101次, “man” 出現(xiàn)93次, “dog”出現(xiàn)75,用Concordance Plot工具可以很清楚的看到Buck貫穿整個文本始終是文本的最主要角色,從File View搜索出關于Buck的描述知道Buck是一只狗,所以文本的主題是圍繞著這條狗的一系列事件。
表1中Thornton是繼Buck之后54名中唯一的人稱名詞說明是文本中另一個很重要的男性名字,但當用Concordance Plot 觀察其文本中分布情況時發(fā)現(xiàn)了一個奇怪的現(xiàn)象,他只在文本的后半部分出現(xiàn)而且密度相當大,可以推斷Thornton是后來才出現(xiàn)的人物卻與Buck有非同尋常的關系。另外表1中有很多表示動作方向的詞如 “out” 出現(xiàn)143次, “from” 出現(xiàn)139次, “into” 129次, “down” 113次, “up” 103次, “back” 84次,說明文本中關于動物活動較多至此可以得出一個結(jié)論,文本內(nèi)容是有關Buck這條狗與其他狗及人(主要是男性)打交道的活動經(jīng)歷以及其與后來出現(xiàn)的Thornton的密切關系。
運用Word List 和Concordance分析小說的語言特色。
通過AntConc軟件, 我們可以發(fā)現(xiàn)小說共有32203詞, 其中有4931個不同的詞。表1列出了頻率前54的詞。根據(jù)表1, 不難發(fā)現(xiàn), 同一個詞的某些形式出現(xiàn)的頻率較多。從表1我們可以看出表時態(tài)的動詞有be動詞 “was” 出現(xiàn)了689次第4名, “were” 出現(xiàn)了215次第19名,助動詞 “had” 出現(xiàn)了273次第15名 “did” 出現(xiàn)了96次第41名,情態(tài)動詞 “could” 出現(xiàn)了80次第47名,由此可以看出頻率前54名中的動詞全部都是過去式而并沒有出現(xiàn)現(xiàn)在時態(tài)的is,are等詞,說明文本敘述的是過去的事情所用基本時態(tài)是過去時。
另外表1中 “that” 出現(xiàn)了299次位居12名, “which” 也出現(xiàn)了124次第32名,指示代詞多表明文本中有很多從句,而且句子的結(jié)構(gòu)也遠比口語句子結(jié)果要復雜,這是書面語的一大特征。對文本內(nèi)容的分析中提到文中he, his, him, they, them等的人稱代詞出現(xiàn)頻率很高而且在前54名中并沒有出現(xiàn)I, me, you等人稱代詞,這就說明文本作者是以第三人稱寫作而非第一人稱并且文中對話并不是很多。根據(jù)詞頻列表, 我們可以分析推斷得出小說上述的時態(tài)、句式、語體等方面的特色, 其它更為詳盡的內(nèi)容, 還需要進一步的閱讀與分析。
3. 通過語料庫語言學Keyword List, Concordance Plot等工具分析小說的情節(jié)發(fā)展。
要理解一部小說的精髓, 必須掌握其行文的脈絡和貫穿始終的情節(jié)。這種對情節(jié)發(fā)展的把握可以通過對原著的通讀來完成。本文要使用的方法是通過使用AntConc語料庫檢索軟件中的Keyword List, Concordance Plot及File View功能對小說文本的情節(jié)進行統(tǒng)計分析。由于只通過詞頻用Word List對文本的故事脈絡把握的還不是很明晰完整,所以本文通過《荒野的呼喚》和同樣為杰克·倫敦所著的《海狼》比較獲得的Keyword List對文本進行進一步的分析。Keyword List所列單詞是觀察文本相對于另一參照文本所列出的與其有顯著差別的單詞,這對于找出觀察文本的突出其特征及區(qū)別于其他文本的獨特之處有很大幫助。
圖2 《荒野的呼喚》對比《海狼》按照差異顯著性(Keyness)排列的單詞
名次
頻率
顯著性(Keyness)
單詞
名次
頻率
顯著性(Keyness)
單詞
1
359
1053.259
Buck
19
38
83.197
trail
2
118
319.661
dogs
20
28
82.148
ice
3
101
296.321
Thornton
21
28
82.148
traces
4
65
190.701
Spitz
22
33
73.567
snow
5
63
184.834
sled
23
25
73.347
Dave
6
620
179.738
he
24
24
62.540
forest
7
60
176.032
Francois
25
21
61.611
Mercedes
8
75
153.158
dog
26
20
58.677
Dawson
9
523
143.144
his
27
155
54.340
them
10
214
139.157
they
28
18
52.810
Charles
11
52
130.849
camp
29
18
52.810
driver
12
39
114.421
John
30
18
52.810
Hans
13
39
114.421
Perrault
31
18
52.810
huskies
14
37
108.553
Hal
32
18
52.810
Judge
15
34
99.752
team
33
28
50.791
wolf
16
302
94.067
him
34
76
49.582
They
17
30
88.016
Sol
35
16
46.942
Pete
18
29
85.082
leks
36
32
44.691
club
通過表2排名前三的單詞可以清楚地看出文本關鍵角色和主題,即講述了Buck和其他狗以及一個男性關鍵角色Thornton的故事,這也是對前面用表1所分析出的文本內(nèi)容的一個肯定和證實。另外通過concordance plot與file view相結(jié)合的方式可以基本把握文本情節(jié)發(fā)展的脈絡。concordance plot可以清楚直觀的展現(xiàn)某一單詞在文本中出現(xiàn)的位置及其密度即一眼即可看出單詞在那個位置出現(xiàn)頻率最高,從而再通過file view功能直接找到單詞集中出現(xiàn)最多的原文進行閱讀分析。
例如,經(jīng)過分析發(fā)現(xiàn),位于32名的Judge只在文本開頭出現(xiàn)且頻率很高當用file view進入原文觀察發(fā)現(xiàn)Judge是Buck沒有被偷賣以前的主人并且Buck在這里過的是悠閑貴族般的生活。而表2中sled, camp, ice, snow, forest等詞的出現(xiàn)表明后來Buck的生活環(huán)境發(fā)生了巨大的變化,而從Judge幾乎沒有再出現(xiàn)也可以證實這一點。實際上表2有個最顯著的特征,36個單詞中除了Buck外有14個是名字,經(jīng)過觀察發(fā)現(xiàn),有一個是地名Dawson,三個是狗的名字Spitz, Sol- leks, Dave,其余都是人的名字,其中只有一個是女性,加上對表中詞team和driver的分析不難將其串聯(lián)起來。
Buck后來所處的環(huán)境是冰天雪地,他與其他狗所組成的雪橇隊運送貨物且路途遙遠中間需要露營,并且雪橇隊的主人不斷更換,因為通過對人名的分析發(fā)現(xiàn)Francois 和Perrault只出現(xiàn)在前面也就是繼Judge之后第一批主人,Hal, Mercedes 和Charles是只在文本中間出現(xiàn)的第二批主人,John Thornton, Hans和Pete是最后一批主人。
對Thornton的concordance plot分析發(fā)現(xiàn)他出現(xiàn)后頻率明顯高于其他人說明他與Buck有非常密切的關系,而file view分析表明Thornton在危機時刻救了Buck的命,后來Buck就一直跟隨在Thornton身邊直到最后發(fā)現(xiàn)他被殺死。通過concordance plot可以發(fā)現(xiàn)在Thornton從文本中消失即死去后wolf這個單詞的密度開始增大。從文本最后wolf頻率最集中這點進一步深入研究分析,Buck與人類世界的聯(lián)系終止在內(nèi)心野性的呼喚下加入到森林中狼的隊伍與狼共舞并且以其碩大強健的體魄成為狼的首領。
三、結(jié)語
以上運用語料庫檢索對小說《荒野的呼喚》進行了分析, 準確清晰地把握了小說的發(fā)展脈絡, 并對其內(nèi)容主題、語言特色和情節(jié)發(fā)展方面進行了統(tǒng)計分析。當然用語料庫作為工具對文本的分析不能代替文學本身出發(fā)的鑒賞, 但畢竟為我們認識作品提供了佐證。[3]因此, 將自然科學中的計算機技術與文學中的文本進行結(jié)合, 可以為文學研究另辟蹊徑, 即以圖形、列表、統(tǒng)計等量化的方法分析文本, 從而得到對文本更加理性的詮釋。
參考文獻:
[1] Douglas Biber, Susan Conrad, Randi Reppen Corpus Linguistic [M]. 北京: 外語教學與研究出版社, 2000.
[2] JennyThomas, Mick Short. Using Corpora for Language Research [M]. 北京: 外語教學與研究出版社, 2001.
[3] 郭放.《快樂王子》的語料庫檢索分析[J]. 樂山師范學院學報, 2004, (6).
[4] 王雁.《傲慢與偏見》的語料庫檢索分析[J]. 江蘇教育學院學報(社會科學版) , 2007, (3).
[5] 王立非, 孫曉坤. 國內(nèi)外英語學習者語料庫的發(fā)展:現(xiàn)狀與方法[J]. 外語電化教學, 2005, (5).
[6] 杰克·倫敦. 荒野的呼喚[M]. 胡春蘭, 趙蘇蘇,譯. 北京: 人民文學出版社, 2004.
[7] 杰克•倫敦. 海狼[M]. 臧樹林, 王陽,譯. 北京: 人民文學出版社, 2006.