91精品人妻互换日韩精品久久影视|又粗又大的网站激情文学制服91|亚州A∨无码片中文字慕鲁丝片区|jizz中国无码91麻豆精品福利|午夜成人AA婷婷五月天精品|素人AV在线国产高清不卡片|尤物精品视频影院91日韩|亚洲精品18国产精品闷骚

您當前位置:首頁 > 新聞頻道 > 技術動態(tài) > 正文
關于語料庫AntConc軟件對《荒野的呼喚》的研究

語料庫語言學興起于20世紀80年代,是一門新興學科,它致力于文本的檢索、取樣、分析以及統(tǒng)計。語料庫的工具如Word Smith, AntConc等都可以為文本,尤其是具有情節(jié)性的文學文本的分析提供重要的理性依據(jù)。本文將通過語料庫語言學的研究方法,主要運用AntConc軟件中Word List, Concordance, Concordance Plot, Keyword List以及File View等工具來分析杰克·倫敦的《荒野的呼喚》的文本內(nèi)容和主題,語言特點和情節(jié)發(fā)展等幾個方面。
論文關鍵詞:語料庫檢索,語言特點,情節(jié)發(fā)展
  隨著自然科技突飛猛進的發(fā)展, 計算機技術也正逐漸被應用于語言類人文學科的領域。語料庫語言學作為一門新興的邊緣學科, 很好地結(jié)合了自然科學與文學, 近年來語料庫語言學正以其獨特的優(yōu)勢得以迅猛發(fā)展。語料庫工具可以對任何一篇文學著作進行分析無論其長短難易。無論是否看過文本內(nèi)容,語料庫語言學可通過強大的加工、分析以及統(tǒng)計功能, 就文本的主題、人物以及情節(jié)發(fā)展進行趨理性地分析, 剔肉取骨,使在短時間內(nèi)把握文本的核心骨架成為可能,甚至通過語料庫的加工分析可以發(fā)現(xiàn)直觀情況下所不能發(fā)現(xiàn)的某些規(guī)律。
  本文通過使用AntConc工具對文本進行提綱挈領式的分析研究,如Word List通過詞頻進行排序,詞頻由高到低一目了然;通過類符型符比type/token可以判斷出文本詞匯量的豐富程度,類符型符比高說明文本的詞匯量大;檢索功能concordance可以將所有包含被檢索詞的句子片斷羅列出來,方便對被檢索詞所處情景進行分析;檢索情節(jié)concordance plot可以直觀地再現(xiàn)被檢索詞在整個文本中的位置及疏密程度?傊,語料庫強大的檢索工具可以通過各種功能分析統(tǒng)計出文本中詞語的出現(xiàn)頻率,文本中詞匯量的大小以及在全文本的各個章節(jié)關鍵詞( 人物, 事物等) 出現(xiàn)的疏密程度等。另外一個文本還可以通過與另一個文本的對比分析其主題詞表展示一個文本區(qū)別于其他文本的獨特之處。
  以往的文學鑒賞家對于著作本身的研究,僅僅局限于對原文斟詞酌句的研究, 分析言外意, 得出對文學作品中的情節(jié)轉(zhuǎn)化與人物塑造的理解與闡述。這種傳統(tǒng)的鑒賞方法秉承了文學研究的精髓, 為我們鑒賞佳作提供了很好的土壤。然而, 不容忽視的是, 其帶有很強的主觀性, 不免會出現(xiàn)一些偏頗。因此, 引進理性主導的語料庫檢索研究, 能夠很好地從客觀的視角對文進行分析和加工, 從而提供更加令人信服的鑒賞成果, 再結(jié)合傳統(tǒng)的主觀鑒賞, 無異于為文學鑒賞錦上添花的同時, 更輸入了新鮮的血液。[5]
  本文用杰克•倫敦的《荒野的呼喚》作為文本, 主要運用AntConc中的wordlist, Concordance等工具來分析小說的大體內(nèi)容,語言特色, 情節(jié)發(fā)展, 以及人物塑造等幾個方面, 達到對原著更加理性化的分析, 從而為文學名著的研究開辟一個更新、更深入的途徑。
  二、運用語料庫軟件AntConc從三個角度對小說《荒野的呼喚》進行直觀而深入的分析
  表1《荒野的呼喚》中出現(xiàn)頻率在前54位的單詞
  名次
  頻率
  單詞
  名次
  頻率
  單詞
  名次
  頻率
  單詞
  1
  2111
  the
  19
  215
  were
  37
  103
  up
  2
  1469
  and
  20
  214
  they
  38
  101
  Thornton
  3
  861
  of
  21
  196
  He
  39
  100
  one
  4
  698
  was
  22
  181
  not
  40
  99
  or
  5
  664
  to
  23
  176
  at
  41
  96
  did
  6
  637
  a
  24
  170
  s
  42
  93
  man
  7
  620
  he
  25
  157
  The
  43
  91
  when
  8
  523
  his
  26
  155
  them
  44
  84
  back
  9
  507
  in
  27
  152
  by
  45
  83
  no
  10
  359
  Buck
  28
  143
  out
  46
  81
  It
  11
  302
  him
  29
  139
  from
  47
  80
  could
  12
  299
  that
  30
  132
  but
  48
  78
  an
  13
  296
  it
  31
  129
  into
  49
  77
  upon
  14
  294
  with
  32
  124
  which
  50
  76
  They
  15
  273
  had
  33
  118
  dogs
  51
  75
  dog
  16
  228
  as
  34
  113
  down
  52
  75
  so
  17
  218
  on
  35
  111
  their
  53
  74
  day
  18
  217
  for
  36
  105
  all
  54
  73
  time
  通過AntConc中Word List, Concordance Plot等工具分析主題及文本內(nèi)容
  通過對表1頻率前54名的人稱代詞的觀察 “he” 出現(xiàn)620次, “his” 523次, “him” 302次, “it” 296次, “they” 214次, “He” 196次, “them” 155次,“their”111次, “It” 81次, “They” 76次,發(fā)現(xiàn)出現(xiàn)的人稱代詞全部是男性而前54名中沒有女性人稱代詞的出現(xiàn),說明文本涉及的主要角色是男性,而且有很多男性, 否則作者不會如此頻繁使用男性代詞主格、賓格和物主代詞以及復數(shù)形式。再通過對名詞的觀察分析 “Buck” 出現(xiàn)359次第10名也是第一個名詞, “dogs” 出現(xiàn)118次, “Thornton” 出現(xiàn)101次, “man” 出現(xiàn)93次, “dog”出現(xiàn)75,用Concordance Plot工具可以很清楚的看到Buck貫穿整個文本始終是文本的最主要角色,從File View搜索出關于Buck的描述知道Buck是一只狗,所以文本的主題是圍繞著這條狗的一系列事件。
  表1中Thornton是繼Buck之后54名中唯一的人稱名詞說明是文本中另一個很重要的男性名字,但當用Concordance Plot 觀察其文本中分布情況時發(fā)現(xiàn)了一個奇怪的現(xiàn)象,他只在文本的后半部分出現(xiàn)而且密度相當大,可以推斷Thornton是后來才出現(xiàn)的人物卻與Buck有非同尋常的關系。另外表1中有很多表示動作方向的詞如 “out” 出現(xiàn)143次, “from” 出現(xiàn)139次, “into” 129次, “down” 113次, “up” 103次, “back” 84次,說明文本中關于動物活動較多至此可以得出一個結(jié)論,文本內(nèi)容是有關Buck這條狗與其他狗及人(主要是男性)打交道的活動經(jīng)歷以及其與后來出現(xiàn)的Thornton的密切關系。
  運用Word List 和Concordance分析小說的語言特色。
  通過AntConc軟件, 我們可以發(fā)現(xiàn)小說共有32203詞, 其中有4931個不同的詞。表1列出了頻率前54的詞。根據(jù)表1, 不難發(fā)現(xiàn), 同一個詞的某些形式出現(xiàn)的頻率較多。從表1我們可以看出表時態(tài)的動詞有be動詞 “was” 出現(xiàn)了689次第4名, “were” 出現(xiàn)了215次第19名,助動詞 “had” 出現(xiàn)了273次第15名 “did” 出現(xiàn)了96次第41名,情態(tài)動詞 “could” 出現(xiàn)了80次第47名,由此可以看出頻率前54名中的動詞全部都是過去式而并沒有出現(xiàn)現(xiàn)在時態(tài)的is,are等詞,說明文本敘述的是過去的事情所用基本時態(tài)是過去時。
  另外表1中 “that” 出現(xiàn)了299次位居12名, “which” 也出現(xiàn)了124次第32名,指示代詞多表明文本中有很多從句,而且句子的結(jié)構(gòu)也遠比口語句子結(jié)果要復雜,這是書面語的一大特征。對文本內(nèi)容的分析中提到文中he, his, him, they, them等的人稱代詞出現(xiàn)頻率很高而且在前54名中并沒有出現(xiàn)I, me, you等人稱代詞,這就說明文本作者是以第三人稱寫作而非第一人稱并且文中對話并不是很多。根據(jù)詞頻列表, 我們可以分析推斷得出小說上述的時態(tài)、句式、語體等方面的特色, 其它更為詳盡的內(nèi)容, 還需要進一步的閱讀與分析。
  3. 通過語料庫語言學Keyword List, Concordance Plot等工具分析小說的情節(jié)發(fā)展。
  要理解一部小說的精髓, 必須掌握其行文的脈絡和貫穿始終的情節(jié)。這種對情節(jié)發(fā)展的把握可以通過對原著的通讀來完成。本文要使用的方法是通過使用AntConc語料庫檢索軟件中的Keyword List, Concordance Plot及File View功能對小說文本的情節(jié)進行統(tǒng)計分析。由于只通過詞頻用Word List對文本的故事脈絡把握的還不是很明晰完整,所以本文通過《荒野的呼喚》和同樣為杰克·倫敦所著的《海狼》比較獲得的Keyword List對文本進行進一步的分析。Keyword List所列單詞是觀察文本相對于另一參照文本所列出的與其有顯著差別的單詞,這對于找出觀察文本的突出其特征及區(qū)別于其他文本的獨特之處有很大幫助。
  圖2 《荒野的呼喚》對比《海狼》按照差異顯著性(Keyness)排列的單詞
  名次
  頻率
  顯著性(Keyness)
  單詞
  名次
  頻率
  顯著性(Keyness)
  單詞
  1
  359
  1053.259
  Buck
  19
  38
  83.197
  trail
  2
  118
  319.661
  dogs
  20
  28
  82.148
  ice
  3
  101
  296.321
  Thornton
  21
  28
  82.148
  traces
  4
  65
  190.701
  Spitz
  22
  33
  73.567
  snow
  5
  63
  184.834
  sled
  23
  25
  73.347
  Dave
  6
  620
  179.738
  he
  24
  24
  62.540
  forest
  7
  60
  176.032
  Francois
  25
  21
  61.611
  Mercedes
  8
  75
  153.158
  dog
  26
  20
  58.677
  Dawson
  9
  523
  143.144
  his
  27
  155
  54.340
  them
  10
  214
  139.157
  they
  28
  18
  52.810
  Charles
  11
  52
  130.849
  camp
  29
  18
  52.810
  driver
  12
  39
  114.421
  John
  30
  18
  52.810
  Hans
  13
  39
  114.421
  Perrault
  31
  18
  52.810
  huskies
  14
  37
  108.553
  Hal
  32
  18
  52.810
  Judge
  15
  34
  99.752
  team
  33
  28
  50.791
  wolf
  16
  302
  94.067
  him
  34
  76
  49.582
  They
  17
  30
  88.016
  Sol
  35
  16
  46.942
  Pete
  18
  29
  85.082
  leks
  36
  32
  44.691
  club
  通過表2排名前三的單詞可以清楚地看出文本關鍵角色和主題,即講述了Buck和其他狗以及一個男性關鍵角色Thornton的故事,這也是對前面用表1所分析出的文本內(nèi)容的一個肯定和證實。另外通過concordance plot與file view相結(jié)合的方式可以基本把握文本情節(jié)發(fā)展的脈絡。concordance plot可以清楚直觀的展現(xiàn)某一單詞在文本中出現(xiàn)的位置及其密度即一眼即可看出單詞在那個位置出現(xiàn)頻率最高,從而再通過file view功能直接找到單詞集中出現(xiàn)最多的原文進行閱讀分析。
  例如,經(jīng)過分析發(fā)現(xiàn),位于32名的Judge只在文本開頭出現(xiàn)且頻率很高當用file view進入原文觀察發(fā)現(xiàn)Judge是Buck沒有被偷賣以前的主人并且Buck在這里過的是悠閑貴族般的生活。而表2中sled, camp, ice, snow, forest等詞的出現(xiàn)表明后來Buck的生活環(huán)境發(fā)生了巨大的變化,而從Judge幾乎沒有再出現(xiàn)也可以證實這一點。實際上表2有個最顯著的特征,36個單詞中除了Buck外有14個是名字,經(jīng)過觀察發(fā)現(xiàn),有一個是地名Dawson,三個是狗的名字Spitz, Sol- leks, Dave,其余都是人的名字,其中只有一個是女性,加上對表中詞team和driver的分析不難將其串聯(lián)起來。 Buck后來所處的環(huán)境是冰天雪地,他與其他狗所組成的雪橇隊運送貨物且路途遙遠中間需要露營,并且雪橇隊的主人不斷更換,因為通過對人名的分析發(fā)現(xiàn)Francois 和Perrault只出現(xiàn)在前面也就是繼Judge之后第一批主人,Hal, Mercedes 和Charles是只在文本中間出現(xiàn)的第二批主人,John Thornton, Hans和Pete是最后一批主人。
  對Thornton的concordance plot分析發(fā)現(xiàn)他出現(xiàn)后頻率明顯高于其他人說明他與Buck有非常密切的關系,而file view分析表明Thornton在危機時刻救了Buck的命,后來Buck就一直跟隨在Thornton身邊直到最后發(fā)現(xiàn)他被殺死。通過concordance plot可以發(fā)現(xiàn)在Thornton從文本中消失即死去后wolf這個單詞的密度開始增大。從文本最后wolf頻率最集中這點進一步深入研究分析,Buck與人類世界的聯(lián)系終止在內(nèi)心野性的呼喚下加入到森林中狼的隊伍與狼共舞并且以其碩大強健的體魄成為狼的首領。
  三、結(jié)語
  以上運用語料庫檢索對小說《荒野的呼喚》進行了分析, 準確清晰地把握了小說的發(fā)展脈絡, 并對其內(nèi)容主題、語言特色和情節(jié)發(fā)展方面進行了統(tǒng)計分析。當然用語料庫作為工具對文本的分析不能代替文學本身出發(fā)的鑒賞, 但畢竟為我們認識作品提供了佐證。[3]因此, 將自然科學中的計算機技術與文學中的文本進行結(jié)合, 可以為文學研究另辟蹊徑, 即以圖形、列表、統(tǒng)計等量化的方法分析文本, 從而得到對文本更加理性的詮釋。

參考文獻:
[1] Douglas Biber, Susan Conrad, Randi Reppen Corpus Linguistic [M]. 北京: 外語教學與研究出版社, 2000.
[2] JennyThomas, Mick Short. Using Corpora for Language Research [M]. 北京: 外語教學與研究出版社, 2001.
[3] 郭放.《快樂王子》的語料庫檢索分析[J]. 樂山師范學院學報, 2004, (6).
[4] 王雁.《傲慢與偏見》的語料庫檢索分析[J]. 江蘇教育學院學報(社會科學版) , 2007, (3).
[5] 王立非, 孫曉坤. 國內(nèi)外英語學習者語料庫的發(fā)展:現(xiàn)狀與方法[J]. 外語電化教學, 2005, (5).
[6] 杰克·倫敦. 荒野的呼喚[M]. 胡春蘭, 趙蘇蘇,譯. 北京: 人民文學出版社, 2004.
[7] 杰克•倫敦. 海狼[M]. 臧樹林, 王陽,譯. 北京: 人民文學出版社, 2006.

關鍵字:教育,北京
About Us - 關于我們 - 服務列表 - 付費指導 - 媒體合作 - 廣告服務 - 版權(quán)聲明 - 聯(lián)系我們 - 網(wǎng)站地圖 - 常見問題 - 友情鏈接
Copyright©2014安裝信息網(wǎng) m.78375555.com. All rights reserved.
服務熱線:4000-293-296 聯(lián)系電話:0371-61311617 傳真:0371-55611201 QQ: 郵箱:zgazxxw@126.com 豫ICP備18030500號-4
未經(jīng)過本站允許,請勿將本站內(nèi)容傳播或復制
安全聯(lián)盟認證