考GRE需要多大詞匯量?
2025-07-11 12:55:48 來源:中國教育在線
GRE考試一直以對考生詞匯量要求高著稱。在網絡上搜索“考GRE需要多大詞匯量”,可以得到少則兩三千、多則兩三萬的截然不同的回答。如果仔細觀察這些說法可以發現,其中一萬以上的答案幾乎全都是來自于主觀判斷,缺少實際的證據或理由作為支持,讓人不敢輕易相信。而兩三千的答案雖多以實際數據為依據,但由于其在數據的獲取和解讀上存在諸多不合理之處,參考價值也有限。本文試圖在克服目前已有說法的缺陷的基礎上針對考GRE需要多大詞匯量這一問題給出一個相對而言更為可信的答案。
詞匯量的定義
在討論GRE考試的詞匯量要求之前,首先要明確詞匯量的定義,因為在不同的定義下由同一段文本可以統計出迥然相異的詞匯量[1]。由于英語中同一個單詞存在諸多變形(inflections),如動詞look的常見變形有looks、looked、looking,因此在統計詞匯量時有必要明確這些變形是否應算作同一個詞匯。本文中除非特別說明,否則統計詞匯量時均只計算詞目(lemma)的數量,同一詞目的不同變形均算作同一個詞匯。因此前面提到過的look、looks、looked、looking同時出現時只統計一次,而這也是目前最常用的統計詞匯量的標準。此外,由于專有名詞(如人名和地名)以及過于專業的學科專業名詞一般而言也不會計入某個人的詞匯量,因此對于這部分詞匯本文在統計時也予以忽略。
需要注意的是,有些時候一個詞目在添加了前綴或后綴之后也有可能變為新的詞目。如interest、interesting、interested由于在意思上存在較大差別,因此構成了三個詞目。粗略判斷一個單詞自身是否構成詞目的一個簡單方法為,如果該單詞在英語字典中存在單獨的詞條則為詞目,否則為其他詞目的變形(inflection)。如在英語詞典中可以找到interesting的詞條,但無法找到looks的詞條,因此前者構成詞目,而后者僅為look的變形。
GRE考查的詞匯總量
在明確了詞匯量的定義之后便可以統計GRE考查的詞匯總量。本文以目前網絡上流通的諸多GRE考試真題為研究樣本,樣本共包含900余道填空題目,以及299篇閱讀文章和相應的題目(其中93篇為邏輯單題)。
統計發現,樣本中全部填空題目中出現的總詞匯量為6546,全部閱讀題目中出現的總詞匯量為6281,閱讀理解題目詞匯量為5765,邏輯單題詞匯量為2141,所有題目中出現的總詞匯量為9208。
其他已有的以實際考題為依據統計出的GRE考試詞匯量也與此大同小異。于是有人據此提出,考GRE實際需要的詞匯量不到一萬。而又由于上述詞匯量中包含了相當一部分的大學英語四六級基礎詞匯,于是又有人通過簡單地將GRE題目的總詞匯減去大約6000的四六級詞匯量,得出考GRE只需要在四六級詞匯的基礎上再掌握大約三千詞匯量的結論。
但是這種說法忽略了一個嚴重的問題:由于上文所述的詞匯量是基于以往的考試題目統計出來的,因此我們只能說這一萬左右的詞匯可以應付以往的GRE考題,但并不一定足以應付未來的考題。因為過往經驗告訴我們,幾乎每次GRE考試都會考查以往考試中沒有出現過的新詞。因此除非我們用作統計樣本的題目數量足夠多,多到其中涉及到的詞匯可以覆蓋到未來考試中所有有可能出現的詞匯,否則應對未來GRE考試所需的詞匯量應大于基于現有題目的統計結果。
GRE詞匯的難度
上述計算GRE所需詞匯量方法的另一個問題在于其在統計時沒有考慮GRE詞匯的難度。比如我們先來看下面這道GRE官網上的填空例題:
In parts of the Arctic,the land grades into the landfast ice so______that you can walk off the coast and not know you are over the hidden sea.
(A)permanently
(B)imperceptibly
(C)irregularly
(D)precariously
(E)relentlessly
(答案:B)
這道題目中出現的詞匯量為29,那么請問如果只是為了做對這一道題的話,一個考生需要有多大詞匯量?答案顯然不會是29。因為這道題目中出現了眾多高難度詞匯,在正常情況下任何一個詞匯只有29的人都不可能認識選項中的這五個單詞。
不論是母語者還是外語學習者,人們在學習詞匯時整體上都是先掌握常用詞匯,然后才能掌握生僻詞匯。由于這一正常詞匯學習的規律,又由于GRE考試經常考查極為生僻的詞匯而很多常用詞匯反而不考,導致一個考生只要當其實際掌握的詞匯量顯著高于GRE實際考查的詞匯量時才有可能認識考試中出現的生僻單詞。因此要回答考GRE需要多大詞匯量這一問題,更合理的思路應是從GRE詞匯的難度著手。
最能反映詞匯難度的指標是詞匯的生僻程度:越常見的單詞越容易被使用者掌握,而越生僻的單詞使用者掌握的可能性也越小。本文以當代美語語料庫(Corpus of Contemporary American English,COCA)發布的單詞詞頻數據作為計算單詞生僻程度的依據。COCA為目前世界上最大的英語語料庫,其中收錄了總計超過4.5億字的文本,可以很好地反映出英語的實際使用情況。COCA發布了六萬余個詞目、總計超過十萬詞匯(包含詞目的變形)的詞頻數據。其中最高頻的5000詞目均為日常表達常用詞,而詞頻排名在10000以后的詞目則大多出自書面表達。根據流行的詞匯量測試網站testyourvocab.com的統計,大多數母語者的詞匯量在20000-35000之間,極少有人詞匯量超過40000。
本文直接將單詞所屬詞目在COCA中的頻率排名作為詞匯生僻程度的指標,不做任何換算。數字越大表示單詞越生僻,最大為63145。按照這一標準,單詞look難度為76,abandon難度為2203,上面例題中E選項的relentlessly難度為10098。于是我們可以這樣估計考GRE所需的詞匯量:考生解題需要認識的所有詞匯中的難度最大值即為所需詞匯量。因為理想情況下學習者掌握詞匯的順序應完全與其詞頻排序一致,于是當考生的詞匯量為N時,應剛好認識題目中難度小于等于N的所有單詞。雖然現實中學習者不大可能會完全按照詞頻順序掌握每個詞匯,但據此推算出的所需詞匯量與實際的所需詞匯量不會相差太多。
>>免費領全球留學白皮書,了解各大學報考條件、費用、開學時間、含金量<<