托福考試結(jié)束后,大家的作文評分會經(jīng)歷雙重評分,分別是人工評分和E-rater評分,人工評分不用多講大家也都了解,就是考官根據(jù)托福寫作評分標準來給大家的作文打分,那么E-rater是如何評分的呢?
托福寫作評分解讀 E-rater在評分中的作用
當考生完成托福考試后,作文部分(包括綜合寫作和獨立寫作)的分數(shù)將由接受過ETS培訓的老師和E-rater共同批改。在批改過程中,機器和人工獨立評分,互相不知道彼此的分數(shù),人和機器的評分范圍都是0-5分,最終系統(tǒng)會對這兩個分數(shù)進行加權(quán)平均。值得一提的是,為了保證分數(shù)的公平有效,人工給分和機器給分的誤差不得超過1分(如人工給出3分,機器給出4分為正常;人工給出2分,機器給出4分則為異常分數(shù));若兩者分數(shù)誤差超過1分,將由ETS的專業(yè)閱卷者進行再次評分。
托福寫作評分解讀 E-rater評分原理解析
E-rater通過計算機數(shù)據(jù)功能對于考生寫作文本的相關(guān)信息進行一定的標簽匹配,結(jié)合ETS的過往的寫作數(shù)據(jù)庫來審核考生的寫作質(zhì)量。它利用的是計算機語言學中的自然語言處理(Natural Language Process,簡稱NLP)方法。其中E-rater最擅長捕捉的是考生的語言使用,E-rater系統(tǒng)將考生考場作文的語言與數(shù)據(jù)庫中不同分數(shù)段的文章的語言進行比對,判斷考生的寫作語言質(zhì)量;同時,E-rater還可以通過檢測邏輯連接詞的使用來大致判斷考生文章的邏輯銜接情況,通過匹配主題關(guān)鍵詞來檢測考試的文章發(fā)展是否出現(xiàn)跑題。簡單來說,像手機軟件“唱吧”一樣,E-rater就是把考生的作文與數(shù)據(jù)庫里的文章進行比對,從而給出系統(tǒng)判斷的分數(shù)。
托福寫作評分解讀 E-rater會評判作文的那些方面
許多人認為E-rater只能檢查語法錯誤,這樣想可就錯了。作為ETS開發(fā)的幾大數(shù)據(jù)引擎之一,E-rater可以依據(jù)托福寫作評分標準,審核考生作文的五個方面:Organization & Development(文章組織和發(fā)展),Grammar(語法),Usage(用詞),Mechanics(格式),Style(語言風格).
托福寫作評分解讀 E-rater如何精準評分
我們知道,托福獨立寫作從三個維度去考量考生的作文:Development(內(nèi)容發(fā)展)、Organization(結(jié)構(gòu)組織)和Language Use(語言使用),E-rater讀不懂我們的文章內(nèi)容,那么它是如何做到精準判分的呢?
Development這個維度要求考生在文章發(fā)展中做到內(nèi)容充實,而E-rater并不能讀懂考生的文章內(nèi)容表達,因此它采取的方式是評估考生文章的The Length of Discourse Element(話語元素長度)。簡單來說,話語元素長度從兩個方面進行評估:
1. 平均句長(也就是說,如果全文的句子寫的都很短,則證明考生的思想內(nèi)容很簡單,沒有能夠有效表述清楚自己的論述。托福官方建議一篇托福寫作的平均句長應該在15-20詞左右)
2. 正文段句子數(shù)量(也就是說在中間發(fā)展段中,如果句子數(shù)量過少,證明考生沒有話說,因此也就無法有效展開自己的觀點)
我們可以這樣理解,兩個人文字聊天過程中,如果彼此有話說,那么雙方發(fā)出去的句子一定不會很短,內(nèi)容也不會很少;如果彼此發(fā)出去的文章都是“嗯”、“哈哈”、“哦”、“呵呵”之類的,那么就基本上進入了尬聊的階段。
當然,E-rater也會檢測與話題相關(guān)的語言內(nèi)容來確保考生是否出現(xiàn)跑題的現(xiàn)象,因此,緊扣主題,不斷出現(xiàn)與主題相關(guān)的詞匯和表達對于托福獨立寫作非常重要。
Organization這個維度要求考生合理組織段落,并且注意文章內(nèi)容的邏輯銜接。讀不懂考生的E-rater很是聰明地從這兩個角度去評估:
1. The Number of Discourse Elements(話語元素數(shù)量,也就是合理分段。E-rater會檢測考生是否在文章中呈現(xiàn)了Thesis Statement、Main Ideas、Supporting Ideas、Conclusion等。一般來說,建議考生的文章為4-5個自然段)
2. The Use of transitions(邏輯連接詞的使用。機器通過檢測考生句子之間的邏輯連接詞去判斷文章的邏輯是否存在以及是否合理)
Language Use這個維度是E-rater最擅長的,因為它可以通過對考生的語言表達進行數(shù)據(jù)分析,并匹配以往數(shù)據(jù)庫里的語言數(shù)據(jù),從而對考生的文章語言質(zhì)量進行審核。在語言層面,E-rater會從Grammar角度去審核考生文章中的Fragments(句子碎片)、主謂一致(Subject-verb agreement)等;會從Usage角度去審核考生文章中的Missing or Extra Article(冠詞錯誤)、Preposition Error(介詞錯誤)、Wrong Part of Speech(詞性錯誤)等;會從Mechanics角度去審核考生文章中的Spelling(單詞拼寫)、Missing Comma(逗號缺失)等;會從Style角度去審核考生文章中的Repetition of Words(詞匯重復)、Short Sentences(過多短句使用)、Passive Voice(過多被動語態(tài)使用等).
如果大家想要進一步去了解Language Use的細節(jié),建議大家去閱讀《托福官方指南(第5版)》第669頁到731頁的第10章Writer’s Handbook for English Language Learners的具體內(nèi)容。
從上文中可以看到E-rater評分不僅細致而且很智能,但是大家也不用太過擔心,只要大家能按照托福寫作評分標準去提升作文質(zhì)量,并且在寫作中減少拼寫和語法錯誤,那么E-rater肯定也會打出不錯的分值。