活動花絮:【微型課程工作坊】利用大數據語料庫學英文
次閱讀
【 知識 型 0.1 學分】利用大數據語料庫學英文
講者:林佳燕(元智大學應外系教授)
時間:2025/3/25 (二) 13:00-15:00
地點:R5006
撰文/攝影:顏彣諭
大數據已成為現今的重要趨勢,如何有效利用它來提升自身效率已成關鍵課題。從語言學的角度來看,「大數據」的範圍取決於研究目標。例如,若要分析社交媒體上的語言變遷,可能需要數百萬則貼文;若是探討特定方言的語法特徵,數千條語料或已足夠。因此,大數據的「大」不僅關乎數量,也涉及數據的多樣性、代表性和適用性。
今日課程將介紹兩大語料庫BNC(British National Corpus)與COCA(Corpus of Contemporary American English)並說明其特點與應用。BNC主要收錄英式英語,涵蓋20世紀晚期(1960-1993年)的英國書面與口語語料,總詞彙量約1億字。其語料來源多元,包括報紙、小說、學術論文及口語對話等,適用於研究英式英語的詞彙、語法及語言變遷。COCA則專注於美式英語,涵蓋1990年至今的語料,並持續更新,總詞彙量超過10億字。內容涵括新聞、小說、學術文章、電視節目、部落格等多種文本類型,適合分析美式英語的用法趨勢、語義變化及語境特徵。這兩個語料庫在語言學研究與應用領域中具有重要價值,有助於更深入理解英語的演變與使用模式。
讓學生實際操作語料庫,不僅能夠提升對語言的敏感度,還能透過語料庫的類別分類,探索自身領域中高頻使用的詞彙,優先學習最具實用價值的內容。此外,語料庫還能幫助學生從一個簡單的單字延伸出不同的搭配方式,了解其在不同語境中的應用,進而有效掌握單字的各種用法,提升語言運用的靈活度與準確性。透過這種方式,學生能夠更有系統地學習詞彙,培養語感,並在實際溝通與寫作中運用所學,達到更高層次的語言能力。











