学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 英语论文 基于COCA语料库的同义词辨析—以identify和recognize为例论文

基于COCA语料库的同义词辨析—以identify和recognize为例论文

23

2024-04-10 14:29:55    来源:    作者:hemenglin

摘要:语料库语言学的发展为辨析英语同义词提供了 一种有效的方法—语料库检索 。语料库检索同义词的方法对以语 料库为基础的英语同义词教学起到了 一定帮助

  摘 要:语料库语言学的发展为辨析英语同义词提供了 一种有效的方法—语料库检索 。语料库检索同义词的方法对以语 料库为基础的英语同义词教学起到了 一定帮助,为更多学习者学习方法的转变提供参考帮助 。文章基于美国当代英语语料库 ( COCA) , 采取语料库研究方法,以同义词 identify 和 recognize 为例,主要就该组词的词频、搭配、类联接等方面进行分析。

  关键词:COCA语料库;同义词辨析;语域;语义韵

  Synonym Discrimination Based on COCA Corpus —Taking identify and recognize as Examples

  Zhao Yan , Wu Jinghui

  ( Shenyang University of Chemical Technology , Shenyang, Liaoning, 110142)

  Abstract: The development of corpus linguistics provides an effective method for discriminating English synonyms—corpus retrieval This method is helpful to the corpus-based English synonym teaching and provides reference for more learners to change their learning methods. Based on the COCA , this paper adopts the corpus research method , takes synonyms identify and recognize as examples , and focuses on the word frequency , collocation , and class connection of this group of words.

  Key words: COCA corpus; synonym discrimination; register; semantic rhyme

  在英语学习的过程中,词汇的学习是语言学习 中最为基础也是至关重要的一部分 。但英语同义词 和近义词占据了英语总量的二分之一 以上,对非英 语母语的习得者来说,面对相似且存在细微差异的 同义词难以做出适合的选择,所以同义词成为英语 学习的重点和难点之一。

  一、研究背景

  随着计算机技术的发展,语料库带来了语言学 及语言教学的新发展 。语料库的定性和定量的研究 方法也为同义词辨析提供了客观、全面的补充 。文 章选择了美国当代语料库( COCA) 作为研究工具, COCA 语料库是美国杨百翰大学学者开发 。当代英 语语料库由多种文体的数亿文本材料构成,是世界 上最 大 的 英 语 平 衡 语 料 库 。 因 此,文 章 将 通 过 COCA 语料库,以 identity 和 recognize 为例,从语域、 语义韵和搭配等方面进行英语同义词辨析研究,探讨语料库在词汇学习方面的独特优势 。同时,利用 COCA 语料库中的五种基本查询功能收集所需要的 语域分布、搭配和语义韵分析数据,分析该组两个表 示“认同”的词汇之间的差异,以期发现语料库在英 语教学中的作用。

  二、数据分析与讨论

  ( 一)语域分布对比研究

  语言学将同义词大致分为绝对同义词( absolute synonym) 和相对同义词( relative synonym ) 两种 。在 人们的生活和学习之中绝对同义词极为罕见,常见 的是在一定语境中表达相同的两个词或词组,即相 对同义词 。这些同义词的差异集中体现在方言用 法、文体差异、不同搭配和语义韵的不同上 。通过 COCA 语料库中语域数据查询直观地表现出同义词 之间的差异 。韩礼德提出语域是个语义概念,是某 一特定话语范围、话语方式和话语基调情境有关的意义组合[1] 。因此,同义词在不同语域中的使用频 率差异更能表现出同义词之间使用上的偏向,对近 义词 的 区 分 和 使 用 也 有 着 重 要 的 指 示 性 。通 过 COCA 中的“Chart”功能得到 identify 和 recognize 语 域分布情况(如表 1) 。

273D7D54-1AB2-4205-9E6E-6C26199BDC50.png

  COCA 语料库中多用频数表示某一文本在每百 万词中的出现概率,各个语域中存在差异的频数也只是该文本词汇的区别 。从表格中词汇的语域分布 上来看,identify 与 recognize 在使用上具有相似之 处,但 是 identify 相 比 之 下 更 加 不 全 面 。首 先, identify 和 recognize 都在学术期刊、报纸和杂志等正 式 文 体 中 使 用 的 多,相 比 较 而 言,identify 比 recognize 在 学 术 性 更 强 ( 18 651/10 316 ) 。 而 recognize 在口语,尤其是小说这种非正式文本中出 现次数远高于 identify ( 1 824/5 579) 。在未列表的 电视和网络等语境中上,recognize 的使用频率也远 高于 identify。由此可见,identify 和 recognize 相较, identity 更 加 适 用 于 正 式 文 体 和 学 术 文 体;而 recognize 虽具有正式语体倾向,但更加常见于日常 话语语境中。

  除了横向对比不同语域中的频数差异,COCA 语料库还可以纵向比较两个词汇的历时变化,从发 展的角度区分两个词汇(如表 2) 。

D57E7FE0-48FB-4c3b-8D09-4A19A3325295.png

  表 2 中显示了 identify 和 recognize 在不同年度 区间的词频分布 统 计 。结 果 显 示 identify 一 词 在 1990—2014 年间的使用频率不断上升,尤其是在 2000—2014 年之间 。但在 2015—2019 年间又有一 定程度的下降 。Recognize 一词在整个 1990—2019 年度间出现频次呈现出下降状态,但下降程度并不 明显,基 本 保 持 稳 定 。 由 此 可 见,recognize 比 identify 在历史发展上更加稳定,非正式文体词汇的 稳定性要高于正式文体词汇 。但是两个词汇存在明显的频数增长差异,identify 的使用总体呈现增长趋势,而 recognize 的使用呈现负增长的趋势,所以 identify 一词代表的语境越来越受到重视。

  ( 二)搭配对比研究

  词语搭配即将前后两个词语组合得当,更好地 表达话语语义,并且词汇搭配之间存在一定的语义 关系 。在语料库中的词语搭配研究主要通过 COCA 语料库中的“搭配”功能展开 。通过设定合适的跨 距,检测同义词的搭配词并通过 MI 值( 即相互信息 值,MI 值越大搭配频次越高)进行排序,由此得到搭配词结果,并进行分析。

  现根据 COCA 语料库对近义词 identify 和 recognize 的搭配词进行检索,以右一为跨距检测搭配词、 搭配频率及 MI 值 。在此只截取两个同义词的搭配 词的 MI 值前 20 位为研究对象,按照 MI 值由大到 小排序分析 。在此只截取两个同义词的搭配词的MI 值前 20 位为研究对象,按照 MI 值由大到小排序依次为:at -risk , high -risk , evidencebased , gaps ,yourselves , themselves , predictors , weaknesses , theft , potential , strengths , specific , trends , patterns , yourself, themes , factors , barriers , genes , suspects。从词 性来看,与 identify 搭配最高的 20 个词之中有 5 个 形容词、3 个 人 称 代 词 和 13 个 名 词,由 此 可 见, identify 后接的多是形容词和名词。

  在同样的设置下对 recognize 进行检索,得到的按照 MI 值大小进行排序,得到的按照前 20 个词按MI 值大小进行排序的前 20 个词分别是 same-sex ,Israel , outstanding , faces , patterns , signs , symptoms , that , him , objects , themselves , ourselves , myself, gay , anybody , familiar, them , anyone , me , these。 同样从词性上来分析与 recognize 搭配的前 20 个词 之中有 3 个形容词、10 个代词和 7 个名词,由此可 以发现,在 recognize 搭配的最多的是代词或者人称代词,其次为名词。

  从 identify 和 recognize 的搭配词结果对比来看, identify 的搭配词词性较为固定,大部分存在于名 词、形容词和代词 。但是 identify 更多的与名词搭 配 。用于“识别”事物,趋势等,但 recognize 多与人 称代词搭配,用于“识别”人与人的特性,并且从人 称代词的使用可以发现 recognize 适用于日常生活 情况,而 identify 多用于科学研究的正式文体中的客 观描述。

  ( 三)语义韵对比研究

  在语料库语言学的发展中,通过语料库对大量 实际使用中的语言观察发现,词与词的搭配有一定 的语义规律,有些词会习惯性地与另一些具有相同 或相似语义特征的词语搭配运用 。Sinclair 提出语 义韵的概念,他认为语义韵是指某一次会经常性反 复与一些词语搭配使用,从而感染上那些词的语义 特征,形成了语境中的一种特殊的语义氛围[2] 。词 汇通过搭配形成了语境中的一种特殊的联想意义。 Stubbs(1996) 将语义韵划分为积极韵、中性韵和消 极韵[3] 。在积极语义韵里,节点词总是与带有积极 语义特点的词搭配使用,使整个语境充着浓厚的积 极语义氛围 。在消极语义韵中,语义韵的情况正好 相反,与节点词搭配使用的基本都是一些带有消极 语义特征的词,这个语境会染上一层消极的语义气 氛,在中性语义韵中,节点词既会与带有积极语义特 征的词频繁搭配,也和带有消极语义特征的词高频 共现 。所以要研究同义词的语义韵就要从其搭配词 入手,综合搭配词的情感倾向,确定语义韵。

  在研究中,通过语料库的搭配检索功能,选取左 一右一为跨距且 MI 值大于 3 的搭配词进行检索,得 到 identify 的前 10 个搭配词:to , can , themselves , help , students , yourself, potential , specific , areas , himself。根据检索结果可以发现,与 identify 搭配的 次数最多的是介词 to , 且搭配词中表示人称和身份 的名词及代词占比最多,其他搭配的形容词也不具 有强烈的感情色彩,因此可以总结 identify 具有中性 韵 。运用同样的方法对 recognize 进行检索得到的前 10 个搭配词为:not , must , Israel , immediately ,hardly , fully , same-sex , barely , instantly , faces。在这十个搭配词中可以发现,recognize 的搭配词中出现了许多具有强烈感情色彩的形容词,如 Israel , immediately , hardly , fully 等 。这些具有强烈负面感情 色彩的形容词,表明 recognize 一词具有消极韵。

  ( 四)研究结果与分析

  通过 COCA 语料库的研究,可以发现对 identify和 recognize 这组同义词的异同体现在以下几点。 首先,单词 identify 主要用于学术文章等正式文体的 写作,identify 搭配多是形容词与名词,在语义韵中 属于中性韵,不具有特殊的感情色彩 。其次,单词 recognize 更多用于日常生活中,多搭配代词或人称 代词,但 是 recognize 属 于 消 极 韵,具 有 负 面 感 情 色彩。

  所以对二语学习者的使用而言,identify 更加适 用于正式的写作应用之中,如研究结果的发现和社 会身份的认同,中性的语义韵使得表达显得客观、理 性 。对 recognize 的使用更加日常,多表达为识别出 人或物的含义或者认识到什么问题,具有明显的负 面情感倾向。

  三、结论

  文章基于 COCA 语料库对 identify 和 recognize 两个词汇从语域、搭配和语义韵三个层面进行了同 义词辨析 。研究结果表明语料库对同义词的辨析与 教学都具有很好的辅助作用,为英语教学中出现的 同义词辨析难题提供客观、全面的分析,能够培养学 生自主学习的能力与意识 。对英语习得者来说,语 料库功能可以帮助提高英语学习效度,有助于培养 他们在词汇搭配、语言语境、语义韵等方面的意识。 本研究仅仅使用 COCA 语料库对作为例子的同义词 进行辨析研究,在研究范围和深度上都具有一定局 限性 。语料库对英语教学和科研越来越重要,语料 库的发展和运用实践也一定能帮助语言学习者进行 效度的语言习得。


参考文献

  [1] Halliday M A K. The Linguistic Sciences and Language Teaching: The Users and Uses of Language [ M] . London: Longman , 1964.

  [2] Sinclair J. Beginning the Study of Lexis [ G] ∥C. Bazell , J. C atford , M. A. K. Halliday & R. Robins. In Memory of J. R. Firth. London: Longman , 1996.

  [3] Stubbs M. C orpus Evidence for Norms of Lexical C ollocation [ M ] . Oxford : Oxford University Press , 1996 : 176.