学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 英语论文 学术语篇中情态动词使用的多因素分析论文

学术语篇中情态动词使用的多因素分析论文

0

2026-05-16 16:45:50    来源:    作者:xuling

摘要:当前,学术语篇中情态动词的研究多集中于频率分布等描述性分析,而对于其使用动因的多因素交互机制,相关探讨仍显不足。

  [摘要]当前,学术语篇中情态动词的研究多集中于频率分布等描述性分析,而对于其使用动因的多因素交互机制,相关探讨仍显不足。为此,本研究基于大规模标注语料,采用多分类逻辑斯蒂回归模型进行多因素分析,系统揭示情态动词选择的复杂机制。研究发现:(1)学者群体更频繁地使用模糊限制语等低值情态表达;学科间也存在差异,如软学科显著多用高量值情态动词,而硬学科则多用低量值情态动词;(2)作者水平、主语特征、体态、语气、动词类型以及词汇复杂度等因素会显著影响不同量值情态动词的选择。

  [关键词]情态动词;多分类逻辑斯蒂回归;多因素分析

  1研究背景

  情态动词,作为形式与意义/功能的配对单位,一直是第二语言习得研究的核心关注点(Tyler,2022),在语言学研究中占有举足轻重的地位。这类动词不仅能改变句子的语义内涵,更是精确传递说话者态度和思想的关键语言媒介(Biber et al.,2021)。情态动词是构建学术语篇人际功能与主体间性的核心手段。Hyland(1996)指出,情态动词能作为模糊限制语通过降低命题确定性邀请读者参与对话,且有实证数据显示,高频使用情态动词的论文更易被同行接受。因此,深入分析学术语篇中情态动词的使用至关重要。

  近年来,学术语篇中情态动词的研究已在跨语言对比、学科差异及多维特征分析等方面取得显著进展。然而,现有成果多局限于单一视角,将多因素分析方法系统应用于情态动词使用机制的研究仍显不足。为此,本研究基于语料库语言学方法,融合定量与定性分析,旨在系统考察学术语篇中情态动词使用的多因素影响及其交互作用机制,以推动该领域研究的深化与拓展。

  2研究综述

  国内外学者在情态动词研究领域取得了丰硕的成果,研究范围涵盖不同学科的情态动词使用频数差异分析、不同二语作者的情态动词使用研究等。不同阶段的研究各有侧重,共同推动了情态动词研究的深入发展。

  在学术语篇研究方面,高霞(2020)的中西学术写作对比研究表明,中国学者在情态动词使用频率上显著低于西方学者,且软科学与硬科学之间存在明显的学科差异。李莹等(2024)对农科学术论文的考察进一步揭示,中国学者呈现出系统性的“低值情态偏好”特征。

  与此同时,多因素分析方法的应用为情态动词研究注入了新的活力。国外学者Flach et al.(2023)创新性地结合语料库分析与实验方法,构建了包含来源、动词类型、时态和搭配强度等多参数的解释模型。在英语通用语研究领域,Nie(2024)通过对VOICE语料库的多元分析,探究了动词语义特征、主语生命性、语法人称和说话者性别等变量对情态选择的预测效力。

  综上所述,国内外学者在情态动词的研究领域均取得了丰硕的成果,但用多因素分析方法来探讨学术语篇中情态动词使用情况的研究仍较为匮乏。因此,本研究选取MICUSP语料库和DEAP语料库中的学术文本,进行情态动词使用的多因素分析,系统考察学科差异、作者学术背景等因素对情态动词使用的影响,以丰富相关研究成果,并为学术写作教学与跨文化交际提供参考。

  3研究设计

  3.1研究问题

  本研究基于大规模语料库标注数据,采用定量研究方法,系统考察学术语篇中情态动词的使用特征与影响因素。本研究主要围绕以下两个问题展开:

  (1)情态动词量值的选择是否因作者学术背景及学科领域的不同而存在显著差异?

  (2)哪些语言特征对高、中、低量值情态动词的选择具有显著预测作用?

  3.2研究数据

  为探究学科与作者背景对情态动词量值选择的影响,本研究采用MICUSP与DEAP两个语料库。MICUSP收录多学科本科生与研究生优秀论文,数据丰富多样;DEAP则收录了核心期刊高被引文献,代表顶尖学者的写作水平。基于可行性与深度考量,本研究从DEAP中选取Art与Agri两个代表性子库作为数据来源。

  3.3研究方法

  参照Halliday(1994)的量值分类,本研究使用R语言4.4.3版本提取出所有包含高、中、低量值情态动词的语料,然后进行人工检查,共获得6376条语料用于分析。随后,本研究基于Deshors(2010)的标注框架,修订形成了涵盖语义、句法、词汇、文本特征四个方面共计19个变量的语言特征标注框架,旨在系统性地捕捉影响情态动词使用的多种因素。

  3.3.1频数使用差异分析

  首先,研究者基于语料库来源对语料进行学科分类。随后,研究者使用AntConc 4.3.1提取所有预设情态动词的原始频次。为消除语料库规模差异,原始频次被归一化为每十万词的标准化频数,以便后续分析。

  3.3.2多因素分析:逻辑斯蒂回归模型

  根据研究目的并结合本研究的数据类型,可知因变量为三个分类变量(即高、中、低值情态动词),因此研究者选取多分类逻辑斯蒂回归模型对数据进行拟合。建模步骤包括:首先,使用基于神经网络的nnet程序包拟合多分类逻辑斯蒂回归模型,并将低值情态动词设为因变量的参照水平;然后,将所有因素都输入模型,构建最大回归模型;最后,使用R语言中的step函数双向逐步选择,以获得最优最简模型。

  4研究发现

  4.1学术语篇中不同量值情态动词的使用情况

  不同量值的情态动词在学术语篇中扮演着至关重要的角色。参照Halliday(1994)对情态动词的量值分类,本文将11个情态动词分为高、中、低情态量值,分别统计每十万词的标准化频数,结果见表1。

  首先,具体到每个情态动词的具体频数,can、would、will、could、may的使用频数显著高于其他情态动词,说明中低量值情态动词占主导地位,这符合学术写作普遍倾向于谨慎、客观的惯例。这也与高霞(2020)关于中西作者学术论文中情态动词使用的研究结果一致,即中低值情态动词的使用频数显著更高。

  其次,学科间高、中、低值情态动词使用频数差异显著。低值情态动词使用频数最高,高值情态动词则显著偏低。这一分布符合系统功能语言学对情态系统的描述(Halliday,1994),即学术语篇倾向于使用表达可能性和能力的低值情态动词,而避免使用表达强制义务的高值情态动词,以维持论述的客观性与协商空间,如例1。而例2中ought to这一高值情态动词的运用典型地体现了软学科的话语实践:语言形式本身(如情态量值的选择)直接参与并强化了特定的价值判断与理论立场的构建,反映了该学科通过规范性论述而非描述性事实来界定概念的认识论传统。

  例1:Because of the functional correspondence to module,the importance of each module may be varied depending on the functional importance.(MICUSP,GD,HS)

  例2:That is to say that the pinnacle of art and aesthetics is found in sanctity;thus,the pursuit of art ought to be integral to sanctity...(ArtDEAP,SCH,SS)

  就学科差异而言,软学科中情态动词的总体使用频数高于硬学科,尤其在本科生使用中频词时差异最为显著。Smirnova et al.(2025)通过量化分析学术文本中立场表达的形式特征(如情态动词、补语从句等),也发现软学科中情态动词的使用频数高于硬学科。

  从身份维度看,数据呈现出清晰的学术社会化轨迹。与学者相比,本科生群体在所有情态类别中均表现出更高的使用频数,该趋势在软学科的中频词中最为显著。相比之下,学者群体在中、高值情态动词的使用上显著收敛,尤其在“硬学科—高值情态动词”语境中频数最低(15),体现出学者对学科话语规范的熟练掌握与对学术客观性的修辞遵从。研究生则呈现出过渡性特征,其使用模式介于本科生与学者之间,这暗示其处于学术社会化过程中的中间状态。这与王晶晶等(2019)的发现相呼应,他们的研究亦表明,相较于成熟学者,博士研究生在学术写作中更多地使用情态动词等模糊限制语。

  综上所述,情态动词的使用不仅是语法层面的选择,更是学术社群成员在特定认识论与文化语境中构建身份、传递立场与遵守规范的重要话语策略。

  4.2学术语篇中情态动词使用的多因素分析结果

  本研究以低值情态动词为因变量的参照水平,通过逐步选择,最后获得了包含14个自变量的最优最简模型:ModV.ref~Level+DiscG+TextPos+Neg+SubjNum+SubjPer+SubjAnim+SubjMor+SubjGen+Aspect+Mood+VerbType+TTR+MWL。方差膨胀因子(VIF)检验结果显示,各变量的VIF值均低于10,表明模型不存在严重的多重共线性问题。随后,研究者计算该模型各变量的显著水平,得到表2。

  由表2中的统计结果可知,作者水平(Level)、主语特征(SubjNum、SubjPer、SubjAnim、Subj Mor、Subj Gen)、体态(Aspect)、语气(Mood)、动词类型(VerbType)以及词汇复杂度(MWL)等因素对不同量值情态动词的选择均呈现出显著而系统的影响(p<0.001),这一发现与Biber et al.(1999)关于语言特征共现模式的研究相吻合,印证了情态表达受到多层次语言因素制约的理论观点。

  研究发现,作者水平及句法语义特征(如否定、单数主语、体态、无生主语、虚拟语气、及物动词与词汇复杂度)均是影响高低量值情态动词选择的关键因素,其中后四项因素(p<0.001)的作用尤为具有决定性。下文通过两则实例,具体展示高量值情态动词与及物动词的典型搭配及其在高复杂度语境中的应用。

  例3:Agents must balance the increased payoffof getting in to the better school against the increased risk of not getting in to college at all.(MICUSP,GD,HS)

  例4:Juvenile survival primarily depends on surviving through the winter,but juveniles must have access to an appropriate forest habitat for food and food storage in order to achieve this.(MICUSP,GD,SS)

  如例3所示,高量值情态动词因表达极高的确定性或强制性,通常用于需要明确表达义务、必然性或极有可能性的场景。使用高值情态动词能表明作者对后述命题的坚定程度,增强提议的效力,以及帮助作者扩大影响力(于晖等,2023)。从及物性系统角度看,当这些动词后接表示动作或关系的谓语时,它们能有效地强化命题的力度。

  而词汇复杂度是学术语篇专业性的核心体现。本文的发现有力地印证了Hyland(2005)关于学术立场的观点,如例4通过协同使用复杂词汇和高量值情态,构建出一个确定、可信的专业学术表达,既能体现作者对研究结论的信心,又符合学术对话的谦逊传统。

  从中低量值情态动词的对比来看,中量值情态动词的使用受到更多语言及非语言因素的复杂影响,除句法语义特征外,作者背景、学科类型等均作用显著。下文聚焦于无生主语与主语形态这两个关键变量,通过实例阐释其如何影响情态动词的分布与选择。

  例5:One study tested whether sports metaphors would affect how students responded to an argument about whether their university should require a senior thesis project.(ArtDEAP,SCH,SS)

  例6:We should nevertheless point out that the increased level of detail introduced by our spatially explicit method does not necessarily result in an improved degree of accuracy of the analysis at the local level.(AgriDEAP,SCH,HS)

  在学术、科技等正式语篇中,无生主语本身不具备意愿或执行能力,而使用无生主语的目的是隐藏主观施动者,突显客观事实与推理过程,从而构建文本的客观性与权威性。如例5所示,作者常在无生主语后使用would等中值情态动词来缓和论断,为命题留出商讨空间。

  例6中,中值情态动词(如should、would)因其语气委婉,常被用于表达礼貌、建议或协商,这在对话性语体中尤为常见。代词主语(特别是you、we)恰恰是构建对话参与感和直接互动的关键。正是基于这一共性,代词主语与中值情态动词的共现,是构建平等、礼貌、互动的人际关系的自然语言选择。

  通过模型比较,本研究还发现了一些系统性差异。作者学术背景为本科时,对中量值情态动词的影响强度明显高于对高量值情态动词的影响强度,这反映了不同水平作者在情态表达策略上的差异,如Biber et al.(2009)通过语料库对比揭示,本科生论文中中量值情态动词的使用频率明显高于专家作者,而专家作者更倾向使用低量值情态以增强论述的严谨性。同时,主语人称、代词主语和泛指性等特征仅对中量值情态动词产生显著影响,这进一步支持了Halliday(1994)在系统功能语言学中关于情态选择与主语指称特性之间存在密切关联的理论假设。

  5结语

  总体而言,本研究通过建立多分类逻辑斯蒂回归模型,揭示了不同量值情态动词选择背后复杂的多因素作用机制。研究结果不仅验证了情态表达受作者水平及句法语义特征等多重因素制约的理论观点,更为理解不同量值情态动词在自然语言中的分布规律提供了坚实的实证基础。这些发现对情态理论建构、语言习得研究以及学术写作教学均具有重要的启示意义,也为后续基于语料库的情态研究提供了可资借鉴的方法论路径。

参考文献

  [1]BIBER D,CONRAD S.Register,genre,and style[M].Cambridge:Cambridge University Press,2009.

  [2]BIBER D,JOHANSSON S,LEECH G,et al.Longman grammar of spoken and written English[M].Harlow:Pearson Education,1999.

  [3]BIBER D,JOHANSSON S,LEECH G,et al.Grammar of spoken and written English[M].Amsterdam:John Benjamins,2021.

  [4]DESHORS S C.A multifactorial study of the uses of may and can in French-English interlanguage[D].Sussex:University of Sussex,2010.

  [5]FLACH S,CAPPELLE B,HILPERT M.You must/have to choose:experimenting with choices between near-synonymous modals[C]//Models of modals:from pragmatics and corpus linguistics to machine learning.Berlin:De Gruyter Mouton,2023:149-176.

  [6]HALLIDAY M A K.An introduction to functional grammar[M].Beijing:Foreign Language Teaching&Research Press,1994.

  [7]HYLAND K.Writing without conviction?Hedging in science research articles[J].Applied linguistics,1996,17(4):433-454.

  [8]HYLAND K.Stance and engagement:a model of interaction in academic discourse[J].Discourse studies,2005,7(2):173-192.

  [9]NIE C.Exploring variation in English as a lingua franca:multivariate analysis of modal verbs of obligation and necessity in the VOICE corpus[J].ICAME journal,2024,48(1):49-65.

  [10]SMIRNOVA A E,GUERRA P J.Do formal stance strategies reveal disciplinary variation in professional scientific writing?[J].International journal of applied linguistics,2025,35(3):1242-1261.

  [11]TYLER A.Cognitive linguistics and second language learning:theoretical basics and experimental evidence(2nd ed.)[M].New York:Routledge,2022.

  [12]高霞.基于中西学者学术论文可比语料库的情态动词研究[J].解放军外国语学院学报,2020,43(5):1-9+127+159.

  [13]李莹,刘萍.基于CQPweb的英汉母语者农科英语论文中情态动词使用的差异研究[J].现代英语,2024(13):65-68.

  [14]王晶晶,姜峰.中国理工科博士生学术论文写作立场建构研究[J].外语界,2019(3):23-31.

  [15]于晖,王乐.功能视角下不同范式学术语篇元话语对比研究——以模糊语与加强词为例[J].当代修辞学,2023(1):30-41.