中外生物博士论文摘要语言复杂度对比分析论文

2024-06-14 13:52:38 来源: 作者:xuling
摘要:本文以生物类博士学位论文英文摘要为研究对象,选取中国博士学位论文摘要与英语本族语博士学位论文摘要各100篇建成小型语料库,从句法复杂度与词汇复杂度视角对两类博士论文摘要进行对比分析。结果表明:在句法层面,中国博士生较少使用结构较为复杂的长难句;在词汇层面,中国博士生较少使用高级动词,且倾向于使用相同词汇构建语篇。本文对学术英语写作教学的开展具有一定的启发意义。
[摘要]本文以生物类博士学位论文英文摘要为研究对象,选取中国博士学位论文摘要与英语本族语博士学位论文摘要各100篇建成小型语料库,从句法复杂度与词汇复杂度视角对两类博士论文摘要进行对比分析。结果表明:在句法层面,中国博士生较少使用结构较为复杂的长难句;在词汇层面,中国博士生较少使用高级动词,且倾向于使用相同词汇构建语篇。本文对学术英语写作教学的开展具有一定的启发意义。
[关键词]英文摘要,语料库,语言复杂度
1研究背景
学术论文是学术交流的重要形式之一。如今,学术交流的国际化趋势正对我国研究者的二语写作(Second Language Writing,L2 Writing)能力提出了挑战(韩萍等,2012)。然而,我国博士生的L2写作能力依然存在不足(郭强,2006)。针对这一现状,我国学者已从多个视角开展了关于L2写作的一系列研究。如Lu et al.(2019)通过分析中美博士论文摘要中词块使用的差异,从词汇角度揭示了中国博士生写作的局限性。Liu et al.(2022)从人际话语的视角,对比分析中美材料学博士论文摘要中的立场话语,以揭示中国博士生学术英语写作的独特特色。在这其中,近年来逐渐有学者聚焦于语言复杂度(linguistic complexity)视角开展L2写作的相关研究。
语言复杂度是“反映语言系统、语言特征内部组成及其相互关系”的概念(刘黎岗等,2018),可被定义为“组成语言特征或语言系统的离散成分的数量,以及不同成分之间的连接数量”(Bultéel al.,2012)。Bultéet al.(2012)基于语言的构成要素,运用“描述—分析”框架将语言复杂度划分为两个主要维度,即句法复杂度(syntactic complexity)和词汇复杂度(lexical complexity)。已有多项研究表明,语言复杂度为衡量L2写作水平的有效指标(刘黎岗等,2018),并已被多位学者引入L2写作研究中。例如,雷蕾(2017)运用十项句法复杂度指标,对中外硕博论文在句法复杂度方面的国别差异进行了深入研究。宋瑞梅等(2019)则对博士论文摘要中句法复杂度的国别与学科差异,以及这些因素之间的交互效应进行了深入考察。
作为学术话语体系不可或缺的要素,博士毕业论文代表了一种系统性的学术成果产出,加之学位论文非限时性写作的特点,其英文摘要在体现作者的科研能力和L2写作水平方面具有显著意义。因此,以英语本族语博士学位论文为参照对象,采用语言复杂度视角对中外博士毕业论文摘要进行对比分析,可以有效地揭示我国博士在L2写作方面存在的不足之处。
然而,过去的研究大多集中在单一的句法或词汇层面,且较少以理工科类论文文本为研究对象。在此背景下,本研究以生物领域博士毕业论文摘要为研究对象,构建中国博士论文与英语本族语博士论文两个语料库,从句法复杂度与词汇复杂度的角度,对国别差异进行深入对比研究,旨在进一步了解中国博士在L2写作方面的特点,从而为高校L2写作相关教学提供一定的参考。
2研究设计
2.1研究问题
本研究力求回答两个问题:
(1)中外博士学位论文摘要在语言复杂度方面的差异表现形式为何?
(2)导致语言复杂度差异的具体原因有哪些?
2.2语料来源
本研究所使用的数据来自自行构建的两个语料库,分别为中国生物学博士论文语料库(Corpus of Chinese PhD Students,简称CCP)与英语本族语生物学博士论文语料库(Corpus of English PhD Students,简称CEP)。CCP和CEP各自选取了100篇近5年的生物学科博士学位论文摘要,分别来自中国知网(CNKI)与ProQuest博士论文数据库。为了消除多余因素的影响,从而更准确地研究语言复杂度差异,CCP选择了来自中国生物学科建设水平较高的国内高校的毕业论文摘要,而CEP则选取了由英语母语者所写的文章摘要。CCP语料库的形符数为51518,而CEP语料库的形符数为51690,两个语料库的规模相近,具有可比性。
2.3研究工具与测量指标
本研究采用L2SCA(L2 Syntactic Complexity Analyzer)(Lu,2010)作为句法复杂度分析工具,采用LC A(Lexical Complexity Analyzer)(Lu,2012)作为词汇复杂度分析工具,采用TreeTagger作为文本标注工具,采用SPSS26.0作为数据处理工具。L2SCA与LCA自开发以来已被广泛应用于多项研究,具有较高的可信度。在测试标准方面,根据本研究的实际情况及可参考的前人研究,研究者从L2SCA提供的14项指标中选取了7项代表性指标测量句法复杂度,具体见表1。其中,子句定义为带有主语与限定动词的结构,T单位定义为包含有一个主句以及所有从句和非从句结构的不可分割的最小单位。对于词汇复杂度,研究者则基于前人相关研究及本研究实际状况,从LCA提供的25项指标中选取了7项进行检验,具体见表2。
2.4研究过程
笔者对CCP语料库与CEP语料库的句法复杂度进行对比分析。笔者将两类语料库分别导入L2SCA中,选取其中7项指标进行对比分析,将相关复杂度数据导入SPSS,进行独立T值检验,记录数据作为两类语料库差异性显著水平的参照进行对比分析。词汇复杂度的研究过程同句法复杂度类似。笔者使用LCA分别对两类语料库进行复杂度计算,并导入至SPSS中进行检验,记录数据并进行分析。
3结果与讨论
3.1句法复杂度对比分析
由表3可知,除并列句以外,中国博士生在其余各项指标中均低于本族语博士生,但仅有平均句子长度与平均T单位长度这两项指标存在显著的国别差异,所选其余指标的国别性差异均处在较低的显著性水平。
在对句子单位长度进行深入研究时,可以明显察觉到两类博士在子句运用上的相似之处相对较为显著。这种现象可能与平均子句长度与复杂名词性短语数量以及并列短语数量之间所呈现出的强烈正相关性有关(Lu,2011)。通常情况下,这种差异的根本在于句法维度上短语层面复杂性的体现(Norris et al.,2009)。然而,值得注意的是,本研究所选取的语料为生物学领域的学术论文摘要,这类文本因其高信息密度和复杂名词比例而具有独特的特征。由此推断,在平均子句长度的对比中,中外博士生之间并未呈现出明显的差异。这一特征也与语言发展已达到一定高级阶段的迹象相吻合,与博士生作为高级学习者的身份特质相互契合(Norris et al.,2009)。
经过深入分析平均句子长度和平均T单位长度这两个具有显著差异的指标,可以发现,中国博士生在撰写摘要时倾向于避免使用较长的句子结构,而更偏向于运用简明的句式来实现学术语篇功能。这种趋势可能表明中国博士生在其学术论文中倾向于使用准确、简洁的表达方式,以确保读者能够快速理解核心内容。此外,从平均T单位长度的角度来看,中国博士生在处理嵌套从句这类复杂句式时存在一定的困难,特别是在使用定语、同位语从句和形容词短语等“名词性成分”以及副词、名词性动词短语等“分句成分”时,其应用较为保守,这一现象与此前Biber et al.(2011)的研究结果相一致。结合前文所述平均句子长度的差异指标,这些数据均反映出中国博士生在复杂句法结构使用上存在一定的限制。考虑到生物学领域作为“硬学科”的特点,其强调实验方法和实验结果的精准描述,中外博士生在摘要中都倾向于使用简短的句子和并列结构,两者差异性较低。
综上所述,除差异性较大的平均句子长度与平均T单位长度之外,其他句法复杂度指标的国别差异较小,原因可能如下:第一,在学术研究国际化的大背景下,国内高校普遍将在国际高质量期刊上发表文章作为博士的学术评价标准与毕业要求,藉此引导博士生阅读英文文献并提升学术英语写作水平,帮助博士生更好地掌握国际性的学术话语。而这一过程中大量的学术阅读和写作训练会提高学习者对于词汇和句法结构的掌握能力(Mazgutova et al.,2015),进而提升产出语篇的复杂度。第二,考虑到学位论文摘要的重要性与非限时写作的特点,博士生能在高水平学者的指导下对摘要语言进行细致加工,以期符合国际学术惯例,这致使国别之间句法复杂度差异进一步减小。
3.2词汇复杂度对比分析
由表4可以看出,相较于句法层面较低的差异性,词汇层面显现出较为显著的国别差异。从用词复杂度来看,词语复杂度与动词复杂度这两项指标存在显著的国别差异(P<0.05)。由此可见,在复杂词汇的使用上,中国博士相较本族语博士较为欠缺。考虑到生物论文中大量存在的专有名词会影响整体词语复杂度指标,这一差异主要体现在动词复杂度方面。这意味着前者在表达意思时,可能会倾向于使用简单的动词,而不是更精确或更具体的动词。相比之下,后者在使用动词时可能会更具有多样性和准确性。
从词汇密度来看,中外博士存在的差异性处在较低水平,考虑到词汇密度与语篇的信息密度相关联,中外博士的论文摘要浓缩全文精华,均呈现出较高的信息密度,进而导致词汇密度差异性较低。学术写作的规范性与相对固定性也将这一差异进一步缩小。
对于词汇多样性这一维度而言,较高的差异性存在于Uber指标与动词变化度上。鉴于词汇多样性指标与复杂词汇的使用情况呈现强关联性(鲍贵,2011),Uber指标的较大差异反映出中国博士较少使用复杂词汇,倾向于运用相同词汇进行语篇构建。而考虑到对于动词曲折变化的应用要求使用者掌握英语动词的时态、语态、主动被动等结构,因此动词变化度的差异说明中国博士生在掌握英语语法结构方面存在一定的不足。此外,语言背景不同也会对动词使用造成影响,与英语不同,中文动词的形态变化相对较少,这也可能导致中国博士生对于动词变化的使用相对较少。
而形容词多样性与修饰语多样性在中外博士生中差异度较低,这可能是因为形容词与修饰语常用于突出描述对象的特点或属性,因而在学术共同体的制约下,其使用规范相对较为固定,作为高级学习者的博士生对其有清晰的认知,因此在形容词和修饰词的使用上差异较小。
4结语
本研究的两个主要发现如下:(1)在句法层面,中外博士学位论文摘要的复杂度在本研究所选的7项指标中表现出相似度较高的特征,差异主要体现在平均T单位长度和平均句子长度这两项指标上,其中中国博士的表现低于本族语博士。(2)在词汇层面,中外博士学位论文摘要的复杂度差异主要体现在词汇复杂度和词汇多样性这两个维度上,中国博士的表现明显低于本族语博士。
本次研究结果对相关高校的学术英语写作教学具有一定的启示。在句法层面,学术英语教师可以鼓励学习者增强句法多样性,更多地使用定语、同位语从句、形容词短语等句式,以提高平均T单位长度和文本信息密度,从而满足摘要的学术要求。在词汇层面,教师可以有针对性地加强学习者对动词及其变化形式的训练,以提高描述的准确性。此外,教师还可以鼓励学习者进行同义词替换,以提升他们的学术英语写作能力。
本研究存在一定的局限性。首先,本研究只针对博士学位论文,未将其他类型的学术文章纳入研究对象范围,如期刊文献等。其次,本研究仅关注于论文的摘要部分,并未对文献其余部分,如引言、结论等,进行分析。因此,未来的研究可以将文章类型等因素纳入研究范围,以增加研究结论的适用性和综合性。
参考文献
[1]BIBER D,GRAY B,POONPON K.Should we use characteristics of conversation to measure grammatical complexity in L2 writing development?[J].TESOL quarterly,2011,45(1):5-35.
[2]BULTÉB,HOUSENA.Defining and operationalizing L2 complexity[C]//HOUSEN A,KUIKEN F,VEDDER I,eds.Dimensions of L2 performance and proficiency:complexity,accuracy and fluency in SLA.Amsterdam:John Benjamins Publishing Company,2012:21-46.
[3]LIU Y,HU X,LIU J.A corpus-based study on Chinese and American students’rhetorical moves andstance features in dissertation abstracts[J].Frontiers in psychology,2022(13).
[4]LU X.Automatic analysis of syntactic complexity in second language writing[J].International journal of corpus linguistics,2010,15(4):474-496.
[5]LU X.A corpus‐based evaluation of syntactic complexity measures as indices of college-level ESL writers’language development[J].TESOL quarterly,2011,45(1):36-62.
[6]LU X.The relationship of lexical richness to the quality of ESL learners’oral narratives[J].The modern language journal,2012,96(2):190-208.
[7]LU X,DENG J.With the rapid development:a contrastive analysis of lexical bundles in dissertation abstracts by Chinese and L1 English doctoral students[J].Journal of English for academic purposes,2019,39:21-36.
[8]MAZGUTOVA D,KORMOS J.Syntactic and lexical development in an intensive English for academic purposes programme[J].Journal of second language writing,2015,29:3-15.
[9]NORRIS J M,ORTEGA L.Towards an organic approach to investigating CAF in instructed SLA:the case of complexity[J].Applied linguistics,2009,30(4):555-578.
[10]鲍贵.英语学习者词汇复杂度的最新测量及验证[J].山东外语教学,2011,32(6):44-52.
[11]郭强.论非英语专业博士生英语学术写作能力的培养[J].学位与研究生教育,2006(2):52-55.
[12]韩萍,侯丽娟.从体裁分析角度探索研究生学术英语写作能力培养[J].外语界,2012(6):74-80.
[13]雷蕾.中国英语学习者学术写作句法复杂度研究[J].解放军外国语学院学报,2017,40(5):1-10.
[14]刘黎岗,缪海涛.语言复杂度的理论与测量[J].外语研究,2018(1):52-55.
[15]宋瑞梅,汪火焰.中国博士学位论文摘要句法复杂度研究[J].解放军外国语学院学报,2019(1):84-91.
