学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 英语论文 基于Cite Space的国内语料库文体学研究可视化分析论文

基于Cite Space的国内语料库文体学研究可视化分析论文

11

2024-09-27 16:24:26    来源:    作者:liziwei

摘要:本文使用CiteSpace对中国知网核心期刊和CSSCI中收录的语料库文体学论文进行可视化分析,发现21世纪以来,语料库文体学研究受关注程度一般,发文量少,且正处于从高峰下降后的恢复期;研究者间的合作明显强于研究机构之间的合作;研究热点主要是文学作品的情节、叙事、作品翻译及译者风格、文体的认知研究等。

  [摘要]本文使用CiteSpace对中国知网核心期刊和CSSCI中收录的语料库文体学论文进行可视化分析,发现21世纪以来,语料库文体学研究受关注程度一般,发文量少,且正处于从高峰下降后的恢复期;研究者间的合作明显强于研究机构之间的合作;研究热点主要是文学作品的情节、叙事、作品翻译及译者风格、文体的认知研究等。

  [关键词]CiteSpace;语料库文体学;中国知网;可视化分析

  1研究背景

  文体学作为一个传统学科,历史久远,可追溯到亚里士多德时期的修辞学。但随着计算机应用技术和语料库语言学的发展,文体学也有了新的拓展,语料库文体学由此产生。借用语料库的定量研究手段,语料库文体学把传统文体学的定性研究推入更深的层次,也开辟了新的研究领域。

  进入21世纪,国外语料库文体学研究产出了许多优秀成果,如Semino et al.(2004)的Corpus Stylistics、McIntyre et al.(2019)的Corpus Stylistics:Theory and Practice。那么,国内关于语料库文体学的研究又有哪些成果,其研究特点、研究热点及演进又是怎样的?本文基于中国知网核心期刊和CSSCI的数据以及CiteSpace可视化分析,对此进行梳理,为今后该领域研究提供参考。

  2数据收集与研究方法

  本文的数据来源为中国知网。具体检索过程如下:在知网网站(旧版)点击“期刊”进入检索页,选择高级检索,以“语料库文体学”为检索关键词,检索条件选择“主题或篇关摘”,文献期限确定为2000—2023年(数据采集日为2023年10月13日),共23年10个月。期刊来源选择“核心期刊”和CSSCI,以期提高待分析文献的质量,更好地展现语料库文体学研究的热点问题和研究动向。数据检索后剔除重复收录和新闻通知等无关文献,最终获得有效文献共69条。

  笔者采用可视化分析法,利用软件CiteSpace(6.2.4 64-bit)对所收集的论文相关信息进行计算分析,通过聚类和分布挖掘,最后把结果施以可视化操作,从而得到语料库文体学研究的现状、热点以及发展动态。CiteSpace的原理是通过对文献的共引分析,利用寻径网络等算法,对一定条件下收集的相关文献进行统计分析(袁琳等,2018),通过可视化图表直观地展现一个学科或知识域在一定时期内的发展趋势与动向,展示若干前沿研究领域的研究历程(陈超美,2009)。

  笔者将作者、机构和关键词作为可视化分析的节点,时间跨度设定为2000—2023年(截止日期为数据采集日),时间切片选择默认设置1,筛选标准选择Top N(数值设定为50),在图谱剪裁设置中勾选寻径模式(Pathfinder),参数包括pruning sliced networks和pruning the merged networks,以期使图谱更为简洁明了,从而展现该领域研究的相关信息。

  3语料库文体学研究的科学知识图谱可视化分析

  3.1研究现状

  图1(源自中国知网)展示了21世纪以来有关语料库文体学研究的论文在核心期刊和CSSCI中的发刊数量及其走向。简而言之,语料库文体学研究论文数量并不算多,发文数量经历了一个由个位数增长到高峰并迅速回落的过程。21世纪初,在长达九年时间,仅有2篇论文得以发表。之后的五年迎来了论文的高发期,并于2014年达到了最高点(9篇)。随后发文量又下挫到年均发文4、5篇的水平,且持续了四、五年。从2019年至今,该领域论文在核心期刊和CSSCI中的发文量正处于缓慢回升中。这说明语料库文体学研究在语言学界还有一定的持续关注度。

image.png

  CiteSpace分析结果显示,语料库文体学研究的作者节点数为90个,合作关系连线59条。图2展示了其中发文量排名前十的作者及其合作关系,此时节点标签参数阈值(by citation)设定为2。根据CiteSpace的工作原理,节点和姓名标签的大小代表研究者发文数量的多寡;节点和标签越大,发文量越大,反之亦然。仔细观察可见,节点和姓名标签最大是黄立波(发文6篇);次之为申丹、王峰、刘世生以及雷茜(均为3篇);再次之为俞东明、肖忠华等五人(均为2篇)。此外,图谱中连线则表明研究者之间的合作关系,连线的粗细也与合作关系的强弱成正比关系。图2显示,语料库文体学研究中,学者们有一定的合作关系,发文量排名前十的作者仅刘世生和宋成万合作2次,其他合作均为1次。

image.png

  CiteSpace的分析结果说明,研究机构节点数为76个,合作关系连线27条。笔者同样把节点标签参数阈值(by citation)设定为2,获得图3。图3显示,发文数量前十的机构中,西安外国语大学英文学院节点最大,发文数量最高(5篇),和其他研究机构也有一定的合作关系。节点仅次于它的是同济大学外国语学院,发文数量为4篇,其与其他研究机构的合作关系也较为密切。节点更小的是西安外国语大学和浙江工商大学外国语学院,发文数量均为3篇。布鲁塞尔自由大学应用语言学系等其他六所高校发文量数量相同,均为2篇。节点大小和连线粗细均显示没有形成研究阵地或研究中心。

image.png

  3.2研究热点

  在CiteSpace分析中,研究热点的获取主要通过提取关键词来实现(李杰等,2017:127),具体而言,通过对出现于某一研究领域的相关文献中的关键词项的词频进行提取与统计,并形成知识图谱,从而确定该领域的研究热点。关键词的提取来源包括论文题目、摘要、作者关键词和补充关键词(李杰等,2017:204)。

  笔者在进行语料库文体学研究热点分析时,CiteSpace的参数设置大体相同,获得节点152个、连线260条。节点和标签字体越大,说明该关键词出现的频次越高,研究热度也越高。

  在关键词图示化中,节点标签参数阈值(by frequency)设定为2,获得图4。由软件分析报告得知,语料库文体学研究中关键词频次在2及以上的共有19个。其中,文体学和语料库均为13次,随后的是翻译批评(4次)、译者风格(3次)、词簇(3次),其他14个关键词频次为2。由图4可见,首先,研究中的高频关键词主要围绕语料库和文体学形成了两个节点群,体现了该领域的侧重点(或方法,或对象),也契合其名称。其次,形成了以翻译批评(4次)和译者风格(3次)为中心的两个次节点群,这说明语料库文体学领域的一个研究重点是文学作品翻译的风格。最后,第三个次节点群围绕词簇形成,这说明从词汇角度研究文学作品也是该领域的重点。以上关键词是语料库文体学研究论文核心内容与主题的高度提炼,由这些关键词出现的频次变化可看出语料库文体学研究的热点和主题(庄少霜,2016)。

image.png

  笔者在现有关键词及其共现关系和强度的基础上进行聚类,把聚类参数“set the smallest size of a cluster to show”设定为默认值5,共获得八个聚类,如图5所示。图5再次印证,语料库文体学研究主要是通过语料库方法来讨论文学作品文本及其翻译,其重点包括文体学研究的方法论述介、文学作品的情节发展、时空叙事、文学作品的翻译风格、文体的认知研究等。本文对以上热点做一个简单介绍。

image.png

  (1)文体学研究的方法论述介。关键词聚类0和1均包含十几篇文章,其中1号聚类中的6篇和0号聚类中的4篇文章是关于文体学研究的语料库方法的述介或综述文章。4号和5号聚类各2篇文章也是述介或综述文章。比如诸葛晓初等(2022)关于国外语料库文体学研究的回顾与前瞻。

  (2)文学作品的情节发展。比如,申丹(2013)认为在文学叙事研究中,不仅要关注叙事情节,更要关注叙事进程;而且叙事进程还具有显性和隐性的双重性质,其中隐性过程易被研究者忽略;因此,她提出“整体细读”的研究方法。

  (3)文学作品的时空叙事。张立柱(2023)认为,残雪的小说具有独特的模糊化时空叙事特点,这给作品的翻译带来不小的挑战;作者也通过语料库对残雪小说的不同译文文本进行认知分析,尝试从认知方面来解释译者对文体的选择及其叙事效果。

  (4)文学作品的翻译风格。杨子(2016)基于构式的理念进行语料库检索,并提出三种构式观下的文学译本复现模式,从而区分原文本与翻译文本,进而为语料库翻译学中译者风格研究提供了新的研究模式。

  (5)文体的认知研究。文体方面的认知研究主要涉及凸显和隐喻。宋来全等(2018)通过语料库讨论了合同英语中隐喻的文体功能,发现其分布上的“失衡”态势,并认为这与交际情景语境相关,体现出合同双方在编解码过程中的转喻策略,主要起图像凸显文本风格的功能。

  3.3研究热点的演化

  基于关键词的可视化分析,除了可以进行研究热点的讨论,还可以通过其他计算方式来探讨研究热点的演进路线,常用的有突现关键词图谱和关键词时间线图谱。

  根据突现关键词图谱(图6)可以看出,21世纪的前九年,语料库文体学的研究较为分散,无集中的研究热点。在2009年,“文体学”“文学语篇”突现而出,说明研究热点集中在文本体裁和文学作品的语篇分析上;关键词“文体学”突现强度最大,持续时间长,说明对文体本身的研究是该领域当时的热点。2010年“译者文体”和2011年“翻译”的突现,说明对文学作品翻译所体现出的译者风格的研究开始成为该领域的热门话题,并一直延续到2013年;翻译风格研究在暂停两年后再次从2016年起成为研究热点,并延至2020年。2014年突现的“词簇”“主题词”说明,从词汇入手探讨文学作品的主题也曾是语料库文体学研究的热点;而2019年突现并持续至2023年的“语言特征”进一步佐证了从语言本体研究文学作品的重要性和热门程度。近两年来,“时空叙事”成为语料库文体学研究的新热门。

image.png

  关键词时间线图谱也可以直观地显示语料库文体学研究热点的演变。由图7可以看出各重点关键词出现的时间节点、延续的年限以及与其他关键词的共现关系。除突现关键词图谱显示的“文体学”“语料库”等11个关键词外,其他非突现关键词也得以展示。比如,“情节发展”“尤利西斯”“凸显”这三个聚类中的关键词均为单次出现,作为研究对象并非热门所在。

image.png

  4结语

  本文使用CiteSpace软件对中国知网收录的有关语料库文体学研究的核心和CSSCI论文进行了可视化分析,从多方面展示了国内2000年至2023年该领域的研究现状、热点以及研究热点的演化过程。研究发现,2000年以来,语料库文体学的关注度在中期经过小高峰后,现正处于恢复阶段;单纯从核心期刊和CSSCI发文数量上看(总数少,年度最高为9篇),该领域受关注程度不高;研究热点包括文体学研究方法论推介和综述、文学作品的时空叙事、文学作品的翻译及译者风格、文体的认知研究等。这些热点如果从数量比例来看,有关文学作品翻译风格的文章占1/3、共23篇,可见其在语料库文体学研究中的重要地位。但纵观这些有关翻译(风格)的研究论文,仅杨子(2016)是从构式理念出发来讨论译者的风格,这应该可成为语料库文体翻译学研究的一个新重点。

    参考文献

  [1]MCINTYRE D,WALKER B.Corpus stylistics:theory and practice[M].Edinburgh:Edinburgh University Press,2019.

  [2]SEMINO E,SHORT M.Corpus stylistics:speech writing and thought presentation in a corpus of English writing[M].London:Routledge,2004.

  [3]陈超美.CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J].陈悦,侯剑华,梁永霞,译,情报学报,2009,28(3):401-421.

  [4]李杰,陈超美.CiteSpace:科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社,2017.

  [5]申丹.关于叙事“隐性进程”的思考[J].中国外语,2013(6):1+12.

  [6]宋来全,杨忠.合同英语中语法隐喻的文体功能研究[J].中国外语,2018(3):31-37.

  [7]杨子.翻译构式观与语料库翻译学下的译者风格研究[J].上海翻译,2016(3):28-33.

  [8]袁琳,孙敬姝,盖学敏.基于CiteSpace的物理演示实验可视化分析[J].物理实验,2018(1):33-38.

  [9]张立柱.残雪小说不同英译本时空叙事的认知文体研究[J].外语研究,2023(3):74-80.

  [10]诸葛晓初,吴世雄.国外语料库文学文体学研究:回顾与前瞻[J].外语学刊,2022(4):11-18.

  [11]庄少霜.近二十年国外认知语言学领域研究的可视化分析——基于CiteSpace II的计量分析[J].哈尔滨学院学报,2016(8):97-101.