学术论文投稿/征稿

欢迎您!请

登录 注册

手机学刊吧

学刊吧移动端二维码

微信关注

学刊吧微信公众号二维码
关于我们
首页 > 学术论文库 > 英语论文 基于ChatGPT的机器翻译译后编辑能力探索论文

基于ChatGPT的机器翻译译后编辑能力探索论文

15

2024-10-19 17:14:20    来源:    作者:liziwei

摘要:以ChatGPT为代表的新一代人工智能在机器翻译领域表现出的新特质对译后编辑工作提出了新的要求与挑战。本研究对机器翻译中不同领域文本特征、现有译后编辑相关研究的缺位与错位进行探索分析,提出ChatGPT对译后编辑者的能力新需求,并基于此在基础、语言、实现的能力层面上构建一种新译后编辑能力模型,为新时代译后编辑者的培养提供参考。

  [摘要]以ChatGPT为代表的新一代人工智能在机器翻译领域表现出的新特质对译后编辑工作提出了新的要求与挑战。本研究对机器翻译中不同领域文本特征、现有译后编辑相关研究的缺位与错位进行探索分析,提出ChatGPT对译后编辑者的能力新需求,并基于此在基础、语言、实现的能力层面上构建一种新译后编辑能力模型,为新时代译后编辑者的培养提供参考。

  [关键词]机器翻译;ChatGPT;译后编辑;译后编辑能力

  在国际间交流合作日益频繁,翻译需求与日俱增的新时代背景下,机器翻译因其高效性成为近年来翻译领域研究的热点,同时机器翻译译后编辑(Post-editing of Machine Translation,MTPE)也在不断发展,以期通过人工干涉机器译文以达到应用目的。以ChatGPT为代表的生成式预训练Transformer模型表现出的崭新翻译能力为译后编辑者的工作提供了新的条件,也对其译后编辑能力提出了新的挑战与要求。如何针对性地对自身核心素养进行调整和培养,如何利用新的生产工具更高效地完成翻译工作,成为未来译者面临的核心问题之一。

  本文基于以往研究,分析了ChatGPT人工智能翻译新特征与文本特征,提出了一种新的译后编辑能力构型,以期为译后编辑能力研究及实践拓展新的思路和方法。

  1译后编辑及译后编辑能力

  1.1译后编辑

  ISO 18587:2017 EN将机器翻译定义为“使用计算机程序将一个自然语言的文本自动翻译为另一个自然语言的文本”,且机器翻译经历了基于词典和规则库、统计、实例、知识到神经机译的发展阶段。本文将机器翻译译后编辑界定为根据一定的目的对机器翻译的原始产出进行加工和修改的过程,包括更改翻译(语言)错误、提高机译产出的准确性与可读性等(冯全功等,2016)。译后编辑分为内向型翻译途径和外向型翻译途径。崔启亮(2014)从译后编辑产业化的角度,提出了“狭义的译后编辑”与“广义的译后编辑”,前者指直接对机器翻译译文进行译后编辑,后者则是对集成翻译环境输出的初始译文的译后编辑。

  1.2译后编辑能力

  国外对译后编辑能力的研究起步较早,如Rico et al.(2012)将译后编辑所需能力分为语言能力、工具能力和核心能力;语言能力由两种及以上语言能力、跨文化交际能力、主题领域知识等组成;工具能力由机器翻译知识、术语管理能力、基础编程能力、机翻词库维护能力、语料库质量评估能力、受控语言译前编辑能力构成;核心能力由策略能力、态度与生理/心理能力构成。

  国内较早关注译后编辑能力研究的学者冯全功等(2018)认为译后编辑能力指根据一定目的与要求对机器翻译的原始产出进行加工与修改所需的知识体系与认知素养,并由此提出译后编辑能力三维模型,即将译后编辑能力分为认知维度、知识维度、技能维度。认知维度包括态度与信任、问题解决与决策行为、信息加工与逻辑推理等子能力;知识维度包括与翻译能力共享的知识和特殊知识;技能维度涵盖翻译、编辑、信息检索等多种技能。从机器翻译发展的角度来看,在译者能力范畴内,“翻译能力”与“译后编辑能力”之间交互影响,译后编辑能力结构融合翻译能力和翻译修改能力模型中的系列子能力,在译者能力范畴中逐渐表现出中心化趋势,成为机器翻译时代译者需要掌握的新型文本加工能力(杨艳霞等,2023)。翻译能力是译者完成某项翻译工作任务或项目所需的潜在知识系统与技能系统,其能力架构与已有的译后编辑能力架构部分重合。

  译后编辑的基本原则可以概括为用最少的编辑量和可理解的语言使机器译文具有正确的意义;而人工翻译的本质是一种以语言文字或多模态介质为载体的多元转化,是将源语文本从各层次上彻底转化为目标语言文本并成为目标语语境组成部分的活动。两者之间对产出结果的不同要求使作业人员在操作中所调动能力有所不同,并不能画等号。译后编辑围绕机器翻译开展,因此ChatGPT一类新机器翻译工具的出现必然会影响译后编辑模式。这是否对译后编辑能力提出了新要求,需要我们结合ChatGPT特点进行思考。

  2 ChatGPT翻译特征分析

  2.1 ChatGPT技术原理

  2022年发布的聊天生成型预训练语言模型(Pre-trained Language Model,PLM)Chat GP T一经面世便受到了广泛关注。ChatGPT是在谷歌提出的完全基于注意力的Transformer架构上建立的一种大型语言模型,利用大规模未标注数据进行训练后便显出了明显的涌现能力。同时,OpenAI在其训练建立中创新性地引入了指令微调与基于人类反馈强化学习两项关键技术,使其同其他大语言模型相比,具有更加强大的理解人类用户和偏好的能力,既可以根据指令生成高质量的回复,也可以针对不恰当的输入拒绝回答,甚至更正对话中的错误,具有超乎寻常的理解与会话能力(武俊宏等,2023),在整体上表现出强交互性、强理解性、强通用能力三大特点。

  ChatGPT的理解能力优势在于对于文本的深度识别理解,能够保持对文本上下文的历史感知以维持对话的连贯性与一致性,并且可以对用户提出的事实性、解释性、建议性问题进行直接的信息调动与答案呈现。另一优势能力即会话能力,表现为能够在对话过程中进行历史管理以维持历史对话对模型输出的影响,同时可以通过多轮对话方式来逐层深入理解并解决复杂对话场景的问题。

image.png

  2.2机器翻译中不同领域文本特征及文本处理差异

  从知识领域的角度进行分类,翻译面向的文本可以分为自然科学文本、社会科学文本与人文科学文本三种。对译后编辑能力的探索,本质上是探索译者优化机译文本途径的过程,因而深入分析机器翻译对于不同文本的适应性与产出的不同类型文本的质量是必要的。

  自然科学是以自然客体与其衍生为研究对象的科学。自然科学文本在词汇上的特点主要是多用科技术语,具有严密性、简单性、单义性、系统性、名词性及灵活性六大特点;在句法层面上表现出句式复杂、逻辑嵌套的特点;在语篇层面上,则表现出较强的严密性、准确性、逻辑性等特点。在翻译过程中如何保留文本的以上特点是自然科学文本翻译的主要技术难点。

  社会科学指研究社会现象及其规律的科学,此类文本通常使用简明而抽象的概念与逻辑论述,在特定的语境下表现出高度的概括性,具有较强的语境依赖性,词汇使用与句法结构具有褒贬倾向、情感意图等内涵差异,携带着作者的表达意图,因而对语篇概念的处理与作者意图的表现成了文本翻译的主要难点。

  人文科学以人类的信仰、情感、道德和美感等为研究对象,其文本具有风格化与个性化的特质,部分内涵从文本中隐身,同其中人的主体性带来的矛盾性、模糊性和内隐性一同构成了处理人文科学文本的主要挑战。

  就目前来看,ChatGPT对自然科学文本的处理能力较强,仅需要人工的轻度介入便可以产出较高质量的译文;对社会科学文本的处理能力中等,需要人工的中度介入;而对人文科学文本的处理能力最差,需要人工的高度介入。

image.png

  2.3现有译后编辑能力模型与ChatGPT的错位与缺位

  译后编辑是文本、翻译机器、译者三个主体要素相互作用的结果。现有的研究中,对翻译机器或译者的研究居多,研究者往往将文本分析纳入译后编辑研究中,且缺乏译后编辑领域文本的研究视角。由于ChatGPT自然语言处理过程建立在对文本的强理解能力上,这种缺位表现得尤为明显。

  ChatGPT机器翻译能力有两个不足:首先,ChatGPT在高资源和中等资源背景下翻译能力较为突出,但是在低资源场景下显著不足;其次,ChatGPT在低资源语言翻译中出现了严重的“幻觉翻译”,即译文表述流畅,但语义与原文并不一致,属于无中生有的臆想(武俊宏等,2023)。ChatGPT在机器翻译中表现出的语言自然程度与流畅性是其主要优势。相关人工分析结果表明,ChatGPT倾向于生成较长文本片段,以更接近人类的语言习惯。同时,ChatGPT可以在高语言资源供应下形成对任意语言的高自然语言处理能力,其具有的强互动性使译者能对机译内容进行即时纠正并获得历时性反馈。

  ChatGPT依赖于机器学习算法,其内部数据处理过程对人类而言缺少透明度,指令输入到结果产出是一个黑箱。其模型搭建也是深度学xx资源语言的成果,在学习过程中可能产生偏差,进而影响机器翻译任务的实现,使产出文本在文化、伦理、意识形态等方面与预期存在偏差,并且在同一任务的不同时刻产出的文本也会有不同的语言特点。译者需要在译后编辑的过程中对机器的文本产出进行动态监测,关注在文化、伦理、意识形态等方面以及阶段语言特点上的变化。此类译者监测评估能力是已有的译后编辑能力模型中尚未提及的。

  ChatGPT具有的高交互性和高理解能力优势对译后编辑者也提出了新要求。为了更高效地产出文本,译者在进行译后编辑时,不仅需要根据机器翻译质量与文本类型调整译后编辑策略,还需要对模型在翻译过程中的表现进行修正,使产出的文本更符合当前的需要。这种需求表达与纠偏能力在现有的译后编辑能力模型中尚未出现。

  3基于ChatGPT的译后编辑能力模型

  3.1译后编辑能力的新模型建构

  (1)基础能力。基础能力主要包括生理与心理、态度与信任、认知与策略等子能力。生理与心理能力主要指向译后编辑者在完成译后编辑工作过程中必备的生理、心理基础。态度与信任指向译后编辑者对机器翻译保持正确积极的态度并予以信任。认知与策略指向译后编辑者需要具备对问题的认知能力,并且掌握针对问题进行策略性调整的个人素养。

  (2)语言能力。语言能力由源语与目的语能力、跨文化交际能力、文本与文化能力、目标领域知识能力等子能力构成。源语与目的语能力指向译后编辑者需要具备的最为基础的语言能力。跨文化交际能力指向译后编辑者能够熟练处理源语与目的语之间文化背景差异的能力。文本与文化能力指向译后编辑者具备的理解源语文本文化背景与在目的语文本中合理进行文化表达的能力。目标领域知识能力指向译后编辑者具有的对源语文本领域专业性知识的掌握。

  (3)实现能力。实现能力由机器翻译知识、译前译后编辑能力、工具操作能力等子能力构成。机器翻译知识指向译后编辑者需要具备的对机器翻译的整体认知。译前译后编辑能力指向译后编辑者需要具备的对文本的操作能力。工具操作能力是在人机共译观指导下产生的,将翻译机器作为译后编辑过程的另一主体,着重突出了译后编辑者对模型意识形态、伦理与文化倾向的动态监测与评估能力,以及译者需求表达与纠偏能力两种新能力。

  3.2操作实例

  本文以一个联合国文件的节选段落与原始机译文本为例。

  例1:It can be argued that the predominant economic analyses of labour and capital insufficiently trace the linkages between production systems in world economics and women’s work as producers and reproducers;nor is the subjection,exploitation,oppression and domination of women by men,sufficiently explained in history.

  译文1:可以提出这样的论点,主导的劳动力和资本经济分析不足以追踪世界经济中生产体系与妇女作为生产者和再生产者之间的联系;女性受到男性的统治、剥削、压迫和控制,在历史上也没有得到充分的解释。

  我们给ChatGPT输入以下指令:(1)增补句段的主语;(2)将predominant economic analyses of labour and capital的译文修改为“主流的劳动力与资本经济分析”;(3)不要漏译连词。在人工进行部分调整后,最终产出译文2。

  译文2:我们可以提出这样的论点,主流的劳动力和资本经济分析不足以追溯世界经济中生产制度与妇女作为生产者和再生产者之间的联系;同时,女性受到男性的征服、剥削、压迫和统治的问题,在历史上也没有得到充分的解释。

  对比译文1和译文2,可以看出,在指令给出后,ChatGPT对部分词汇进行了调整优化并对形式主语、连词等内容进行了修改。在后续的翻译中,ChatGPT可以延续上述命令的要求,避免人工重复干预。

  4.结语

  在人工智能迅速发展的当下,以ChatGPT为代表的通用人工智能模型异军突起,表现出了强大的机器翻译能力。然而,机器翻译能力的发展并不伴随着译者主体性的消解,反而需要我们重建译者的主体性,建构译者与机器二元统一的工具理性。译者应当顺应译后编辑趋向人机共译的历史潮流,主动参与到译后编辑产业变革的潮流中,力求自身能力与产业趋势融合发展,共同进步。

       参考文献:

  [1]RICO PÉREZ C,TORREJÓN E.Skills and profile of the new role of the translator as MT post-editor[J].Tradumàtica,2012(10):166-178.

  [2]崔启亮.论机器翻译的译后编辑[J].中国翻译,2014,35(6):68-73.

  [3]冯全功,崔启亮.译后编辑研究:焦点透析与发展趋势[J].上海翻译,2016(6):67-74+89+94.

  [4]冯全功,刘明.译后编辑能力三维模型构建[J].外语界,2018(3):55-61.

  [5]武俊宏,赵阳,宗成庆.ChatGPT能力分析与未来展望[EB/OL].(2023-09-22)[2023-10-20].

  [6]杨艳霞,魏向清.基于认知范畴观的机器翻译译后编辑能力解构与培养研究[J].外语教学,2023,44(1):90-96.