Trados 2014和MemoQ 2013在翻译记忆库中的测试效果分析--以ECCO春夏季产品新闻稿为例

VIP免费
3.0 侯斌 2024-11-19 4 4 3.89MB 106 页 15积分
侵权投诉
ii
摘要
随着电脑科学技术的进步与发展,计算机辅助软件在各个领域各行业发挥着举足轻
重的地位,如计算机辅助设计(CAD)、工程CAE计算
CAM)在机电机械、造船、航空航天、土木建筑、汽车制造等各个领域中得到了广
泛的应用。在翻译行业,计算机辅助翻译软(即 CAT)已经越越受到译行业
士的注意,它的出现不仅使人们获取资讯更加方便快捷,同时也方便译者提高效率,减
少重复劳动,也使得译文的整体行文风格趋近统一。因此对软件的合理利用则显得很有
必要。针对不同行业、不同特点的文稿需要更加灵活的软件来给予帮助,这要求机辅翻
译软件需要更加专业化、定制化,从专业化的道路逐步开放至多种不同类型的文本辅助
翻译,让机辅翻译更加智能,对出现过的类似文本能够最大限度地智能匹配,节省译者
的时间成本及重复劳动带来的资源浪费。
本文采用贝叶斯分类算法对计算机辅助翻译软件 Trados 2014 MemoQ 2013 在本
文的 ECCO 产品新闻稿翻译项目的应用进行分析。从两款软件的界面对比到对本项目
的翻译记忆库的匹配测试,计算出两款软件的翻译记忆库对新文档的匹配率,旨在发现
对相同文本导入处理之后,在翻译记忆库中的翻译单元数量不同,但都有节省时间、减
少资源浪费、提高翻译效率的作用。在以后的翻译活动中应按照文本特点选择不同的专
业机辅翻译软件,在处理具有产品新闻稿的文本特点的项目时应选择合适的机辅翻译软
件,希望翻译人员能够从本文中获取一些有用信息及建议,以期给在该领域以及翻译人
员在翻译软件选择时有一定的参考作用。
本文分为五个部分,第一章为项目介绍;第二章主要介绍两款软件及算法在本项目
中的可行性分析;第三章为软件应用及效果测试;第四章为数据统计分析;第五章为结
语。
关键词:机辅翻译软件;贝叶斯分类算法;产品新闻稿;匹配测试
iii
ABSTRACT
With the development of computer science, the softwares like CADComputer-Aided
Design, CAEComputer-Aided Engineering, CAMComputer-Aided Manufacturing,
and CATComputer-Aided Translation play a key role in productivity of most fields. In
translation service market, CAT tool, that is Computer-Aided Translation, has aroused a lot of
attention for its proficiency and productivity in dealing with the projects. But the quality of the
translated materials varies because of the abuse of CAT or over-reliance on online literal
translation. There is a necessity that we should make reasonable use of CAT tools or online
translation assistant. And those tools need to be personalized and customized for different type
of materials in its related fields.
This paper analyzes the application of Trados 2014 and MemoQ 2013 in ECCO product
release materials by means of Bayesian Classification Algorithm. By comparing with the
usability of their user interface and calculating their matching rates when dealing with the new
documents that possess the features of product release materials, I find that the quantity of
Translation Units processed by MemoQ 2013 is different from that of Trados 2014, and the
unmatched rates also differ from each other. The two CAT tools are powerful in translation
memory, efficient in processing the texts and time-saving. I hope this paper may give some
reference to our translators when selecting a CAT tool in specific fields.
This paper is divided into five parts: Chapter 1 is Project introduction; Chapter 2 is
introduction of CATs, BCA and its feasibility analysis; Chapter 3 is the application and
comparison of the two CATs; Chapter 4 is statistical analysis; Chapter 5 is conclusion.
Key Words: CAT software; Bayesian Classification Algorithm; Product Release Material;
Matching Test
目录
致谢 ............................................................................................................................................. i
摘要 ............................................................................................................................................ ii
ABSTRACT .............................................................................................................................. iii
第一章 项目介绍 ........................................................................................................................1
1.1 项目研究背景 ..................................................................................................................1
1.2 研究目的及意义 ..............................................................................................................3
1.3 本项目的翻译辅助软件选择 ..........................................................................................3
第二章 Trados MemoQ 软件与贝叶斯算法及可行性分析 .................................................5
2.1 Trados 2014 MemoQ 2013 ..........................................................................................5
2.2 贝叶斯分类算法 ..............................................................................................................5
2.3 可行性分析 ......................................................................................................................6
2.4 翻译环境介绍 ..................................................................................................................8
第三章 Trados2014 MemoQ2013 ECCO 产品新闻稿中的应用 .....................................9
3.1 Trados 2014 MemoQ 2013 ECCO 产品新闻稿中的界面对比及使用 .................9
3.2 Trados 2014 MemoQ 2013 ECCO 产品新闻稿的的效果测试 ...........................15
第四章 Trados 2014 MemoQ2013 的匹配数据统计与分析 ..............................................20
第五章 结语 ..............................................................................................................................27
参考文献 ...................................................................................................................................29
在读期间公开发表的论文 .......................................................................................................30
附录一 项目原文 ECCO Spring &Summer 2014 Product Text ...............................................31
附录二 项目译文 ECCO 2014 春夏季产品新闻稿 .................................................................71
第一章 项目介
1
第一章 项目介绍
本项目名为:ECCO 2014 春夏季新产品新闻稿。
本项目来源于笔者自 2013 9月起为丹麦休闲鞋履品牌爱步(ECCO)公司 2014
年春夏季最新产品的新闻稿提供翻译服务,字数约 3万字,译文用于其官方及利益相关
方的外宣材料。在本项目执行中,笔者独立担任翻译、排版编辑及校对工作。所使用的
翻译辅助软件为 SDL Trados MemoQ,由于工作量大,时间紧迫,在翻译过程中也遇
到很多问题,这些问题的出现使得本论文得以讨论和完成。
1.1 项目研究背景
时至今日,有如英国翻译服务及翻译软件供应商思迪(SDL公司的塔多思
Trados,以下简称 Trados)、法国计算机辅助翻译软件提供商雅翠(Atril)公司的迪悟
DéjàVu)及匈牙利计算机辅助翻译软件提供商吉格雷(Kilgray以下简称 Kilgray
公司的 MemoQ 等计算机辅助翻译(Computer-Aided Translation: CAT,以下简称 CAT
软件在翻译服务市场各大公司的广泛应用,在翻译质量与效率方面都有了很大提高,同
时也有一些小型的翻译工具如金山词霸、有道词典、灵格斯翻译、必应词典及谷歌翻译
等,这些翻译软件都为我们在日常生活中获取各种资讯提供便利,更好地服务于现代人
的资讯传播。
如今新闻资讯高速发展与传播,人们对获取各种资讯的欲望也更显强烈。但因各民
族各语言的差异性,人们在浩如烟海的资讯海洋里寻找有用的资讯显得更加复杂,这样
也显示出使用更具效率的翻译工具更加迫切且有必要。很多专家也热衷于对翻译技术的
研究,菲利普·科恩(Philipp Koehn)(2009)便使用一种较新的网络Web)应用框
Ruby on Rails C++编程语言,基于机器翻译系统摩西解码器(Moses decoder)开
发了一款 CAT 软件 Caitra,该工具能够帮助人工翻译提供一些参考译文及短语,也可以
让翻译者编辑与修正机器翻译出的译文。这款 CAT 软件采用统计机器翻译方法
statistical machine translation methods)其最大优点是为译者提供互动性句子翻译建议,
能够方便翻译者对译文更好地把握及提高翻译效率(Koehn, 2009:32)。2010 年一些专
家又采用了跨语言资讯获取机制(cross-language information retrieval approach)来改善
机辅翻译软件的利用效果,通过双语专业词汇、句子长度、句子位置及语义相似性等不
上海理工大学硕士学位论文
2
同的信息源来对齐句子,根据字句的语法信息构建源语及目的语的数据库,对新输入需
要翻译的句子提供应答机制(Semmar et.al,2010:78)。同时还有很多国外学者也对
CAT 翻译系统提出了很多的统计分析方法来改善与提高翻译软件在科技翻译中的应用
效果(Langlais, P., Foster, G., & Lapalme, G.2001:40),TransType 机器翻译输入系统
能够让翻译者在输入的时候自动智能补全正在输入的文本(Barrachina et.al, 2001:50)。
随着翻译软件性能的提升使得更多人不再关注机器翻译软件本身是否能够彻底替代人工
翻译,而是转向对翻译记忆库的研究,欧根·碧西和马克·迪梅特曼(Ergun Bicici,
Marc Dymetman, 2008)提出动态翻译记忆(Dynamic Translation Memory)用于改善在
科技翻译应用中利用译记忆库(Translation Memory: TM)的模糊匹配度。这都显示
了翻译记忆库在实际使用机辅软件时候的重要作用。
对于职业翻译人员来讲,陈友勋(2013:92-93)认为“真正从事职业翻译的人员,
一般对 MT[Machine Translation:机器翻译]嗤之以鼻,而对 TM[Translation Memory:翻译
记忆]情有独钟。袁亦宁2002)认为虽然机器翻译的研究已有几十年,但其应用依
然具有很大局限性,就目前而言也只能非常有限地取代人工翻译。因而计算机辅助翻译
软件对职业译员来讲,CAT工具所起的最大作用就是可以适量代替人脑来帮助记忆之
前自己翻译的项目内容,从而在之后的翻译活动中若遇到类似项目就更加容易。尽管机
器翻译已经变得更加智能化,但依然无法绝对替代人工翻译,只能是在非文学领域如土
木、机电、贸易金融、新闻等行业中得以较为广泛的应用。同时翻译行业也出现很多比
较优秀的 CAT 软件如 Trados vu XMemoQWordfast 等,这些软件的出现对提
高翻译效率、加强术语统一发挥了很大作用。
目前,CAT 工具越来越多地应用于非文学文体领域,但同时也并非每种问题都适
合。李伟(2013)、袁亦宁(2002)认为在科技翻译领域也并非每一种文体都适用,只
有术语一致性较高、文本重复率较高、原文措辞简明易懂的文本在使用计算机辅助翻译
软件时才能发挥其软件优势。在产品新闻领域,从外语翻译成中文还需考虑很多方面。
由于使用中文的地区包括中国大陆、港澳台地区、新加坡、海外华人地区等,各个地区
由于历史原因及政治因素而造成用语习惯都发生了很大变化,这就使得各个地方的中文
译文都无法普适于其它的地方。所以各大公司都会针对不同中文用语地区提供不同的译
文,龚俊恺(2008)认为由于两岸分治所造成的繁简中文难以一一对应,提出了对应模
第一章 项目介
3
型。黄裕峯(2011)也分析了两岸新闻用语的异同,认为对于企业提供的新闻稿也需要
针对两岸进行定制化译文以便满足当地特定文化的特定需求。
然而,在如今资讯发达、追求效率的情况下,计算机辅助翻译软件的利用具有极大
帮助。特别是对于各大公司来说,其新产品上市能否占据市场,前期的宣传起到至关重
要的作用,产品新闻稿往往就能影响一款新产品的市场命运。而在追求速度的同时,其
关于产品的译文质量也是决定该产品能否获得市场青睐的一个重要因素。本文将就机辅
翻译软件在产品新闻稿中的应用进行分析,以期能有一定的参考作用。
1.2 研究目的及意义
本文通过笔者在实际翻译项目 ECCO爱步2014 春夏季产品新闻稿时采用的
计算机辅助翻译软件的利用与理解,以及对产品新闻稿的文体特点和客户对产品译文的
要求及满意度反馈,来探讨计算机辅助翻译软件 Trados 2014 MemoQ 2013 在产品新
闻稿中的实际使用效果,得出两款软件在产品新闻稿中其翻译记忆库(TM)的应用效
果及各自的特点,以期给在该领域从事翻译的人员在选择翻译软件时有一定的参考作用。
使用计算机辅助翻译软件 Trados 2014 MemoQ 2013 对客户提供的关ECCO
2014 春夏季产品新闻稿进行翻译,在翻译过程中通过使用贝叶斯分类算法来发现与探
讨新闻稿的翻译该如何进行,以及通过与客户反馈意见及其提供的参考稿件进行比较,
来探讨该翻译辅助软件的匹配率以及所要达到的预期目标,探讨进一步优化或进步的空
间。
1.3 本项目的翻译辅助软件选
笔者此次的翻译项目为 ECCO 的产品新闻稿,其文本具有术语一致性较高 (如有直
接注塑工艺 DIP, 戈尔面料 Gore-Tex, 舒适纤维系统 Comfort Fiber System™, 防水技术
HydromaxTM 等专业术语)、文本重复率较高(如本文中所有文档皆出现关于 ECCO 的简
以及颜色词汇)、原文措辞简明易(产品新闻稿面向消费)、表达风格较统一
(为了保持品牌文化的延续与统一)等特点,这些特点非常适合用翻译软件来辅助译者
翻译,将其翻译过的译文与原文保存起来形成翻译记忆库(TM),在译者继续进行
似翻译项目时即可充分利用已保存的翻译记忆库(TM)来对新文档进行智能匹配,提
高翻译效率、节省时间的同时也保证了译文风格的统一。根据客户要求,本项目需使用
在业内占有率很高的 SDL Trados 2009 软件,之后经软件对比、与客户沟通及基于文本
上海理工大学硕士学位论文
4
特点考虑,Trados 的更新版更加智能、更加方便翻译,能够进一步提高翻译效率,确认
使用 SDL Trados 2014 版本。同时 SDL Trados 也是笔者研究生期间课程《计算机辅助翻
译》所学习的主要 CAT 软件,这也显示了 Trados 在从业者心中及高校教学的地位。
在项目进行过程中也加入了另外一款在业内同样备受欢迎的 MemoQ 2013,该款软
件操作简便快捷,MemoQ 2013 能对世界上大多数语言和行业标准的所有格式都能给予
很好的支持。同时笔者通过在使用过程中发现两款软件有很多相似之处,除了功能都很
强大之外,处理文档时也各有特色,因此选择该两款软件在本项目中做应用对比具有很
大意义。
第二章 Trados MemoQ 软件与贝叶斯算法及可行性分析
5
第二章 Trados MemoQ 软件与贝叶斯算法可行性分析
2.1 Trados 2014 MemoQ 2013
Trados 2014 属于英国翻译服务及翻译软件供应商思迪(SDL以下简SDL)公
司旗下在业内广受赞誉的翻译辅助(CAT)软件,分为译员单机版(freelancer ver.)及
网络共享版(pro ver.),目前最受广大翻译从业者欢迎的是网络共享版(即译员专业
版),因其可以充分利用网络资源,如网络词典,在线翻译(Google translate)及网络
社区资源(WorldServer TMs),有利于使用翻译软件(MT进行翻译小组统筹协调和
通过翻译记忆库(Translation Memory ,以下缩写为 TM)进行翻译资源共享,帮助翻译
者能够更多学习及利用线上其他译者的翻译经验,而翻译资源共享(TM)能够让翻译
的资源重新利用、重复利用,使翻译质量与风格得以提升,也使 CAT 软件更加智能化。
MemoQ 2013 是匈牙利计算机辅助翻译软件提供商吉格雷(Kilgray,以下简称
Kilgray公司推出的一款操作简便、功能强大的计算机辅助翻译工具。它将翻译编
功能、资源管理功能、翻译记忆、术语库等功能集成到了一个系统中,可以很方便地在
这些功能中切换(http://kilgray.com/), 分译员版(Translator Pro)和服务器版(Server)。
这两款 CAT 软件在使用及结果输出方面各有特色,故本文即会对这两款行业占有
率高的产品进行分析对比,通过贝叶斯分类算法获取各自的匹配率。
2.2 贝叶斯分类算法
贝叶斯分类是在统计分类中的一类利用概率统计知识进行分类的算法,算法得名为
英国数学家托马斯·贝叶斯(Thomas Bayes。在很多情况下,朴素贝叶斯分类算法
(Naive Bayes: NB)以媲美决策树(Decision Tree: DT)和神经网络分类(Neutral
Network Classification: NNC)算法,该算法能运用到大型数据库中,且方法简单、分类
准确率高、速度快。由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的
值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为此,就
出现了许多降低独立性假设的贝叶斯分类算法,如 TAN(Tree Augmented Bayes network)
上海理工大学硕士学位论文
6
算法。它是一种具有最小错误率的概率分类方法,可以用数学公式的精确方法表示出来,
并且可以用很多种概率理论来解决。
贝叶斯定理也称贝叶斯推理,早在 18 纪,英国学者贝叶(17021761)曾提出
计算条件概率的公式用来解决如下一类问题:假设 H[,1],H[,2]…互斥且构成一个完全事
件,已知它们的概率 P(H[,i],i=1,2,…,现观察到某事件 AH[,1],H[,2]…相伴随而出现,
且已知条件概率 P(A/H[,i]),求 P(H[,i]/A)
贝叶斯公式(发表于 1763 年)为:
P(H[,i]|A)=P(H[,i])P(AH[,i])/[P(H[,1])P(AH[,1]) P(H[,2])P(AH[,2])+…]
这就是著名的“贝叶斯定理(Bayesian principles)”,一些文章中把 P(H[,1])P(H[,2])
称为基础概率,P(AH[,1])为击中率,P(AH[,2])为误报率[1]
搜索巨人谷歌(Google)和基于语义计算(MBC)的领导者奥拓迷(Autonomy
搜索公司,虽然各自采用的技术不同,却都使用了贝叶斯定理(Bayesian principles)为
数据搜索提供近似的结果。研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关
系,创建个体机器人,开发能够根据其个人数据和经验习惯来决定行动的人工智能设备。
2.3 可行性分析
计算机辅助翻译软件其核心就是翻译记忆TM)这一重要技术,在此基础上根
据人工智能的发展开发出了很多新的技术,如术语库提取与制作、双语文档对齐等。因
此在建立翻译记忆库后便可大大方便译员对以后相似项目的翻译,但由于各行业的文体
不同及语言风格迥异,这使翻译记忆库与译文的智能匹配也具有不小的难度,而在匹配
这一环节其本质就是通过软件定义的一些逻辑与算法来进行匹配。而产品新闻稿有其特
殊性,行文的复杂性,尤其是译文为中文时对中文行文流畅度的检验更加严格,因为汉
字的信息量大以及其缺乏语法上的形态意义上的变化,从而有可能对匹配得出的译文过
于生硬、不够流畅。即便如此,得益于计算机技术的发展及人工智能(Artificial
Intelligence: AI)的进步也促进了计算机辅助翻译软件向更加智能化发展。随之翻译单
元(Translation Unit: TU,以下简称 TU)这个功能的出现大大提高从业者的翻译速度及
第二章 Trados MemoQ 软件与贝叶斯算法及可行性分析
7
术语和译文行文风格的统一。译者通过翻译辅助软件保存过去的翻译内容,形成以翻译
单元(TU)的方式存储于翻译记忆库(TM)中,当需要进行新的类似文本的翻译时,
即可加入该翻译记忆TM来对新的文本进行匹配,可大大减少重复操作的时间。
因此本文通过使用贝叶斯分类算法来提取译文与参考译文和反馈译文的特征向量和匹配
率(如下图),从而获得通过 Trados2014 MemoQ 2013 两大翻译软件在产品新闻稿的
利用效果,通过利用效果的分析得出该翻译软件是否有进一步优化或改进的空间,这对
以后的翻译者再翻译此类文档时选择翻译软件时有一定的意义。
贝叶斯分类具有如下特点:
(1) 贝叶斯分类并不把一个对象绝对地指派给某一类,而是通过计算得出属于某一类的
概率,具有最大概率的类便是该对象所属的类;
(2) 一般情况下在贝叶斯分类中所有的属性都潜在地起作用,即并不是一个或几个属性
决定分类,而是所有的属性都参与分类;
(3) 贝叶斯分类对象的属性可以是离散的、连续的,也可以是混合的。
通过贝叶斯定理可以得出最小化误差的最优解决方法,可用于分类和预测。贝叶斯
分类对象属性多样,如离散型、连续型、混合型等。这在如何根据翻译记忆库中的翻译
单元(TU)来处理翻译文本进行分类具有非常重要的作用。由于产品新闻稿的重复率
高、行文风格统一的特点,这样便会让贝叶斯分类算法得到充分利用。当源语文本导入
时机辅软件即会对其分解,并同时利用已经建立的该类文本的翻译记忆库(TM)来识
别归类。这些方面恰恰需要贝叶斯分类算法进行对象定义而根据得出的后验概率判断其
匹配率。在进行翻译项目时使用翻译软件记录并保存的翻译记忆库(TM)将会对新建
类似项目进行智能匹配,根据贝叶斯分类算法得出 Trados 2014 MemoQ 2013 两款软
件在本项目中通过翻译记忆库(TM进行配的匹配率见下图,从而得出这两款
软件在本项目中对翻译记忆库(TM的利用效果,得出两款软件在类型项目中的优劣。
因此,利用贝叶斯分类算法的优势,即如下公式:



摘要:

ii摘要随着电脑科学技术的进步与发展,计算机辅助软件在各个领域各行业发挥着举足轻重的地位,如计算机辅助设计(CAD)、计算机辅助工程(CAE)、计算机辅助制造(CAM)在机电机械、造船、航空航天、土木建筑、汽车制造等各个领域中得到了广泛的应用。在翻译行业,计算机辅助翻译软件(即CAT)已经越来越受到翻译行业人士的注意,它的出现不仅使人们获取资讯更加方便快捷,同时也方便译者提高效率,减少重复劳动,也使得译文的整体行文风格趋近统一。因此对软件的合理利用则显得很有必要。针对不同行业、不同特点的文稿需要更加灵活的软件来给予帮助,这要求机辅翻译软件需要更加专业化、定制化,从专业化的道路逐步开放至多种不同...

展开>> 收起<<
Trados 2014和MemoQ 2013在翻译记忆库中的测试效果分析--以ECCO春夏季产品新闻稿为例.pdf

共106页,预览10页

还剩页未读, 继续阅读

作者:侯斌 分类:高等教育资料 价格:15积分 属性:106 页 大小:3.89MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 106
客服
关注