论双语词典数据库构建的基础问题——基于出版社内容资源的个案研究
VIP免费
目 录
中文摘要
ABSTRACT
第一章 绪 论.....................................................................................................................1
§1.1 课题研究的背景与意义.....................................................................................1
§1.2 课题的研究对象与目的.....................................................................................2
§1.3 课题的研究理论与方法.....................................................................................3
第二章 双语词典数据库的设计特征..............................................................................5
§2.1 双语词典数据库使用者特征.............................................................................5
§2.2 双语词典数据库的类型.....................................................................................5
§2.3 双语词典数据库的语言.....................................................................................6
§2.4 双语词典数据库的性质.....................................................................................6
§2.5 双语词典数据库的规模.....................................................................................7
§2.6 双语词典数据库的结构特征.............................................................................7
§2.7 样本选择依据.....................................................................................................8
第三章 国内外词典现代化研究....................................................................................11
§3.1 单语语料库与词典编纂...................................................................................11
§3.1.1 现有单语语料库对比研究.....................................................................11
§3.1.2 基于单语语料库生成的词典.................................................................13
§3.2 单语词典知识库与词典编纂...........................................................................15
§3.3 平行语料库与双语词典编纂...........................................................................17
第四章 双语词典数据库结构特征:宏观、微观与参见结构....................................19
§4.1 从词典学角度看体例的重要意义...................................................................20
§4.2 宏观结构...........................................................................................................20
§4.2.1 收词立目.................................................................................................20
§4.2.2 词目的排列.............................................................................................22
§4.3 微观结构...........................................................................................................22
§4.4 参见结构——辅助库.......................................................................................26
第五章 专项研究——基于四部英汉双解词典的对比分析........................................27
§5.1 词目的确立与排列...........................................................................................28
§5.2 义项的认定与排列...........................................................................................31
§5.3 示例...................................................................................................................34
§5.4 搭配...................................................................................................................37
第六章 结语与展望........................................................................................................41
参考文献.........................................................................................................................43
第一章 绪论
第一章 绪 论
回溯出版传播的变迁历程,技术的发展与普及总会引起出版传播领域的深刻
变革。如造纸术、活字印刷术的发明,对人类文明的保存与传递具有里程碑式的意
义。随着计算机、信息、网络和流媒体技术的迅猛发展,掀起的二十世纪末数字出
版浪潮,使得业已承担国家地区间文化传播历史重任的出版业更进一步成为信息
产业的一部分。
2005 年,在首届中国数字出版博览会上提出了数字出版是一种以互联网为流
通渠道,以数字内容为流通介质,以网上支付为主要交易手段的新型出版和发行
方式。然而随着数字出版的发展,数字出版的定义正在不断地丰富延伸。笔者认为
数字出版源自技术的推动,其实质是统称为数字技术的计算机技术、信息技术、网
络技术、流媒体技术等与传统出版的结合,即数字化出版是在出版的整个流程中
部分或完全实现了内容的数字化、编辑加工的数字化、传播载体的数字化、发行营
销的数字化和阅读消费的数字化。数字技术的发展与完善不仅影响了出版流程的
各个环节,改变了业已具有一定规模且比较完整的传统出版的产业链,衍生出了
新的出版物形态,也同样使得出版理念、消费理念和出版教育的学习理念发生了
变化。
然而,全球出版业几乎是同时进入数字时代,如何能够更好地适应数字化环
境,树立良好的数字出版理念,开发出优质的数字产品,从而赢得数字出版市场
以求得出版的可持续发展便成为首当其冲的问题。由于没有现成的经验可借鉴,
出版社都是在探索中前行。而这其中与计算机技术相结合的现代词典出版无疑走
在了数字出版领域的较前列。
§1.1 课题研究的背景和意义
近二三十年来,语料库及与之相关的语料库语言学学科研究发展迅速。国外
例如牛津、朗文等大的词典出版社都非常注重语料库的建设、维护、利用及经营。双
语语料库建设也在诸多大学、出版社与研究机构的合作中开展起来。语料库的建设
受到重视源于语料库在语言研究领域上的广泛应用。以英汉平行语料库为例,其
最大特点是能将原语文本与其对应的译语文本进行对照检索并显示,较之词典(传
统的和电子的) 和单语语料库有自己独特的优势,如双语对照语言实例数量多、语
域广、时效性强、语境丰富等。因此可广泛运用于翻译和双语对比研究、机器翻译、
双语词典编纂,也可用于各种课型的外语教学和学生自主学习[1]。其中,语料库
技术对词典编纂规划工作的贡献,主要表现在以下几个方面:第一,以计算机可
处理的形式大量储存能够最大限度地反映研究对象特点的真实语料。第二,对语
料做各种带有研究目的的标注,利用检索工具对标注语料进行快捷的搜索和分类
得出词频和词目概率信息。第三,例证的检索和分类、义项的排列、词典各部分篇
幅的统计比较、对数据进行分析,论证有关语言现象或描写语言特征。但国内的现
状是,真正能够用于词典现代化编纂的语料库尚未成形。尚未有对出版社拥有的
词典资源做专门的内容分析以进行二次传播,这包括词典数据库的建构,并最终
为双语词典语料库与双语词典编纂系统服务的相关研究。
目前,上海外语教育出版社为推进双语词典编纂出版数字化启动了“双语词
典编纂系统”项目。该项目旨在开发语料收集与处理、词典编纂与编辑、词典产品
生成等功能,最终目的是为双语词典编纂出版数字化提供一体化的平台。语料库
的建设是一个大的工程,前期的调研与数据库的设计非常重要。本课题旨在结合
1
论双语词典数据库构建的基础问题——基于出版社内容资源的个案研究
“双语词典编纂系统”这个项目,对亟需解决的双语词典数据库的构建问题进行
系统深入的探索研究,以期从数字出版专业的角度解决行业实际面临的问题。
§1.2 课题的研究对象与目的
内容是出版行业的核心优势资源,而与一般图书资源相比,词典资源的建设
和维护显得更为关键和重要。词典编纂现在已经成为与语料库有高度依存关系的
工作,而语料库语言学和计算机、信息、网络和流媒体技术的迅猛发展为词典编纂
带来了一场革命。语料库的传统形式是用卡片建成的,而现代的语料库则利用计
算机技术对大量收集的真实语料进行储存和处理,大大提高了语料库建设及利用
的效率。
根据王克非等研究员的定义与分类,语料库依据建构所用语言分为单语语料
库和多语/双语语料库。其中单语语料库顾名思义是仅收集一种语言的语料;多语/
双语语料库指收集两种及两种以上语言的语料。多语/双语语料库依据建构的用途
又可细分为平行语料库、类比语料库、翻译语料库等。平行语料库是由原文文本及
其平行对应的译语文本所构成的双语语料库,相对应的两种语言的文本在平行语
料库中被对齐;类比语料库是由不同语言的文本或同一种语言不同变体的文本所
构成的两个或两个以上的语料库;翻译语料库只是由彼此具有翻译关系的不同语
言文本构成的语料库。三者可以从语料间是否具有翻译关系或者语料间是否可以
对齐、类比来区分。平行语料库可根据对应的形式分为单向对应语料库、双向对应
语料库和多向对应语料库,其中单向对应语料库是指由一种语言的文本和将其翻
译成另一种语言的译文文本构成的对应语料库;双向对应语料库是指包括两种语
言的文本及其翻译文本;多向对应语料库指一种语言的文本和将其翻译成两种及
以上语言的译文文本构成的语料库[2]。
双语平行语料库是进行语言间词汇对比的资源宝库。而作为服务于双语词典
编纂系统的双语平行语料库,在语料的收集、加工等方面,应该与服务于其他目
的的语料库有所区别。作为为双语词典编纂系统服务的双语平行语料库,必须能
为双语词典的编纂提供丰富的双语语料,确保双语词典的宏观结构与微观结构的
标准性、学术性、权威性与时效性。本课题主要研究的是双语平行语料库的基础也
是核心,即双语词典数据库构建的几个问题:第一,对双语词典资料的选择并对
其进行系统的分析梳理。第二,对双语词典数据库必备字段进行研究。第三,为双
语词典数据库词目的确立与排列、义项的认定与排列、示例和搭配方面提供科学依
据。
§1.3 课题的研究理论与方法
双语词典数据库结构极为复杂,其宏观结构涉及收词立目、释义风格等内容,
而微观结构涉及义项的认定排列、示例、搭配等内容。本文运用到的理论指导包括
语料库语言学、计算机词典学和认知语言学方面的最新成果,涉及的方法主要包
括传播学内容分析法以及 Access 关系数据库的建构。其中:
第一,语料库语言学是近三十年来发展起来的一门分支学科,它的主要任务
和目标是以电脑储存足量的真实语料,对这些语料做各种带有研究目的的标注,
利用研制的检索工具对标注语料作方便快捷的收录和分析,试图发现以往因条件
所限而未能发现或注意的语言事实和特征[4]。语料库和语料库语言学的产生与发展
一直与计算机、信息、网络和流媒体技术的发展息息相关,与自然语言处理领域的
研究内容相互重合。基于大规模真实文本的语料库能在词典立目、义项的认定与排
2
第一章 绪论
列、例证以及搭配方面给词典的编纂带来便利,而语言学领域的理论和方法予以
词典编纂必要的指导。
第二,现代词典学和语料库语言学的结合产生出计算机词典学这一门介于语
言学、词典学、社会学、翻译学、人类文化学、统计学、认知学和计算机科学之间的
交叉性学科。该学科需要综合以上所有这些知识,并以现代化技术为手段,以整
个社会群体的言语活动为背景,以真实文本的语料库为依据,探讨各类词典的编
纂理论和科学的编纂方法。计算机词典学把其理论成果直接用于编纂实践,包括
计算机语料库的建设、管理和使用、计算机辅助词典编纂和自动生成系统的开发与
应用等。
第三,认知语言学的词汇主义认为,语言研究应该从语法中心转变为词汇中
心。在双语词典编纂领域,以词汇为中心的研究包括义项的认定与排列、示例和搭
配等方面的研究。
3
摘要:
展开>>
收起<<
目录中文摘要ABSTRACT第一章绪论.....................................................................................................................1§1.1课题研究的背景与意义.....................................................................................1§1.2课题的研究对象与目的....................................................
相关推荐
-
跨境电商商业计划书模版VIP免费
2025-01-09 26 -
跨境电商方案范文VIP免费
2025-01-09 14 -
创业计划书VIP免费
2025-01-09 18 -
xx生鲜APP计划书VIP免费
2025-01-09 12 -
跨境电商创业园商业计划书(盈利模式)VIP免费
2025-01-09 8 -
跨境电商计划书VIP免费
2025-01-09 13 -
绿色食品电商平台项目计划书VIP免费
2025-01-09 22 -
农产品电子商务商业计划书VIP免费
2025-01-09 8 -
农村电商平台商业计划书VIP免费
2025-01-09 13 -
生鲜商城平台商业计划书VIP免费
2025-01-09 21
作者:陈辉
分类:高等教育资料
价格:15积分
属性:40 页
大小:217.43KB
格式:DOC
时间:2024-11-19

