聪明文档网

聪明文档网

最新最全的文档下载
当前位置: 首页> 古今汉语平行语料库的语料构建-2019年精选文档

古今汉语平行语料库的语料构建-2019年精选文档

时间:2023-08-10 06:12:32    下载该word文档
古今汉语平行语料库的语料构建一缘起“汉语是世界上正在使用的语言中最古老的语种之一。古籍无论是数量还是涉及的范围及其历史跨度,汉语在世界上都是无与伦比的。”①灿烂悠久的中国思想文化,通过这些典籍得以保存、传承,在历经千载的延续过程中,又得后人的认识和研究,融入新的内涵,由此构筑了中国的古代文明。今天,这些承载着中华民族灿烂文明的典籍仍在被广泛地使用着,尤其在人文学科领域的应用价值更是显而易见。同时,随着大众文化水平的提高、经济的发展与对外往来的增加,越来越多的非专业人士希望深入了解中国传统的思想文化,但古代汉语与现代汉语之间存在着的明显差异使得很多现代人难以理解以古汉语为载体的传统典籍。有鉴于此,我们提出要建设一个大型、开放的古今汉语平行语料库及其应用平台,为古籍整理和翻译(含机器翻译或机器辅助翻译)、古代汉语教学与研究以及辞书编纂提供基础资源,为需要了解中国传统思想文化的普通读者及相关学科的专家提供阅读、翻译、检索、统计服务,并为与现有的汉英双语语料库的对接奠定基础,从而为实现古汉语和英语的翻译(含机器翻译或机器辅助翻译)创造条件。平行语料原指使用不同语言撰写、相互间具有“翻译关系”的文本,本文将其延展为基于同一语言且不同历史时期兼具有
“翻译关系”的文本,就汉语而言,即指“古今汉语”。平行语料库已被系统地应用到自然语言处理中,包括建立翻译记忆、纂词典和双语术语表、跨语言信息检索、计算机辅助教学、语言对比研究等。国外涉及汉语的平行语料库中影响较大的是与Freiburg-LOBCorpusofBritishEnglish(即FLOB平行对应的汉语语料库LCM②(TheLancasterCorpusofMandarinChinese)。国内的主要研究有北京大学计算语言学研究所的汉英双语语料库以及北京外国语大学拥有的目前国内最大的双语平行语料库(含汉英和汉日两个库)等[1]。就目前来看,国内外涉及汉语的平行语料库基本上都是现代汉语与外语的平行语料库,鲜见有影响的、大规模的古今汉语平行语料库。就应用层面而言,古今汉语平行语料库的价值主要体现在:⑴为古今汉语的机器翻译或机器辅助翻译提供基础资源。古今汉语平行语料库中对齐的语料或作为翻译资源使用,或用作翻译统计建模的训练资源。⑵为古汉语教学与古今汉语对比研究提供基础资源。普通用户通过该平台的阅读、翻译、查询功能,既可以随时获取他们需要的有关古代典籍和文化的信息,也可以接受系统的古代汉语专业训练。研究人员则可以通过检索统计在语境中把握特定词或结构的语义和句法特征,观察古今汉语之间的传承关系,归纳古今汉语的发展规律。⑶高古今汉语辞书的编纂质量和效率。到目前为止,还没有基于大型语料库的古代汉语和现代汉语辞书问世。该语料库及应用平台的构建将为辞书编纂中经常遇到的字频和词频的统计、字头和词目的确立、书证和用例的选择、字义和
  • 29.8

    ¥45 每天只需1.0元
    1个月 推荐
  • 9.9

    ¥15
    1天
  • 59.8

    ¥90
    3个月

选择支付方式

  • 微信付款
郑重提醒:支付后,系统自动为您完成注册

请使用微信扫码支付(元)

订单号:
支付后,系统自动为您完成注册
遇到问题请联系 在线客服

常用手机号:
用于找回密码
图片验证码:
看不清?点击更换
短信验证码:
新密码:
 
绑定后可用手机号登录
请不要关闭本页面,支付完成后请点击【支付完成】按钮
遇到问题请联系 在线客服