读报
登录注册网站首页
 

社会热点

自动机器翻译:专利推广的助推器

作者:■本报记者 田文
Aa
  • -   
  •    +
11月4日,中国国家知识产权局与欧洲专利局在京联合举办了“SIPO-EPO自动机器翻译国际研讨会”,来自世界知识产权组织、中国国家知识产权局、欧洲专利局、韩国知识产权局、日本特许情报机构、美国专利商标局及法国工业产权局的专家学者,以及国内外相关企业、高校、科研机构代表等约150人参加了研讨会。

近几年,包括中国在内的世界各国专利申请量增长迅速。根据统计数据,我国自1985年至今累计申请量超过400万件,连续多年增长率保持在20%以上。世界范围内知识产权事业的蓬勃发展,使得知识产权信息尤其是专利技术信息在各国得到前所未有的重视。由于各国的专利文献主要以当地国家(民族)语言公布,这使得语言问题成为阻碍专利信息广泛传播的一个巨大瓶颈。

为解决这一问题,欧洲专利局、中国国家知识产权局、日本特许厅、韩国知识产权局等世界主要知识产权机构,多年来致力于专利文献自动机器翻译系统的研发,并在欧洲语言—英语、中—英、日—英、韩—英等专利文献自动机器翻译开发方面取得了丰硕成果,相关自动翻译系统目前已在多个领域内被广泛应用。

据中国国家知识产权局(以下简称国知局)副局长杨铁军介绍,为满足国内外用户获取中国专利文献信息的需求,国知局在今年4月25日发布了中国专利文献汉英机器翻译系统,今后用户可以通过互联网在英语界面下检索中国已公开专利文献的著录项目和摘要,并将检索到的发明或实用新型专利的全文(权利要求书、说明书)采用机器翻译的手段在线转换为英语,从而帮助用户了解中国专利信息,使我国申请人的利益得到更有利的保护。

“我国首次推出的这项专利信息机器翻译服务为试验性质,旨在通过用户试用、评测、反馈意见,以便不断改进机器翻译结果的可读性。”国知局中国专利信息中心信息加工处副处长王丹说,“目前该系统的翻译速度不低于8000个汉字/分钟,全部词条约100万条,可识别超过85%的专业术语。此外,对简单句和常见复杂句的翻译结果也具有可读性。”

据了解,研发专利文献汉英机器翻译系统面临不少困难。首先,汉语与印欧语言存在明显差异,汉语不仅缺乏印欧语言所具有的丰富形态,也不像印欧语言在其语素、单词和词组之间具有清晰的界限。其次,文献中的长句、其特殊的文体风格等因素都给机器翻译带来了不确定性和歧义性。

日本、韩国等亚洲国家同我国的机器翻译系统具有不少共性,也面临着同样的瓶颈。各国均极其关注机器翻译技术的未来发展趋势,希望通过加强相互合作,共同提升机器翻译系统质量和服务。据日本特许情报机构高级常务董事守屋敏道介绍,日本开发的日英机器翻译系统为了提高翻译质量,近来不断改进模板库,对原始日语文献进行预改写,使之成为适于机器翻译的日语文献,此外,他们也加强了对汉日、韩日机器翻译的研究,并计划于2015年底完成检索系统优化。

韩国知识产权局研发的韩国专利信息检索系统—多语言翻译系统也经历一系列的改进升级过程:从三年前较单一的韩英机器翻译系统,发展为使用韩国专利文献数据库进行英文关键词检索,到目前即将全新上线的专利全文跨语言(多语言)检索服务。

记者在采访中了解到,为推动中国专利文献的国际化传播,帮助国内外公众更为便利地获取和使用中国专利技术文献,未来几年国知局将在中英自动机器翻译系统的改进上采取更多新手段。王丹表示,核心工作是改进机器翻译的可读性。“不断更新词库、采用新技术优化翻译引擎、构建跨语言检索平台、应用多引擎机器翻译系统等都是未来的发展方向。”王丹说。



联系我们  |  诚聘英才  |  关于我们  |  版权声明
© i21st.cn   京ICP备2024066071号-1
 
选择报纸
选择报纸
关闭