谷歌翻译遭遇“中国诗歌门”
本文作者: 本报记者 田文
连日来,《槽边往事》——比特海的博客成为网友们竞相点击的目标,在该博客中,谷歌(Google)一直引以为豪的谷歌多语言翻译工具成为“众矢之的”。
4月17日,《槽边往事》的博主发表了一篇其检测谷歌翻译功能的分析文章——《实验:诗歌是不可以翻译的》。在文章中,作者表示,将唐朝诗人韦庄脍炙人口的《菩萨蛮》(人人尽说江南好,游人只合江南老。春水碧于天,画船听雨眠。垆边人似月,皓腕凝霜雪。未老莫还乡,还乡须断肠。)作为案例,利用谷歌翻译工具将其进行了包括英语、日语、韩语、阿拉伯语等多种语言的翻译转换,以测试机器翻译的效果。结果显示,翻译结果大部分为含义混乱、语法错误的句子,译文中还包含了大量未经翻译的中文短语(其中这句最为知名的“人人尽说江南好”的英语译文为Jiangnan do all that good.)。博主得出的结论是:“在所有的翻译版本中,所有不能翻译的部分都被保留了下来,直接用作译文。而这些无法翻译的部分是‘江南、旅客、皓腕、凝霜、莫、回家和断肠’。这些不能翻译的部分连接起来,刚好便是《菩萨蛮》的精华所在。可见,诗歌的精华是不可以被翻译的。”
记者在《槽边往事》的博客中发现,短短几天时间,这篇博文的点击率便近40万,众多网友对其论证结果发表了意见,有人表示认同,也有人认为其分析方法和过程具有片面性,没有从本质上解析中国诗歌较难被翻译的原因,也未说明以谷歌为代表的机器翻译所具有的缺陷,同时也忽略了机器翻译的优势和发展潜力。
对于中国网友的质疑,谷歌翻译项目负责人Franz Och4月20日在接受新浪网专访时承认,相对于英语与法语、西班牙语等欧洲语言之间互译,中英互译的质量相对较差。“我认为,这其中有两点原因,一是欧洲语言大都属于印欧语系,这些语言较为相似,天生存在着诸多联系,因此他们之间的互译相对简单。另一原因在于,绝大部分的互联网资料均使用英语等欧洲语言,而互联网中的中文信息相对较少。”Franz Och解释。
据了解,于2006年推出的谷歌翻译工具目前支持41种语言。按照排列组合,这41种语言之间的翻译组合高达1640种。机器翻译的常见难点在于无法找到适当且庞大的资料库,但谷歌翻译借助于谷歌海量网页搜索引擎,互联网用户无需学习多门外语便能阅读全球98%的互联网资料。
在谷歌翻译支持的41种语言中,所有与英语有关的翻译均是“直接”翻译,无需经过其他语言的“中转”;在亚洲语言中,中文、日语和韩语这三种东亚语言同样是直接翻译。而其他未能直接翻译的语言组合将通过英语来“中转”。由于翻译速度很快,普通用户无法察觉其中的“中转”过程。
对于机器翻译的效果,Franz Och表示,机器翻译的质量往往取决于两种语言之间在词汇、语法、句法甚至文化上的差异。例如,英语与荷兰语同为日耳曼语系,这两种语言间的机器翻译质量通常会比中英互译的质量要高出很多。“对于任何一位译者而言,诗歌翻译都是一项高难度工作,更不用说机器本身了。我相信如果三位语言专家进行同一首诗歌的翻译工作,最后的结果也必将是三个不同的翻译版本。”Franz Och说,“机器翻译的结果有时候的确让人感到意外,让人摸不着头脑。一般来说,我并不提倡用户利用机器来翻译诗歌。”
谈及如何提高中文与英语之间的机器翻译质量,这位谷歌翻译负责人表示,尽管目前中文翻译质量并不能让人完全满意,但已达到了谷歌内部的翻译质量标准。Franz Och建议中国用户不妨多撰写中英双语博客,为谷歌的机器翻译提供更多资料。事实上,谷歌翻译支持的语种远不只41种,但由于这些语种的资料有限,翻译质量尚未达标,还有待进一步开发。此外,谷歌今后也可能推出类似于Facebook(美国著名社交网站) Translate工具,通过全球互联网用户的力量来获取更多数据源,以提高机器翻译的质量。
声音
网友“外语人”:
诗歌翻译必须能够传递原诗中的语义意象美、语形意象美、音象美、味象美(包括画味、韵味等),这类跨文化翻译对于译者而言十分艰难,更何况是机器?!
网友“昆明土著”:
“人脑不可替代”的又一例证。
网友“fish_luo”:
人工翻译包含了译者自身的再创作及艺术加工过程。目前的机器翻译软件基本以现代语言为基础,翻译古典诗词自然容易出现很多语句不通的情况。
网友fei:
这就是所谓的Lost in translation(美国电影《迷失东京》,曾获第76届奥斯卡奖四项提名,并最终获得“最佳原创剧本奖”)。美国诗人Robert Lee Frost也曾说“Poetry is what gets lost in translation.”
网友“大逻辑”:
你只证明了“中国古诗《菩萨蛮》是不可以用谷歌来翻译”这一观点。至于你所要证明的论点——“诗歌是不可以翻译的”,可以被以下这句机器翻译的佳作所推翻,Life is dear, love is dearer. Both can be given up for freedom.生命诚可贵,爱情价更高,若为自由故,两者皆可抛。(桑多尔裴多菲[匈牙利]),谷歌对这句诗的处理还算到位。所以该论点“诗歌是不可以翻译的”是假命题。
网友“makzhou”:
这个实验只验证了“谷歌类翻译工具不能翻译诗歌”,而人工翻译的质量是否达到“信、达、雅”的标准仍有待检验。博主这一判断过于笼统,事实上还需要进一步解释谷歌的翻译机制才能让这一结果更具有说服力。
网友“ablmf”:
数十年机器翻译的发展基本证明,语言是高层次的智力活动。在可预见的未来,机器翻译不可能提供完整无误的译文(普通素材),更何况是诗歌这类难度极高的特殊体裁的翻译。
网友“Rafom”:
谷歌翻译严重偏离其他语种,完全以英语为中心。中文与除英语外其他语言互译时,均是先翻译成英语然后再从英语翻译至目的语,这种“中转”导致翻译质量的大幅下降。
| |
| | |
Loading ...
| | | |
|