在如今的出海大潮下,跨语言交流的需求日益增长,尤其是在全球化的泛娱乐领域。然而传统的翻译服务往往局限于单句翻译,难以捕捉到对话或文本的真正含义。
不妨设想一个场景,你正通过翻译软件和外国朋友聊天:
可见,如果不参考上下文信息,仅仅把翻译单个句子翻译正确,对话的双方可能谁也无法理解对方想说什么。
如上文例子一样,在泛娱乐领域的翻译场景,无论是社交聊天、游戏对话、还是字幕翻译等,都涉及到和语境信息强关联的多句文本。此时,上下文信息对于翻译的准确性无疑是十分重要的。然而传统的机器翻译服务无法参考上下文语境,在实际的翻译中往往导致译文与原意南辕北辙。
为了解决这一问题,云上曲率创新地推出了首个实时上下文翻译模型,通过接收同一对话的历史记录或多句文本,利用先进的算法模型,深入理解上下文信息,并对其中的多义信息进行消歧。如此一来也就能翻译出语句中隐含的意思,从而提供更加准确和更符合语境的译文。我们从真实的泛娱乐场景中抽取了对话,并使用上下文模型的翻译结果与传统翻译模型和ChatGPT进行人工盲测对比。相比之下,上下文模型在多个语种的翻译任务中都有显著优势:
下面,让我们结合实际场景中的案例来体验一下上下文翻译模型的优势之处~
下面是我们从某电视剧中截取的一段对白,以及上下文模型给出的翻译,这个例子对于社交场景也同样适用:
无上下文翻译结果:
Google: I haven't even had a wedding yet, but I'm calling you husband.
(虽然我还没办婚礼,但是我要叫你老公)
Bing: The wedding didn't take place, so I asked the family to call my husband
(婚礼还没有办,所以我让家人叫我的老公)
GPT4: The wedding hasn't even taken place, and yet you're letting others call you "husband."
(婚礼还没办,你居然让其他人叫你“老公”)
译文分析:
“人家”是一个很灵活的代词,既可以指说话人自己,也可以指其他人,甚至还有“别人家里”的意思。如果没有上文中对话双方的聊天内容信息,这句话在理解上很容易产生歧义,自然也就无法正确翻译。经测试,市面上多家翻译引擎以及ChatGPT,都无法在不提供上下文的情况下给出正确的翻译。如果能提供上文信息,云上曲率的上下文模型就能够理解到,其中的“人家”指的是女生自己,因而也就能完美地翻译正确了。
即便是同一个句子,在不同语境中也可能有完全不同的含义:
译文分析:
在这个例子中,通过参考前文的聊天内容,我们的上下文模型可以了解到“20m”这个缩写到底是指有多少石头,还是英雄的攻击距离,从而给出正确的译文。
在实际场景中,我们很多时候遇到的是多国用户之间互相交流。对于多语种的上文,云上曲率上下文模型也能拿捏住其中含义:
译文分析:
“拉”字在网络上的用法也十分灵活,而且上文信息和需要翻译的文本并不是同一种语言,更增加了理解和翻译难度。设想一下,对于一个韩语和中文都不懂的外国用户来说,一旦其中一句翻译错误,就会对整段对话的内容产生困惑,因为根本无法确定到底那句翻译是错误的。而我们的翻译模型可以结合上文中的多句多语种信息,给出更加准确,更贴合语境的翻译。
云上曲率上下文翻译模型具备以下核心优势:
上下文理解:模型能够分析并理解对话或文本的上下文,包括但不限于前文提及的内容、特定领域的术语等,提供更准确的翻译。
支持多语言理解:支持多种语言的上下文理解和互译,满足更多场景下的翻译需求。
实时响应:百毫秒级响应时间,不会因理解上下文而增加耗时,用户点击翻译后,模型将即刻提供更准确的翻译结果。