Training Neural Machine Translation To Apply Terminology Constraints

在输入中通过replace和append两种方式增加目标端术语信息(annotations),让模型学到一种“复制机制”,从而提高术语翻译能力,同时该方法对也可以考虑到术语的形态变化。

  • 希望模型在一般情况和有注解情况下性能都好,所以限制注解的数量。(通过随机忽略一些匹配)
  • 在术语重叠的情况下保留最长匹配。使用近似匹配来允许术语的形态变化。作者使用简单的字符序列匹配,允许将基本单词形式视为匹配,即使是变形的或者作为复合词的一部分。
  • 为了避免spurious虚假匹配。过滤掉了500个频率最高的的术语。

术语约束的解码方式BLEU下降

image-20220330171913081.png

结果

image-20220330172619090.png

没有通用性。

End

本文标题:增强术语翻译(修改输入)-Training Neural Machine Translation To Apply Terminology Constraints

本文链接:http://tzer.top/archives/431.html

除非另有说明,本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议

声明:转载请注明文章来源。

最后修改:2022 年 03 月 31 日
如果觉得我的文章对你有用,请随意赞赏