Command Palette
Search for a command to run...
Dzmitry Bahdanau KyungHyun Cho Yoshua Bengio

摘要
神经机器翻译是一种最近提出的机器翻译方法。与传统的统计机器翻译不同,神经机器翻译的目标是构建一个单一的神经网络,该网络可以联合调优以最大化翻译性能。近年来为神经机器翻译提出的一些模型通常属于编码器-解码器家族,这些模型由一个编码器和一个解码器组成,其中编码器将源句子编码为固定长度的向量,而解码器则从该向量生成翻译结果。在本文中,我们推测使用固定长度向量是改进这种基本编码器-解码器架构性能的一个瓶颈,并提出通过允许模型自动(软)搜索与预测目标词相关的源句子部分来扩展这一方法,而无需显式地将这些部分形成硬片段。通过这种方法,我们在英法翻译任务上达到了与现有最先进的短语基系统相当的翻译性能。此外,定性分析表明,模型找到的(软)对齐结果与我们的直觉非常吻合。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| bangla-spelling-error-correction-on-dpcspell | GRUSeq2Seq | Exact Match Accuracy: 75.56 |
| dialogue-generation-on-persona-chat-1 | Seq2Seq + Attention | Avg F1: 16.18 |
| machine-translation-on-iwslt2015-german | Bi-GRU (MLE+SLE) | BLEU score: 28.53 |
| machine-translation-on-wmt2014-english-french | RNN-search50* | BLEU score: 36.2 |