FANOVATION 2023 匯聚 80多名高管 參與生成式AI討論
2023年10月31日
雖然端到端神經機器翻譯(NMT)最近取得了顯著進展,但它仍然受到低資源語言對和域的數據稀缺問題的困擾。在本文中,我們提出了一種零資源NMT的方法,假設平行句子在第三語言中生成句子的概率接近。基於這一假設,我們的方法能夠在沒有並行語料庫的情況下訓練源到目標NMT模型(“學生”),由源透視並行語料庫上現有的樞軸到目標NMT模型(“教師”)指導。實驗結果表明,與基於基線透視的模型相比,該方法在各種語言對上顯著提高了+3.0 BLEU點。