零資源神經機器翻譯的師生框架

零資源神經機器翻譯的師生框架
李安國教授
十月 5, 2022
研究

雖然端到端神經機器翻譯(NMT)最近取得了顯著進展,但它仍然受到低資源語言對和域的數據稀缺問題的困擾。在本文中,我們提出了一種零資源NMT的方法,假設平行句子在第三語言中生成句子的概率接近。基於這一假設,我們的方法能夠在沒有並行語料庫的情況下訓練源到目標NMT模型(“學生”),由源透視並行語料庫上現有的樞軸到目標NMT模型(“教師”)指導。實驗結果表明,與基於基線透視的模型相比,該方法在各種語言對上顯著提高了+3.0 BLEU點。

零資源神經機器翻譯的師生框架

麻省理工學院學士、碩士、博士;香港大學電子工程系首席教授;清華大學長江學者、客座教授;IEEE院士,香港工程科學院院士;香港特別行政區銅紫荊勳章獲得者。