模型如何利用 语义 和 系统性知识
机器翻译模型目前最大的依赖是数据。现在工作在于数据多样性和模型多样性,来产生翻译结果
深度学习机器翻译
之前听过AI TIME一个会议,印象较深的是“机器翻译,错的是翻译还是理解。”目前基于深度学习的机器翻译在高质量双语数据训练得到了某种语言的对应关系或关联规则,并没有真正从深层语义角度来理解,利用系统性世界知识。而这样的对应关系和关联规则也是有问题的,如常说的漏译,增译等。
第六届语言与智能高峰论坛上,孙茂松教授说“当前机器翻译遇到的“窘境”是可利用的系统性世界知识严重不足,同时缺乏语义分析有效手段。”,对于未见词只能翻译“形似”,如唯二,机器翻译的翻译结果是 唯一。所以当前机器翻译应用具有一个局限性,局限在某一个细分支领域。但是垂直领域的翻译效果并不比通用领域高,因为训练数据差别不大。
例子
我家门前的小河很难过
The box was in the pen,盒子在围栏里
大规模预训练语言模型
大规模的预训练模型的量变到一定程度之后,会不会引起质变。这样的前提是模型内部存在合理的结构或机制支撑。同样类似于机器翻译的问题,在语义和知识的利用匮乏。
输入“沿着人满为患的山间小径一路走去,未见”,模型会续以“任何人”。