Counter-fitting Word Vectors to Linguistic Constraints

要点

与 Retrofitting 类似, 本文旨在利用同义与反义关系来提升单词间的语义相似度.

为此, 文章分别维护了一个反义词集和一个同义词集, 并将目标函数拆成了 3 部分的组合:

异性相斥: 这完全借用了物理学的描述, 让反义词在距离上相互远离, 目标函数如下(u, w 互为反义词, d 是距离函数 1-cos, \delta 是 margin, 表示理想的最小距离, \tau=(0, x));

最终的目标函数就是以上三部分的加权平均.

本文的初衷之一是提升对话系统的dialogue state tracking(DST)能力, 即理解用户的意思并更新系统的 belief state, 从而更好地为用户服务, 避免答非所问的情况.

文章将异性相斥的 \delta 设为 1, 对应于词向量正交的情况. 这一点我持怀疑态度, 为什么反义关系反应在向量上就是正交?

Last updated 5 years ago

Was this helpful?