Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson
在将自然语言问题转换为 SQL 查询以回答数据库问题时,当前的语义解析模型难以泛化到未见过的数据库模式。该泛化挑战在于:(a) 以语义解析器可访问的方式编码数据库关系,以及 (b) 建模数据库列与其在给定查询中的提及之间的对齐。本文提出了一个基于关系感知自注意力机制的统一框架,用于应对文本到 SQL 编码器中的模式编码、模式链接和特征表示。在具有挑战性的 Spider 数据集上,该框架将精确匹配准确率提升至 57.2%,相较于最佳基线模型实现了 8.7% 的绝对提升。进一步结合 BERT 后,该方法在 Spider 排行榜上达到了 65.6% 的新最先进性能。此外,我们观察到模型对模式链接和对齐的理解有了定性改进。