论文阅读《KnowPrompt: Knowledge-aware Prompt-tuning withSynergistic Optimization for Relation Extractio》

news/2024/7/7 14:58:48

论文链接KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization for Relation Extraction

Introduction

现有关系抽取存在的问题:

基于微调的关系抽取方法:

(1)性能严重依赖耗时和劳动密集型的注释数据,难以很好地泛化。

(2)预训练模型与下游任务存在GAP

基于提示微调的关系抽取方法:

(1)确定合适的提示模板需要领域专业知识

(2) 用输入实体自动构建高性能提示往往需要额外的生成和验证计算成本。

(3)关系标签的长度发生变化时,标签词搜索过程的计算复杂度非常高,通常以指数的方式依赖于类别的数量。

(4)类别的表达器(verbalizer)非常难以设计,例如𝑐𝑜𝑢𝑛𝑡𝑟𝑦_𝑜𝑓_𝑏𝑖𝑟𝑡 𝑜𝑟𝑔:𝑐𝑖𝑡𝑦_𝑜𝑓_ℎ𝑒𝑎𝑑𝑞𝑢𝑎𝑟𝑡𝑒𝑟,难以指定合适的标签词。

本文提供的思路:

(1)利用可学习的虚拟答案词,通过注入语义知识来表示关系标签,而不是常规的从词汇中的一个标签词映射到特定类别的verbalizer

(2)将实体周围的可学习虚拟类型词赋值为弱化类型标记符,这些词由关系标签中维护的先验知识初始化。

Method – 实体信息注入 & 关系信息注入

因为之前已经看过不少有关prompt的论文了,一般prompt可以通过基线模型、模板、表达器、目标函数四个角度来看。

而prompt的优势就是少样本学习和可解释性。

基线模型

 主要是roberta

模板(软硬结合、搜索、利用先验知识获得潜在实体类型范围)

本文提出了虚拟类型词,利用主语和宾语的分布来初始化虚拟类型词。也是一种引入外部知识的方法。

文中给出的对应于表格1的例子:

表达器(离散、搜索)

假设PLMs的词汇表空间中存在一个虚拟答案词,它可以表示关系的隐含语义。

我们将MLMhead layer扩展为虚拟答案词集合,以完全表示对应的关系标签y。将关系类别概率用虚拟答案词集合重构。

整个过程
虚拟类型词和虚拟答案词的生成示例

 Method - 环境提示校准 & 隐式结构约束

环境提示校准

虚拟类型和答案词是基于知识初始化的,但它们在潜在变量空间中可能不是最优的。它们应该与周围的语境相关联。需要通过感知上下文进一步优化,以校准它们的表示。

隐式结构约束

为了将结构化知识集成到知识提示符中,我们采用附加的结构化约束来优化提示符。利用LMs中虚拟类型词和虚拟答案词的输出嵌入参与计算。

[MASK]位置分配正确的虚拟答案词,并随机采样主体实体或客体实体,并将其替换为不相关的实体,以构建负三元组。

Experiment

实验效果的话大致就是讲首先与传统微调嵌入知识的预训练语言模型其他提示微调比起来关系抽取的效果更好,其次prompt方法适合小样本学习,再就是虚拟标签词在3维空间与真实类别的语义距离近,然后就是消融实验证明每一个模块有效。

 消融实验

 虚拟答案词的可视化(看一下在与虚拟答案词语义比较接近的词有哪些)

Comparison

knowprompt与ptr做对比

 PTR: Prompt Tuning with Rules for Text Classification

PTR中规则方法,强迫多个掩码预测会混淆多标签预测。

PTR还对每个关系做了类别(sub-prompt),细粒度实体识别标注(如FewRel 100类别,并且是一种pipeline做法)

可以从这篇文章中得到的收获

提示学习不是简单的完形填空,要针对每个任务设计策略。

虚拟词方法的出现代表着语言模型可解决任务的范围进一步扩大。

其实这篇文章应该是浙大之前的工作的一个延续:

AdaPrompt: Adaptive Prompt-based Finetuning for Relation Extraction

主要的思想还是把关系的标签分解,然后作为提示学习表达器的标签词。

并且这一系列工作现在已经有了更新更好的结果:

Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning

总结

 笔者对自己读过的一些prompt论文的一个想法。

排名不分先后,总结了一些做补全和做关系抽取的prompt方法,大家感兴趣的可以搜对应的论文。


http://www.niftyadmin.cn/n/4411449.html

相关文章

IE浏览器无法查看源文件的8大原因

问:无论是使用Outlook还是IE,点击鼠标右键,在弹出的快捷菜单中都会有“查看源文件”这一选项,奇怪的是,在我的电脑上竟然无法显示该邮件或网页的源文件,虽然这并没有影响到该软件的正常使用。请问&#xff…

论文阅读《Knowledge Collaborative Fine-tuning for Low-resource Knowledge GraphCompletion》

论文链接 基于知识协同微调的低资源知识图谱补全方法 2022年3月发表于软件学报 是浙大prompt系列的一个延续 本文之前的工作: AdaPrompt: Adaptive Prompt-based Finetuning for Relation Extraction 本文之后的工作: Knowledge-aware Prompt-tun…

北京几个区组成

北京由几个区组成北京,中华人民共和国首都,中央人民政府直辖市。建国后,北京市的行政区属有过多次变动,2006年,北京市辖16个市辖区、2个县。 市辖区 东城区 西城区 崇文区 宣武区 朝阳区 海淀区 丰台区 石景山区 门头沟…

论文阅读《Does William Shakespeare REALLY Write Hamlet? Knowledge RepresentationLearning with Confidenc》

Does William Shakespeare REALLY Write Hamlet? Knowledge Representation Learning with Confidence INTRODUCTION Q:可信的知识图谱构建方法去哪找? ①、传统的知识图谱构建方法通常需要大量的人工监督或专家标注,费时费力。 ②、自动化机制和众包在知识构…

北京的火车站

北京的火车站北京有4个火车站,分别是:北京站,北京西站,北京南站,北京北站。 下面是各个站的介绍: 北京站:北京站主要负责京沪线、京哈线的客运列车。 http://baike.baidu.com/view/49121.htm…

论文阅读《Relation Extraction as Open-book Examination:Retrieval-enhanced Prompt Tuning》

Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning 浙大基于prompt的关系抽取最新论文,刷新prompt方法的SOTA。 因为之前对prompt类关系抽取方法已经做了很多介绍,所以现在直接看方法。 BACKGROUND 对于难度较大的实…

the answer to life, the universe and everything

the answer to life, the universe and everything is "42",or is "6*7?" 之前只是被电影里无限的英式幽默与哲思所吸引,但当看到deep thought面对历经千辛万苦来到它面前的主角们关于终极问题的提问时,爱理不理地说出“我一直都在…

HTML 元素的 ondragenter 事件

ondragenter EventDHTML文档教程Fires on the target element when the user drags the object to a valid drop target.dhtml语法Inline HTML<ELEMENT ondragenter "handler" ... >All platformsEvent propertyobject.ondragenter handlerJScript onlyobjec…