Comments (6)
这只能说明NER部分还有改进的空间,比如PFN-nested就考虑到了tail信息。RE对NER有益的那两个实验并不会因为这个结果没那么好而变得不可靠。
我从鲁棒性上举一个例子:比如说washington is the capital of USA. 这里washington他是在(washington, capital, USA)这个三元组里的,capital的两个实体肯定是location类型的,因此用到了RE信息的模型就不会有歧义。
相反,如果washington在一个句子里他是孤立的,那对于模型来说判断它究竟是人名还是地名会更加困难一点,因此RE能帮助到NER做实体分类是一种很符合常理的认识。
from pfn.
感谢您的回答。但我认为这个例子是不合理的。因为entity识别模型输入的是整个句子,它并不仅利用了单个词的信息,也利用了上下文信息。即使不给模型(washington, capital, USA)这个先验的关系信息,仅仅利用上下文信息也能够识别出washington是一个地名实体。我认为不可以认为washington在一个句子里是孤立的。
同时即便您认为这是一种比较intuitive的思路,在relative work以及您的工作中,都表现出目前的各种框架构造下,都不能够使得RE的信息帮助到NER,反而单向的方式在NER上效果更好。
当然,这样一个讨论只是一个主观的讨论,我疑问中想指出的是您的实验结果是否证明了PFN模型的encode方式也不能够使得RE的信息帮助到NER的识别。我并没有质疑您设计的另外两个实验,我认为它们是具有启发性的。
from pfn.
论文 section 6.1第三段有对这一问题做过讨论,可以参考一下。
from pfn.
不好意思,因为6.1文中只提到ACE05,所以我以为它没有涵盖SciERC的情况。事实上,您的table 3是包含了的。
想请问下,根据您的解释,如果使用Sequential的encode方式,是否In-triple的entity识别准确率下降,而out-of-triple准确率上升呢?如果能够补充类似这样的验证实验,感觉会让人得到一个非常直观的理解。
from pfn.
这个你可以自行进一步验证,这只是根据实验结果得出的一个假设。实验结果说明了模型确实在NER上还有改进空间,当前的模型确实是不如sequential,但是你把decoder换成PFN-nested是否还会不如sequential呢?这得进一步做实验。当然这个你也可以去自行验证一下。其他还有什么问题吗?
from pfn.
目前没有问题了。非常感谢您的回答。
from pfn.
Related Issues (20)
- Small inconsistency, or not? HOT 1
- question about eval_metric HOT 1
- When training model, is it necessary to set args.do_eval=True?
- FileNotFoundError: [Errno 2] No such file or directory: 'data/data/NYT/ner2idx.json' HOT 1
- OOM for my own bigger datasets HOT 2
- Question about entity extraction of out-of-triples HOT 1
- chinese custom dataset HOT 2
- evaluate the model with customized input HOT 2
- 请问消融实验的编码模式encoding scheme应该怎么设置呀 HOT 2
- Nest下的处理 HOT 2
- SEMEVAL dataset HOT 1
- 为什么PFN-nested model在关系训练时候可以利用实体tail信息呢? HOT 2
- 你好,能否提供适用于nested-pfn的inference.py呢?感谢! HOT 1
- 关于头尾实体特征和关系特征的问题 HOT 5
- 关于实验结果复现的问题 HOT 2
- 关于实体抽取和关系抽取F1分数问题 HOT 2
- 关于OOT(Out-of-triple)数据集问题 HOT 2
- RuntimeError: CUDA error: device-side assert triggered
- Question about the tail re unit HOT 6
- 有一个报错问题,不知道是环境不对还是, HOT 5
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from pfn.