当前位置:  开发笔记 > 编程语言 > 正文

代词解决方案倒退

如何解决《代词解决方案倒退》经验,为你挑选了1个好方法。

通常的共指解决方案以下列方式工作:

提供

The man likes math. He really does.

它弄清楚了

he 

是指

the man.

有很多工具可以做到这一点.

但是,有没有办法向后做?

例如,

特定

The man likes math. The man really does.

我想把代词解决方案做"倒退"

这样我得到的输出就像

The man likes math. He really does.

我的输入文本大多是3~10个句子,我正在使用python.



1> Gabor Angeli..:

这可能不是一个真正满意的答案,但我认为答案是在任何地方都没有内置这样的功能,尽管你可以自己编写代码而不会有太多困难.概述我如何使用CoreNLP:

    仍然运行coref.这将告诉你"男人"和"男人"是共同的,所以你可以用代词替换第二个.

    gender从CoreNLP 运行注释器.这是一个记录不完整,甚至更不广告的注释器,试图将性别附加到一个句子中的标记.

    以某种方式弄清楚复数.大多数情况下你可以使用词性标记:复数名词得到标签NNS或NNPS,但是有一些复杂因素,所以你可能还想考虑(1)前提中连词的存在; (2)一个词与其文本不同的引理; (3)特别是结合2,以's'或'es'结尾的单词 - 这可以区分去除复数的词义化与去除时态的词义化等.

    这足以找出正确的代名词.现在只需要将句子整理并重新组合起来.如果你在CoreNLP中这样做会有点痛苦 - 代码只是没有设置来改变句子的文本 - 但在最坏的情况下你总是可以重新注释一个新的表面形式.

希望这有点帮助!

推荐阅读
oDavid_仔o_880
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有