当前位置:  开发笔记 > 编程语言 > 正文

用于Java的命名实体识别库

如何解决《用于Java的命名实体识别库》经验,为你挑选了1个好方法。

我正在为java寻找一个简单但"足够好"的命名实体识别库(和字典),我希望处理电子邮件和文档并提取一些"基本信息",如:名称,地点,地址和日期

我一直在环顾四周,而且大多数人似乎都处于沉重的一面和完整的NLP项目中.

有什么建议?



1> Aleksandar D..:

您可能想看看我之前对类似问题的一个答案.

除此之外,大多数较轻的NER系统在很大程度上依赖于所使用的领域.例如,您将找到关于生物医学NER系统的大量工具和论文.除了我以前的帖子(如果你想做NER已经包含我的主要建议),这里有一些你可能想要研究的工具:

在斯坦福CER-NER

在浦项工科大学生物医学命名实体识别系统,如果你有兴趣在这个特殊的领域

OpenCalais似乎是一个商业系统.OpenCalais有UIMA包装,但它们似乎过时了.UIMA还有一个基于字典的Context-Mapper注释器可以帮助你.请注意,UIMA意味着学习曲线的开销很大;-)

OpenNLP也有一个NER工具.

除其他事项外,Balie也做NER.

ABNER做NER,但它再次专注于生物医学领域.

来自德国耶拿大学的JULIE实验室工具也做NER.它们具有独立版本和UIMA分析引擎.

还有一句话:如果没有对输入进行标记化,您将无法逃脱.自然语言的标记化有点不重要,这就是为什么我建议你使用同时为你做这两者的工具箱.

推荐阅读
放ch养奶牛
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有