我正在设计一个需要从短文中提取人名的应用程序.
最好的方法是什么?是否有一个名称数据库,我可以测试,知道名称在哪里?虽然文本很短,但在处理需求方面可能不那么密集.
有任何想法吗?
谢谢,
谭
您可以使用统计命名实体识别器(NER),例如Stanford的NER或LingPipe.这些是基于机器学习的识别器,不需要巨大的名称字典作为输入.
或者,您可以从Web获取人名列表(有很多),并使用Aho-Corasick字符串搜索算法从文本中有效地从列表中提取名称.