当前位置:  开发笔记 > 开发工具 > 正文

什么是一个很好的自然语言库用于释义?

如何解决《什么是一个很好的自然语言库用于释义?》经验,为你挑选了2个好方法。

我正在寻找一个现有的库来总结或解释内容(我的目标是博客文章) - 对现有自然语言处理库的任何经验?

我对各种语言持开放态度,所以我对能力和准确性更感兴趣.



1> Robert Elwel..:

有一些关于Grok的讨论.现在支持OpenCCG,也将在OpenNLP中重新实现.

您可以在http://openccg.sourceforge.net/找到OpenCCG .我还建议使用Curran和Clark CCG解析器:http://svn.ask.it.usyd.edu.au/trac/candc/wiki

基本上,对于释义,你需要做的是写出一些东西,首先解析博客文章的句子,提取这些帖子的语义,然后在词汇空间中搜索,这将构成相同的语义意思,然后选择一个与当前句子不匹配的.这将需要很长时间,可能没有多大意义.不要忘记,为了做到这一点,你将需要近乎完美的回指分辨率和接受话语层次推断的能力.

如果您只是想制作没有机器可识别的重复内容的博客文章,您可以随时使用主题和焦点转换以及WordNet同义词.肯定有一些网站已经从AdWords中赚钱,之前已经这样做了.



2> Osama Al-Maa..:

我想他想通过自动解释这个系统正在监控的博客来生成博客文章.

如果您可以组合2到10个相似的博客文章,但是来自不同的来源,然后自动进行释义的"真实"摘要(1篇博文的大小),这将非常有趣.

它也可能对Homeworks来说很棒.不幸的是,这并不容易.

我能看到的唯一方法是能够将每个句子分解为"含义",然后随机改变句子结构和一些保留含义的词.

这些句子意思相同:

我讨厌这个人,他是如此愚蠢.

这家伙很蠢,我讨厌他.

我鄙视这个愚蠢的家伙.

他很笨,我讨厌他.

编写一个程序将这些句子中的一个转换为其他句子将是非常重要的,这些是简单的句子,来自博客的真实句子要复杂得多.

推荐阅读
手机用户2402851155
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有