部分语音标记 - 从哪里开始？

作者：周扒pi | 2023-08-09 19:58

如何解决《部分语音标记-从哪里开始？》经验，为你挑选了1个好方法。

您好我想知道如何实现这样一个任务的解决方案:

有一个500Mb的普通英文文本.

我想收集关于单词频率的统计数据,但另外要确保每个单词都被正确识别(或大多数单词).

根据句子中的"哭","她给出一个响亮的CRY"将被归类为名词,"不要哭"将给动词统计.

此外,最好过滤正确的名称,以便他们形成另一个字典.

另一项任务将更加困难.我想找到经常聚集在一起的单词的出现,并建立这种出现的列表.

让我们说,"绿草","美丽的女孩","小心处理","你是对的".因此,我们可以准确地说,在语言中经常使用哪些单词序列.

我怎么开始？是否有关于这个主题的开放Java工具和好书？

1> Fabian Steeg..：

这些主题的优秀介绍是统计自然语言处理的基础.

统计自然语言处理基础http://nlp.stanford.edu/fsnlp/fsnlp.gif

在软件方面,您可以查看Stanford词性标注器或LingPipe等内容.

推荐阅读

程序员
拼出可访问时间标签的当前时间

如何解决《拼出可访问时间标签的当前时间》经验，为你挑选了0个好方法。 ... [详细]
程序员
NPM问题使用AWS codedeploy部署nodejs实例

如何解决《NPM问题使用AWScodedeploy部署nodejs实例》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python中舍入科学记数法

如何解决《在python中舍入科学记数法》经验，为你挑选了1个好方法。 ... [详细]
程序员
(取5(范围))和(范围5)之间有什么区别

如何解决《(取5(范围))和(范围5)之间有什么区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
Django UserCreationForm无法正常工作

如何解决《DjangoUserCreationForm无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
Thread.sleep()延迟整个程序,而不仅仅是它之后的程序

如何解决《Thread.sleep()延迟整个程序,而不仅仅是它之后的程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
找不到openshift v3 pod文件

如何解决《找不到openshiftv3pod文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
运行Java字节码

如何解决《运行Java字节码》经验，为你挑选了1个好方法。 ... [详细]
程序员
禁用在Visual Studio 2015 for ASP.NET 5项目中自动添加新文件

如何解决《禁用在VisualStudio2015forASP.NET5项目中自动添加新文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
Haskell中的语法错误

如何解决《Haskell中的语法错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
启动任务并等待多次

如何解决《启动任务并等待多次》经验，为你挑选了1个好方法。 ... [详细]
程序员
常数,但仅适用于此范围的其余部分

如何解决《常数,但仅适用于此范围的其余部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
投影中的变量"x"在GROUP BY中不存在

如何解决《投影中的变量"x"在GROUPBY中不存在》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何搜索"到下一行所述的无效地址"错误

如何解决《如何搜索"到下一行所述的无效地址"错误》经验，为你挑选了0个好方法。 ... [详细]
程序员
延迟加载html5视频

如何解决《延迟加载html5视频》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在javafx中制作透明场景和舞台？

如何解决《如何在javafx中制作透明场景和舞台？》经验，为你挑选了2个好方法。 ... [详细]
程序员
无法从'HTMLInputElement'中读取'selectionStart'属性:

如何解决《无法从'HTMLInputElement'中读取'selectionStart'属性:》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP:将base64转换为图像

如何解决《PHP:将base64转换为图像》经验，为你挑选了1个好方法。 ... [详细]
程序员
添加clojure依赖项并运行lein uberjar会导致java.lang.IllegalAccessError

如何解决《添加clojure依赖项并运行leinuberjar会导致java.lang.IllegalAccessError》经验，为你挑选了0个好方法。 ... [详细]
程序员
R tuneRF不稳定，如何优化？

如何解决《RtuneRF不稳定，如何优化？》经验，为你挑选了1个好方法。 ... [详细]

周扒pi

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章