NLTK/pyNLTK可以"按语言"(即非英语),以及如何工作？

作者：ifx0448363 | 2023-08-14 20:34

如何解决《NLTK/pyNLTK可以"按语言"(即非英语),以及如何工作？》经验，为你挑选了1个好方法。

如何告诉NLTK以特定语言处理文本？

有一段时间我会编写一个专门的NLP例程,在非英语(但仍然是欧洲的)欧洲文本域上进行POS标记,标记等操作.

这个问题似乎只涉及不同的语料库,而不是代码/设置的变化: 德语中的POS标记

或者,是否有任何专门用于python的希伯来语/西班牙语/波兰语NLP模块？

1> Matti Lyra..：

我不确定你所指的是代码/设置的变化.NLTK主要依赖于机器学习,并且通常从训练数据中提取"设置".

当涉及到POS标记时,结果和标记将取决于您使用/训练的标记器.如果你训练自己,你当然需要一些西班牙/波兰训练数据.这些可能很难找到的原因是缺乏公开的黄金标准材料.有一些工具可以做到这一点,但这个工具不适用于python(http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/).

nltk.tokenize.punkt.PunktSentenceTokenizer标记器将根据多语言句子边界对句子进行标记,其详细信息可在本文中找到(http://www.mitpressjournals.org/doi/abs/10.1162/coli.2006.32.4.485) .

推荐阅读

程序员
获取没有索引的dataframe列的最后一个值

如何解决《获取没有索引的dataframe列的最后一个值》经验，为你挑选了1个好方法。 ... [详细]
程序员
从数组中获取最后一次单击项的值

如何解决《从数组中获取最后一次单击项的值》经验，为你挑选了0个好方法。 ... [详细]
程序员
bashrc中的JAVA_HOME

如何解决《bashrc中的JAVA_HOME》经验，为你挑选了1个好方法。 ... [详细]
程序员
多行变量删除换行符 - 鱼

如何解决《多行变量删除换行符-鱼》经验，为你挑选了1个好方法。 ... [详细]
程序员
cordova运行ios错误..错误代码65的命令:xcodebuild与args:

如何解决《cordova运行ios错误..错误代码65的命令:xcodebuild与args:》经验，为你挑选了5个好方法。 ... [详细]
程序员
Apple-app-site-association文件不会下载

如何解决《Apple-app-site-association文件不会下载》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Azure服务结构的默认客户端时如何向请求添加邮件头？

如何解决《使用Azure服务结构的默认客户端时如何向请求添加邮件头？》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法可视化Spark mllib随机森林模型？

如何解决《有没有办法可视化Sparkmllib随机森林模型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过Java访问Windows证书存储证书？

如何解决《通过Java访问Windows证书存储证书？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在JS中将vh单位转换为px

如何解决《在JS中将vh单位转换为px》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么lambda和匿名方法不允许在左侧或作为运算符？

如何解决《为什么lambda和匿名方法不允许在左侧或作为运算符？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何避免在Swift2中嵌套do/catch语句

如何解决《如何避免在Swift2中嵌套do/catch语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何正确地将MIDI刻度转换为毫秒？

如何解决《如何正确地将MIDI刻度转换为毫秒？》经验，为你挑选了1个好方法。 ... [详细]
程序员
生成器不是迭代器？

如何解决《生成器不是迭代器？》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过EWS发送邮件时如何获取保存发送副本的ItemId

如何解决《通过EWS发送邮件时如何获取保存发送副本的ItemId》经验，为你挑选了1个好方法。 ... [详细]
程序员
关于`namedtuple`的一些内容在3.5.1中有所改变吗？

如何解决《关于`namedtuple`的一些内容在3.5.1中有所改变吗？》经验，为你挑选了3个好方法。 ... [详细]
程序员
如何为PyPy安装lxml？

如何解决《如何为PyPy安装lxml？》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有函数的参数和指针在C中的函数内部

如何解决《带有函数的参数和指针在C中的函数内部》经验，为你挑选了1个好方法。 ... [详细]
程序员
Jackson JSON如何设置http连接和读取超时

如何解决《JacksonJSON如何设置http连接和读取超时》经验，为你挑选了0个好方法。 ... [详细]
程序员
面向iOS 9.0及更高版本的iPad应用需要83.5x83.5@2x app图标

如何解决《面向iOS9.0及更高版本的iPad应用需要83.5x83.5@2xapp图标》经验，为你挑选了1个好方法。 ... [详细]

ifx0448363

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章