如何检测语言

作者：手机用户2402851155 | 2023-07-06 11:10

如何解决《如何检测语言》经验，为你挑选了1个好方法。

是否有任何好的,开源的引擎用于检测文本所使用的语言,可能具有概率指标？一个我可以在本地运行,不查询谷歌或必应？我想在大约1500万页的OCR文本中检测每页的语言.

并非所有文档都包含使用拉丁字母的语言.

1> archgoon..：

根据您正在做的事情,您可能需要查看python自然语言处理工具包(NLTK),它对贝叶斯学习算法有一些支持.

一般来说,字母和单词频率可能是最快的评估,但是如果您需要做除语言识别之外的任何事情,NLTK(或一般的贝叶斯学习算法)可能会有用.如果您发现前两种方法的错误率过高,贝叶斯方法可能也会有用.

推荐阅读

程序员
gdb:将"next"应用于所选框架而不是最内框架

如何解决《gdb:将"next"应用于所选框架而不是最内框架》经验，为你挑选了1个好方法。 ... [详细]
程序员
Ruby为数组数组的不同方法提供了不同的结果

如何解决《Ruby为数组数组的不同方法提供了不同的结果》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何对Wikidata项目进行分类？

如何解决《如何对Wikidata项目进行分类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用取消按钮单击提交按钮后阻止表单提交

如何解决《使用取消按钮单击提交按钮后阻止表单提交》经验，为你挑选了0个好方法。 ... [详细]
程序员
node-archiver:归档多个目录

如何解决《node-archiver:归档多个目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular2 QuickStart npm start无法正常工作

如何解决《Angular2QuickStartnpmstart无法正常工作》经验，为你挑选了7个好方法。 ... [详细]
程序员
Can Rails能否将shell命令传递给本地机器？

如何解决《CanRails能否将shell命令传递给本地机器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从代码隐藏编辑Sitecore图像字段

如何解决《如何从代码隐藏编辑Sitecore图像字段》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有null参数的$ http.get未访问Web API控制器

如何解决《带有null参数的$http.get未访问WebAPI控制器》经验，为你挑选了1个好方法。 ... [详细]
程序员
Groovy方式有条件地附加到String

如何解决《Groovy方式有条件地附加到String》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用名称范围

如何解决《使用名称范围》经验，为你挑选了1个好方法。 ... [详细]
程序员
Scala上的枚举与光滑之间的映射

如何解决《Scala上的枚举与光滑之间的映射》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何从Camera2 API连续获取帧数据用于流媒体目的？

如何解决《如何从Camera2API连续获取帧数据用于流媒体目的？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用不同的矩阵创建条形图 - 可能需要循环

如何解决《使用不同的矩阵创建条形图-可能需要循环》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何用psql导出二进制文件(没有PGCOPY标头)？

如何解决《如何用psql导出二进制文件(没有PGCOPY标头)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP preg_replace()更改版权年份

如何解决《PHPpreg_replace()更改版权年份》经验，为你挑选了1个好方法。 ... [详细]
程序员
更新时MySQL语法错误

如何解决《更新时MySQL语法错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
我正在调用我在python中的函数,即使我只是定义它

如何解决《我正在调用我在python中的函数,即使我只是定义它》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法下载GoogleService-Info.plist文件

如何解决《无法下载GoogleService-Info.plist文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法将用户存储在默认的MVC应用程序中

如何解决《无法将用户存储在默认的MVC应用程序中》经验，为你挑选了0个好方法。 ... [详细]

手机用户2402851155

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章