19赞

仅保留特定于域的关键字？

作者：凹凸曼00威威_694 | 2023-06-19 15:31

如何解决《仅保留特定于域的关键字？》经验，为你挑选了1个好方法。

我正在尝试确定我的收藏中某些类文档最受欢迎的关键字.假设域是"计算机科学"(当然,包括网络,计算机体系结构等),从文本中保留这些特定于域的关键字的最佳方法是什么？我尝试使用Wordnet但我不太清楚如何最好地使用它来提取这些信息.

考虑到事先我不知道所有特定于域的关键字这一事实,我是否可以使用任何众所周知的单词列表作为白名单？或者是否有任何良好的nlp /机器学习技术来识别特定领域的关键字？

1> Andrey Sboev..：

你需要一套庞大的训练文件.此集合的小子集(但仍然是大型文档集)应代表给定的域.使用nltk计算单词统计数据,考虑形态,过滤掉停用词.好的统计数据是TF*IDF,其大致是域子集中单词的多个事件除以包含整个集合中的单词的文档的数量.关键字是具有最大TF*IDF的单词.

推荐阅读

程序员
检查数组中是否包含除null之外的其他内容？

如何解决《检查数组中是否包含除null之外的其他内容？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我不能在数据模板中使用{x:Bind {RelativeSource Self}}？

如何解决《为什么我不能在数据模板中使用{x:Bind{RelativeSourceSelf}}？》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有ASP.NET身份3的JWT承载令牌

如何解决《具有ASP.NET身份3的JWT承载令牌》经验，为你挑选了0个好方法。 ... [详细]
程序员
函数声明语法:函数名前的括号内的东西

如何解决《函数声明语法:函数名前的括号内的东西》经验，为你挑选了2个好方法。 ... [详细]
程序员
Django反向导致url循环导入,为什么？

如何解决《Django反向导致url循环导入,为什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Sumiif（）合并单元格的条件总和

如何解决《使用Sumiif（）合并单元格的条件总和》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从AWS Lambda函数查询第三方JSON API

如何解决《如何从AWSLambda函数查询第三方JSONAPI》经验，为你挑选了1个好方法。 ... [详细]
程序员
可选的Promise API

如何解决《可选的PromiseAPI》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angularjs何时何地绑定事件

如何解决《Angularjs何时何地绑定事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
在JavaScript事件回调中绑定"this"的正确方法？

如何解决《在JavaScript事件回调中绑定"this"的正确方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Robolectric中测试文件创建

如何解决《在Robolectric中测试文件创建》经验，为你挑选了0个好方法。 ... [详细]
程序员
RuntimeError:针对API版本a编译的模块,但是这个版本的numpy在ubuntu中是9

如何解决《RuntimeError:针对API版本a编译的模块,但是这个版本的numpy在ubuntu中是9》经验，为你挑选了0个好方法。 ... [详细]
程序员
将angular指令添加到rails中的simple_form会破坏集合输入的选定选项

如何解决《将angular指令添加到rails中的simple_form会破坏集合输入的选定选项》经验，为你挑选了0个好方法。 ... [详细]
程序员
删除列表项单词后面的逗号

如何解决《删除列表项单词后面的逗号》经验，为你挑选了1个好方法。 ... [详细]
程序员
有谁真的知道如何解决这些错误？

如何解决《有谁真的知道如何解决这些错误？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Maven版本插件：更新插件

如何解决《Maven版本插件：更新插件》经验，为你挑选了0个好方法。 ... [详细]
程序员
lsof打印数字端口

如何解决《lsof打印数字端口》经验，为你挑选了1个好方法。 ... [详细]
程序员
打字稿类型转换不起作用

如何解决《打字稿类型转换不起作用》经验，为你挑选了2个好方法。 ... [详细]
程序员
解释PlayFramework 2中的测试工具之间的差异(WithApplication,WithServer,WithBrowser,InMemory等...)

如何解决《解释PlayFramework2中的测试工具之间的差异(WithApplication,WithServer,WithBrowser,InMemory等)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果它们具有相同的名称并且我无法修改其他文件,如何在其他C文件中使用具有相同名称的多个函数？

如何解决《如果它们具有相同的名称并且我无法修改其他文件,如何在其他C文件中使用具有相同名称的多个函数？》经验，为你挑选了1个好方法。 ... [详细]

凹凸曼00威威_694

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章