从文本文件中提取单词

作者：Life一切安好 | 2023-09-03 09:24

如何解决《从文本文件中提取单词》经验，为你挑选了1个好方法。

假设您有一个类似这样的文本文件:http: //www.gutenberg.org/files/17921/17921-8.txt

有没有人有一个好的算法或开源代码从文本文件中提取单词？如何获取所有单词,同时避免使用特殊字符,并保留"它是"等内容......

我在Java工作.谢谢

1> Tomalak..：

这听起来像是正则表达式的正确工作.这里有一些Java代码可以为您提供一个想法,以防您不知道如何开始:

String input = "Input text, with words, punctuation, etc. Well, it's rather short.";
Pattern p = Pattern.compile("[\\w']+");
Matcher m = p.matcher(input);

while ( m.find() ) {
    System.out.println(input.substring(m.start(), m.end()));
}

该模式[\w']+多次匹配所有单词字符和撇号.示例字符串将逐字打印.查看Java Pattern类文档以阅读更多内容.

推荐阅读

程序员
每次与存储库同步后,IntelliJ都会继续询问"Setup Scala SDK"

如何解决《每次与存储库同步后,IntelliJ都会继续询问"SetupScalaSDK"》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android中Abstract类的最佳示例

如何解决《Android中Abstract类的最佳示例》经验，为你挑选了3个好方法。 ... [详细]
程序员
Android TextInputLayout未显示错误

如何解决《AndroidTextInputLayout未显示错误》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用HTML/CSS调整动画GIF的大小？

如何解决《如何使用HTML/CSS调整动画GIF的大小？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在<angular2 beta 0 app中生成的<undefined> html标记

如何解决《在<angular2beta0app中生成的<undefined>html标记》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不应在Symfony中使用绝对路径常量__DIR__和__FILE__

如何解决《为什么不应在Symfony中使用绝对路径常量__DIR__和__FILE__》经验，为你挑选了2个好方法。 ... [详细]
程序员
两个256位整数的按位xor

如何解决《两个256位整数的按位xor》经验，为你挑选了1个好方法。 ... [详细]
程序员
typedef持续多长时间？

如何解决《typedef持续多长时间？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular重定向到登录页面

如何解决《Angular重定向到登录页面》经验，为你挑选了4个好方法。 ... [详细]
程序员
扩展两个方向的范围

如何解决《扩展两个方向的范围》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用pthread_create创建的线程的输出未打印

如何解决《使用pthread_create创建的线程的输出未打印》经验，为你挑选了1个好方法。 ... [详细]
程序员
Emacs + Magit-垂直怪

如何解决《Emacs+Magit-垂直怪》经验，为你挑选了0个好方法。 ... [详细]
程序员
在循环中执行网络呼叫后,同一项目被删除两次

如何解决《在循环中执行网络呼叫后,同一项目被删除两次》经验，为你挑选了0个好方法。 ... [详细]
程序员
将RSS pubdate解析为DateTime

如何解决《将RSSpubdate解析为DateTime》经验，为你挑选了1个好方法。 ... [详细]
程序员
MVVM在点击时更改网格的背景颜色

如何解决《MVVM在点击时更改网格的背景颜色》经验，为你挑选了0个好方法。 ... [详细]
程序员
将Android库(aar)发布到Bintray,并选择其他风味

如何解决《将Android库(aar)发布到Bintray,并选择其他风味》经验，为你挑选了2个好方法。 ... [详细]
程序员
从项目单击打开片段

如何解决《从项目单击打开片段》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们如何将变量(字符串)传递给xpath包含函数？

如何解决《我们如何将变量(字符串)传递给xpath包含函数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java正则表达式返回完整字符串而不是捕获

如何解决《Java正则表达式返回完整字符串而不是捕获》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么$('.classname')&document.getElementsByClassName('classname')返回不同的东西？

如何解决《为什么$('.classname')&document.getElementsByClassName('classname')返回不同的东西？》经验，为你挑选了1个好方法。 ... [详细]

Life一切安好

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章