17赞

从Java中的字符串中删除所有非"单词字符",留下重音字符？

作者：跟我搞对象吧 | 2023-08-17 10:02

如何解决《从Java中的字符串中删除所有非"单词字符",留下重音字符？》经验，为你挑选了3个好方法。

显然,当我使用正则表达式时,Java的正则表达式将变音符号和其他特殊字符计为非"单词字符".

        "TESTÜTEST".replaceAll( "\\W", "" )

为我返回"TESTTEST".我想要的只是删除所有真正的非"单词字符".没有任何东西的任何方式做到这一点

         "[^A-Za-z0-9äöüÄÖÜßéèáàúùóò]"

只是意识到我忘记了ô？

1> Tim Pietzcke..：

使用[^\p{L}\p{Nd}]+- 这匹配既不是字母也不是(十进制)数字的所有(Unicode)字符.

在Java中:

String resultString = subjectString.replaceAll("[^\\p{L}\\p{Nd}]+", "");

编辑:

我改为\p{N},\p{Nd}因为前者也匹配一些数字符号,如¼; 后者没有.在regex101.com上查看.

Upvoting对常见的`\ W`问题非常有用的答案.

奇迹般有效!但不能取代'º','ª','¼'.因为我只有这个'º'我使用.replaceAll("[^ \\ p {L} \\ p {N}] |º",""); 关于如何删除其他人的任何建议？

2> Mena..：

当我碰到这个帖子时,我试图达到完全相反的目的.我知道它已经很老了,但这仍然是我的解决方案.您可以使用块,请参阅此处.在这种情况下,编译以下代码(使用正确的导入):

> String s = "äêìóblah"; 
> Pattern p = Pattern.compile("[\\p{InLatin-1Supplement}]+"); // this regex uses a block
> Matcher m = p.matcher(s);
> System.out.println(m.find());
> System.out.println(s.replaceAll(p.pattern(), "#"));

您应该看到以下输出:

真正

#blah

最好,

3> Stefan Haber..：

有时您不想简单地删除字符,只需删除重音符号即可.我提出了以下实用程序类,每当我需要在URL中包含String时,我在Java REST Web项目中使用它:

import java.text.Normalizer;
import java.text.Normalizer.Form;

import org.apache.commons.lang.StringUtils;

/**
 * Utility class for String manipulation.
 * 
 * @author Stefan Haberl
 */
public abstract class TextUtils {
    private static String[] searchList = { "Ä", "ä", "Ö", "ö", "Ü", "ü", "ß" };
    private static String[] replaceList = { "Ae", "ae", "Oe", "oe", "Ue", "ue",
            "sz" };

    /**
     * Normalizes a String by removing all accents to original 127 US-ASCII
     * characters. This method handles German umlauts and "sharp-s" correctly
     * 
     * @param s
     *            The String to normalize
     * @return The normalized String
     */
    public static String normalize(String s) {
        if (s == null)
            return null;

        String n = null;

        n = StringUtils.replaceEachRepeatedly(s, searchList, replaceList);
        n = Normalizer.normalize(n, Form.NFD).replaceAll("[^\\p{ASCII}]", "");

        return n;
    }

    /**
     * Returns a clean representation of a String which might be used safely
     * within an URL. Slugs are a more human friendly form of URL encoding a
     * String.
     * 
     * The method first normalizes a String, then converts it to lowercase and
     * removes ASCII characters, which might be problematic in URLs:
     * 

     * all whitespaces
     * 
dots ('.')
     * 
(semi-)colons (';' and ':')
     * 
equals ('=')
     * 
ampersands ('&')
     * 
slashes ('/')
     * 
angle brackets ('<' and '>')
     * 
     * 
     * @param s
     *            The String to slugify
     * @return The slugified String
     * @see #normalize(String)
     */
    public static String slugify(String s) {

        if (s == null)
            return null;

        String n = normalize(s);
        n = StringUtils.lowerCase(n);
        n = n.replaceAll("[\\s.:;&=<>/]", "");

        return n;
    }
}

作为德语演讲者,我也包括了对德语变音符号的正确处理 - 该列表应该易于扩展到其他语言.

HTH

编辑:请注意,将返回的String包含在URL中可能不安全.您至少应该对其进行HTML编码以防止XSS攻击.

推荐阅读

程序员
如果变量没有数据PHP,则隐藏输出

如何解决《如果变量没有数据PHP,则隐藏输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何选择列值为null的行？

如何解决《如何选择列值为null的行？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何保护使用Electron构建的商业应用？

如何解决《如何保护使用Electron构建的商业应用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.Net 5类库包中的EntityFramework命令？

如何解决《ASP.Net5类库包中的EntityFramework命令？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Bootstrap垂直书写

如何解决《Bootstrap垂直书写》经验，为你挑选了1个好方法。 ... [详细]
程序员
CSS3 - 特殊的边界半径

如何解决《CSS3-特殊的边界半径》经验，为你挑选了1个好方法。 ... [详细]
程序员
蓝鸟警告"承诺是在处理程序中创建的,但未从中返回"

如何解决《蓝鸟警告"承诺是在处理程序中创建的,但未从中返回"》经验，为你挑选了2个好方法。 ... [详细]
程序员
没有名为_cffi_backend的模块

如何解决《没有名为_cffi_backend的模块》经验，为你挑选了2个好方法。 ... [详细]
程序员
std :: future.get()有时会卡在os x中

如何解决《std::future.get()有时会卡在osx中》经验，为你挑选了0个好方法。 ... [详细]
程序员
两个相同的字符串可以是C#中的两个独立实例吗？

如何解决《两个相同的字符串可以是C#中的两个独立实例吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
需要多个系列的堆积柱形图

如何解决《需要多个系列的堆积柱形图》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法用gulp启动webpack-dev-server

如何解决《无法用gulp启动webpack-dev-server》经验，为你挑选了1个好方法。 ... [详细]
程序员
类应用程序(框架)如何工作？

如何解决《类应用程序(框架)如何工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Visual Studio代码中调试单元测试

如何解决《如何在VisualStudio代码中调试单元测试》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何正确使用python socket.settimeout（）

如何解决《如何正确使用pythonsocket.settimeout（）》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用JPA获取整个实体图

如何解决《如何使用JPA获取整个实体图》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Swift中,如何确定设备屏幕的物理尺寸？

如何解决《在Swift中,如何确定设备屏幕的物理尺寸？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在不将空值输出到输出数组的情况下拆分字符串

如何解决《如何在不将空值输出到输出数组的情况下拆分字符串》经验，为你挑选了2个好方法。 ... [详细]
程序员
Virtualbox无法从GPT物理分区启动guest虚拟机

如何解决《Virtualbox无法从GPT物理分区启动guest虚拟机》经验，为你挑选了1个好方法。 ... [详细]
程序员
下载视频和播放

如何解决《下载视频和播放》经验，为你挑选了2个好方法。 ... [详细]

跟我搞对象吧

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章