14赞

当前位置: 开发笔记 > 编程语言 > 正文

除非在引号中,否则正则表达式将在空格上分割

作者：低调pasta_730 | 2023-08-30 16:11

如何解决《除非在引号中,否则正则表达式将在空格上分割》经验，为你挑选了5个好方法。

我想使用.Net Regex.Split方法将此输入字符串拆分为数组.它必须在空格上拆分,除非它包含在引号中.

输入:这是"我的字符串"它有"六个匹配"

预期产量:

这里

是

我的字符串

它

具有

六场比赛

我需要什么样的模式？我还需要指定任何RegexOptions吗？

1> Bartek Szaba..：

无需选项

正则表达式:

\w+|"[\w\s]*"

C#:

Regex regex = new Regex(@"\w+|""[\w\s]*""");

或者,如果您需要排除"字符:

    Regex
        .Matches(input, @"(?\w+)|\""(?[\w\s]*)""")
        .Cast()
        .Select(m => m.Groups["match"].Value)
        .ToList()
        .ForEach(s => Console.WriteLine(s));

如果有人感兴趣,这是Bartek正则表达式的修改版本,适用于非单词字符(例如句号,逗号和括号):[^\s"] + |"[^"]*"

+1使用命名组排除引号_transparently_.

我明白了:`([^\s]*"[^"] +"[^\s]*)| [^"]？\ w + [^"]？现在唯一的问题是它没有在Javascript工作:/但这是offtopic在这里.

如果字符串可以包含引号,如"某事物","其他东西",该怎么办？

2> Timothy Walt..：

Lieven的解决方案大部分都在那里,正如他在评论中所述,这只是将结局改为Bartek解决方案的问题.最终结果是以下工作regEx:

(?<=")\w[\w\s]*(?=")|\w+|"[\w\s]*"

输入:这是"我的字符串"它有"六个匹配"

输出:

这里

是

"我的字符串"

它

具有

"六场比赛"

不幸的是,它包括引号.如果您改为使用以下内容:

(("((?.*?)(?[\w]+))(\s)*)

并明确捕获"令牌"匹配,如下所示:

    RegexOptions options = RegexOptions.None;
    Regex regex = new Regex( @"((""((?.*?)(?[\w]+))(\s)*)", options );
    string input = @"   Here is ""my string"" it has   "" six  matches""   ";
    var result = (from Match m in regex.Matches( input ) 
                  where m.Groups[ "token" ].Success
                  select m.Groups[ "token" ].Value).ToList();

    for ( int i = 0; i < result.Count(); i++ )
    {
        Debug.WriteLine( string.Format( "Token[{0}]: '{1}'", i, result[ i ] ) );
    }

调试输出:

Token[0]: 'Here'
Token[1]: 'is'
Token[2]: 'my string'
Token[3]: 'it'
Token[4]: 'has'
Token[5]: ' six  matches'

3> Richard Shep..：

最佳答案对我来说并不适用.我试图用空格分割这种字符串,但它看起来像是分裂点('.').

"the lib.lib" "another lib".lib

我知道问题是关于正则表达式,但我最终编写了一个非正则表达式函数来执行此操作:

    /// 
    /// Splits the string passed in by the delimiters passed in.
    /// Quoted sections are not split, and all tokens have whitespace
    /// trimmed from the start and end.
    public static List split(string stringToSplit, params char[] delimiters)
    {
        List results = new List();

        bool inQuote = false;
        StringBuilder currentToken = new StringBuilder();
        for (int index = 0; index < stringToSplit.Length; ++index)
        {
            char currentCharacter = stringToSplit[index];
            if (currentCharacter == '"')
            {
                // When we see a ", we need to decide whether we are
                // at the start or send of a quoted section...
                inQuote = !inQuote;
            }
            else if (delimiters.Contains(currentCharacter) && inQuote == false)
            {
                // We've come to the end of a token, so we find the token,
                // trim it and add it to the collection of results...
                string result = currentToken.ToString().Trim();
                if (result != "") results.Add(result);

                // We start a new token...
                currentToken = new StringBuilder();
            }
            else
            {
                // We've got a 'normal' character, so we add it to
                // the curent token...
                currentToken.Append(currentCharacter);
            }
        }

        // We've come to the end of the string, so we add the last token...
        string lastResult = currentToken.ToString().Trim();
        if (lastResult != "") results.Add(lastResult);

        return results;
    }

我希望这个答案不被视为主题,因为它是一个非正则表达式函数.我在寻找更一般的主题时找到了这个问题,该主题是如何在保留引号的同时拆分字符串,而不是关于正则表达式的更具体的问题.

4> Boinst..：

我正在使用Bartek Szabat的答案,但我需要在我的代币中捕获的不仅仅是"\ w"字符.为了解决这个问题,我略微修改了他的正则表达式,类似于Grzenio的回答:

Regular Expression: (?[^\s"]+)|(?"[^"]*")

C# String:          (?[^\\s\"]+)|(?\"[^\"]*\")

Bartek的代码(返回标记被删除的封闭引号)变为:

Regex
        .Matches(input, "(?[^\\s\"]+)|(?\"[^\"]*\")")
        .Cast()
        .Select(m => m.Groups["match"].Value)
        .ToList()
        .ForEach(s => Console.WriteLine(s));

5> sttaq..：

我发现这个答案中的正则表达式非常有用.要使它在C#中工作,您必须使用MatchCollection类.

//need to escape \s
string pattern = "[^\\s\"']+|\"([^\"]*)\"|'([^']*)'";

MatchCollection parsedStrings = Regex.Matches(line, pattern);

for (int i = 0; i < parsedStrings.Count; i++)
{
    //print parsed strings
    Console.Write(parsedStrings[i].Value + " ");
}
Console.WriteLine();

推荐阅读

程序员
Postgres 9.4中JSON - > JSONB列转换的速度大致有多快

如何解决《Postgres9.4中JSON->JSONB列转换的速度大致有多快》经验，为你挑选了1个好方法。 ... [详细]
程序员
Webpack和字体:模块解析失败

如何解决《Webpack和字体:模块解析失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
xamarin表单错误Droid.Resource不包含字符串的定义

如何解决《xamarin表单错误Droid.Resource不包含字符串的定义》经验，为你挑选了1个好方法。 ... [详细]
程序员
对于Lollipop及以上的仪器测试,"没有测试结果"

如何解决《对于Lollipop及以上的仪器测试,"没有测试结果"》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何保存我的应用设置？

如何解决《如何保存我的应用设置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET 5 RC1-Final中不存在UseWindowsAzureActiveDirectoryBearerAuthentication

如何解决《ASP.NET5RC1-Final中不存在UseWindowsAzureActiveDirectoryBearerAuthentication》经验，为你挑选了1个好方法。 ... [详细]
程序员
GCC specs文件:如何获取安装路径

如何解决《GCCspecs文件:如何获取安装路径》经验，为你挑选了0个好方法。 ... [详细]
程序员
禁用拼写检查但保留建议

如何解决《禁用拼写检查但保留建议》经验，为你挑选了0个好方法。 ... [详细]
程序员
将SVG转换为PNG,将应用的图像作为svg元素的背景

如何解决《将SVG转换为PNG,将应用的图像作为svg元素的背景》经验，为你挑选了1个好方法。 ... [详细]
程序员
mmap系统调用中MAP_ANONYMOUS标志的用途是什么？

如何解决《mmap系统调用中MAP_ANONYMOUS标志的用途是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
当我尝试对列表进行排序时,我得到一个错误'dict'对象没有属性

如何解决《当我尝试对列表进行排序时,我得到一个错误'dict'对象没有属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Windows 10 UWP应用程序中播放(MIDI)声音？

如何解决《如何在Windows10UWP应用程序中播放(MIDI)声音？》经验，为你挑选了0个好方法。 ... [详细]
程序员
要字符串的字符串列表

如何解决《要字符串的字符串列表》经验，为你挑选了1个好方法。 ... [详细]
程序员
JUnit assertEquals失败

如何解决《JUnitassertEquals失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
在spark中访问嵌套数据

如何解决《在spark中访问嵌套数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除&害羞; 元素中的(软连字符)实体

如何解决《删除&害羞;元素中的(软连字符)实体》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何多次选择相同的输入[selectize.js]？

如何解决《如何多次选择相同的输入[selectize.js]？》经验，为你挑选了0个好方法。 ... [详细]
程序员
RecyclerView滚动到smoothScrollToPosition(0)后结束

如何解决《RecyclerView滚动到smoothScrollToPosition(0)后结束》经验，为你挑选了0个好方法。 ... [详细]
程序员
父控制器上的调用方法？

如何解决《父控制器上的调用方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从锚链接中删除click事件？

如何解决《如何从锚链接中删除click事件？》经验，为你挑选了1个好方法。 ... [详细]

低调pasta_730

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章