当前位置:  开发笔记 > 编程语言 > 正文

使用c#中的正则表达式突出显示单词列表

如何解决《使用c#中的正则表达式突出显示单词列表》经验,为你挑选了1个好方法。

我有一些包含缩写的网站内容.我有一个公认的网站缩写列表,以及他们的解释.我想创建一个正则表达式,这将允许我用一些标记替换内容中找到的所有已识别缩写.

例如:

内容:

This is just a little test of the memb to see if it gets picked up. 
Deb of course should also be caught here.

缩写:

memb = Member; deb = Debut; 

结果:

This is just a little test of the [a title="Member"]memb[/a] to see if it gets picked up. 
[a title="Debut"]Deb[/a] of course should also be caught here.

(这只是简单的示例标记).

谢谢.

编辑:

CraigD的答案几乎就在那里,但也有问题.我只想匹配整个单词.我还想保持每个单词被替换的正确大写,以便deb仍然是deb,并且Deb仍然是原始文本的Deb.例如,这个输入:

This is just a little test of the memb. 
And another memb, but not amemba. 
Deb of course should also be caught here.deb!

Tomalak.. 10

首先,您需要Regex.Escape()所有输入字符串.

然后你可以在字符串中查找它们,并用你想到的标记迭代地替换它们:

string abbr      = "memb";
string word      = "Member";
string pattern   = String.Format("\b{0}\b", Regex.Escape(abbr));
string substitue = String.Format("[a title=\"{0}\"]{1}[/a]", word, abbr);
string output    = Regex.Replace(input, pattern, substitue);

编辑:我问一个简单String.Replace()是不够 - 但我可以看到为什么正则表达式是可取的:你只能通过制作一个使用单词边界锚点的模式来使用它来强制执行"全字"替换.

您可以从所有转义输入字符串构建单个模式,如下所示:

\b(?:{abbr_1}|{abbr_2}|{abbr_3}|{abbr_n})\b

然后使用匹配评估程序找到正确的替换.这样您就可以避免多次迭代输入字符串.



1> Tomalak..:

首先,您需要Regex.Escape()所有输入字符串.

然后你可以在字符串中查找它们,并用你想到的标记迭代地替换它们:

string abbr      = "memb";
string word      = "Member";
string pattern   = String.Format("\b{0}\b", Regex.Escape(abbr));
string substitue = String.Format("[a title=\"{0}\"]{1}[/a]", word, abbr);
string output    = Regex.Replace(input, pattern, substitue);

编辑:我问一个简单String.Replace()是不够 - 但我可以看到为什么正则表达式是可取的:你只能通过制作一个使用单词边界锚点的模式来使用它来强制执行"全字"替换.

您可以从所有转义输入字符串构建单个模式,如下所示:

\b(?:{abbr_1}|{abbr_2}|{abbr_3}|{abbr_n})\b

然后使用匹配评估程序找到正确的替换.这样您就可以避免多次迭代输入字符串.

推荐阅读
无名有名我无名_593
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有