为什么缓存的Regexp优于已编译的Regexp？

作者：手机用户2502851955 | 2023-09-01 10:52

如何解决《为什么缓存的Regexp优于已编译的Regexp？》经验，为你挑选了0个好方法。

这只是一个满足我好奇心的问题.但对我来说这很有意思.

我写了这个简单的小基准.它以随机顺序调用3个Regexp执行变体几千次:

基本上,我使用相同的模式,但以不同的方式.

没有任何你的普通方式RegexOptions.从.NET 2.0开始,这些不会被缓存.但是应该"缓存",因为它保存在一个非常全局的范围内而不是重置.

同 RegexOptions.Compiled

调用静态Regex.Match(pattern, input),它在.NET 2.0中得到缓存

这是代码:

static List Strings = new List();        
static string pattern = ".*_([0-9]+)\\.([^\\.])$";

static Regex Rex = new Regex(pattern);
static Regex RexCompiled = new Regex(pattern, RegexOptions.Compiled);

static Random Rand = new Random(123);

static Stopwatch S1 = new Stopwatch();
static Stopwatch S2 = new Stopwatch();
static Stopwatch S3 = new Stopwatch();

static void Main()
{
  int k = 0;
  int c = 0;
  int c1 = 0;
  int c2 = 0;
  int c3 = 0;

  for (int i = 0; i < 50; i++)
  {
    Strings.Add("file_"  + Rand.Next().ToString() + ".ext");
  }
  int m = 10000;
  for (int j = 0; j < m; j++)
  {
    c = Rand.Next(1, 4);

    if (c == 1)
    {
      c1++;
      k = 0;
      S1.Start();
      foreach (var item in Strings)
      {
        var m1 = Rex.Match(item);
        if (m1.Success) { k++; };
      }
      S1.Stop();
    }
    else if (c == 2)
    {
      c2++;
      k = 0;
      S2.Start();
      foreach (var item in Strings)
      {
        var m2 = RexCompiled.Match(item);
        if (m2.Success) { k++; };
      }
      S2.Stop();
    }
    else if (c == 3)
    {
      c3++;
      k = 0;
      S3.Start();
      foreach (var item in Strings)
      {
        var m3 = Regex.Match(item, pattern);
        if (m3.Success) { k++; };
      }
      S3.Stop();
    }
  }

  Console.WriteLine("c: {0}", c1);
  Console.WriteLine("Total milliseconds: " + (S1.Elapsed.TotalMilliseconds).ToString());
  Console.WriteLine("Adjusted milliseconds: " + (S1.Elapsed.TotalMilliseconds).ToString());

  Console.WriteLine("c: {0}", c2);
  Console.WriteLine("Total milliseconds: " + (S2.Elapsed.TotalMilliseconds).ToString());
  Console.WriteLine("Adjusted milliseconds: " + (S2.Elapsed.TotalMilliseconds*((float)c2/(float)c1)).ToString());

  Console.WriteLine("c: {0}", c3);
  Console.WriteLine("Total milliseconds: " + (S3.Elapsed.TotalMilliseconds).ToString());
  Console.WriteLine("Adjusted milliseconds: " + (S3.Elapsed.TotalMilliseconds*((float)c3/(float)c1)).ToString());
}

每次我称之为结果都是这样的:

    Not compiled and not automatically cached:
    Total milliseconds: 6185,2704
    Adjusted milliseconds: 6185,2704

    Compiled and not automatically cached:
    Total milliseconds: 2562,2519
    Adjusted milliseconds: 2551,56949184038

    Not compiled and automatically cached:
    Total milliseconds: 2378,823
    Adjusted milliseconds: 2336,3187176891

所以你有它.不多,但差异大约7-8%.

这不是唯一的谜.我无法解释为什么第一种方式会慢很多,因为它永远不会被重新评估,而是保存在一个全局静态变量中.

顺便说一句,这是在.Net 3.5和Mono 2.2上,它们表现完全相同.在Windows上.

那么,任何想法,为什么编译的变体甚至会落后？

EDIT1:

修复代码后,结果现在如下所示:

    Not compiled and not automatically cached:
    Total milliseconds: 6456,5711
    Adjusted milliseconds: 6456,5711

    Compiled and not automatically cached:
    Total milliseconds: 2668,9028
    Adjusted milliseconds: 2657,77574842168

    Not compiled and automatically cached:
    Total milliseconds: 6637,5472
    Adjusted milliseconds: 6518,94897724836

这几乎也淘汰了所有其他问题.

谢谢你的回答.

推荐阅读

程序员
从ec2 Linux AMI连接到RDS MySQL实例-找不到mysql命令

如何解决《从ec2LinuxAMI连接到RDSMySQL实例-找不到mysql命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
以编程方式重启app？

如何解决《以编程方式重启app？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS是否支持RDS Insance的自动扩展

如何解决《AWS是否支持RDSInsance的自动扩展》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于HTTP通信的出站通道适配器与出站网关

如何解决《用于HTTP通信的出站通道适配器与出站网关》经验，为你挑选了1个好方法。 ... [详细]
程序员
尽管驱动程序/客户端与服务器版本完全相同,但Spark中的java.util.concurrent.RejectedExecutionException

如何解决《尽管驱动程序/客户端与服务器版本完全相同,但Spark中的java.util.concurrent.RejectedExecutionException》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用过滤器的Android BLE设备扫描无效

如何解决《使用过滤器的AndroidBLE设备扫描无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
回调到notifyDataSetChanged

如何解决《回调到notifyDataSetChanged》经验，为你挑选了0个好方法。 ... [详细]
程序员
python类属性为pandas数据帧

如何解决《python类属性为pandas数据帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
即使BeanManager知道EJB,为什么还有WELD-001408

如何解决《即使BeanManager知道EJB,为什么还有WELD-001408》经验，为你挑选了0个好方法。 ... [详细]
程序员
np.vectorize给我IndexError：标量变量的无效索引

如何解决《np.vectorize给我IndexError：标量变量的无效索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用php取消环境变量？

如何解决《如何使用php取消环境变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android:Circular Drawable

如何解决《Android:CircularDrawable》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将csv转换为json网络图文件,以便与sigma.js一起显示

如何解决《如何将csv转换为json网络图文件,以便与sigma.js一起显示》经验，为你挑选了0个好方法。 ... [详细]
程序员
Linq查询将一个表行连接到另一个表多行

如何解决《Linq查询将一个表行连接到另一个表多行》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET 5:响应中的Access-Control-Allow-Origin

如何解决《ASP.NET5:响应中的Access-Control-Allow-Origin》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有一种简单的方法可以使Visual Studio 2015使用特定的ToolsVersion？

如何解决《是否有一种简单的方法可以使VisualStudio2015使用特定的ToolsVersion？》经验，为你挑选了1个好方法。 ... [详细]
程序员
保护PDF

如何解决《保护PDF》经验，为你挑选了0个好方法。 ... [详细]
程序员
属性不应返回数组

如何解决《属性不应返回数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用WITH（NOLOCK）的SQL Server内部联接

如何解决《使用WITH（NOLOCK）的SQLServer内部联接》经验，为你挑选了1个好方法。 ... [详细]
程序员
错误 - 无法完成符号执行:达到10000步的限制

如何解决《错误-无法完成符号执行:达到10000步的限制》经验，为你挑选了1个好方法。 ... [详细]

手机用户2502851955

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章