首页 > 文章列表 > 优化正则表达式的运行时性能

优化正则表达式的运行时性能

162 2024-03-06
问题内容

大多数正则表达式在其生命周期中都是“恒定的”。使用全局正则表达式来加速执行是个好主意吗?例如:

func work() {
    r := regexp.mustcompile(`...`)
    if r.matchstring(...) {
        ...
    }
}

比较:

var r *regexp.Regexp

func work() {
    if r.MatchString(...) {
        ...
    }
}

func init() {
    r = regexp.MustCompile(`...`)
}

这两个版本有什么有意义的区别吗?

  1. 正则表达式编译的成本非常低,因此从 cpu 成本和垃圾收集角度来看,不值得使用全局正则表达式(假设 work() 被大量调用)
  2. 最好在适当的时候使用全局正则表达式。

以上哪项是正确的,或者答案不是简单的黑/白?


正确答案


如果您仅使用一次相同的正则表达式(例如“d+”)->,则不值得使用全局正则表达式。

如果你经常使用相同的正则表达式(例如“d+”)->,那么值得使用

func benchmark01(b *testing.b) {
    for i := 0; i < b.n; i++ {
        r := regexp.mustcompile(`d+`)
        r.matchstring("aaaaaaa123bbbbbbb")
    }
}

func benchmark02(b *testing.b) {
    r := regexp.mustcompile(`d+`)
    for i := 0; i < b.n; i++ {
        r.matchstring("aaaaaaa123bbbbbbb")
    }
}
Benchmark01
Benchmark01-4             886909              1361 ns/op
Benchmark02
Benchmark02-4            5368380               232.8 ns/op