首页 > 文章列表 > 如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?

如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?

105 2025-02-16

如何精准匹配脚本标签中间的内容,即使标签属性中包含引号?

精准匹配脚本标签中间内容的正则表达式

给定这样的 php 文件:

<script src="static/js/jsencrypt.js?v=web_version"></script>
<script src="static/js/jquery.form.js?v=web_version"></script>
<script type="text/javascript">
    var a = 1;
    var b = 2;
</script>

我们希望通过正则表达式捕获到第三个 script 标签中间的内容:

    var a = 1;
    var b = 2;

优化后的正则表达式

对于这种情况下,我们遇到一个困难:脚本标签属性中可能包含引号,导致匹配不正确。为了解决这个问题,我们使用一个优化过的正则表达式:

/(&lt;scriptb([^&quot;&lt;&gt;]+|&quot;[^&quot;]*&quot;)*&gt;)([sS]*?)(&lt;/script&gt;)/g

正则表达式详解

  • (<scriptb([^"<>]+|"[^"]*")*>): 与 <script> 标签的开始部分匹配,包括所有属性。
  • ([^"<>]+|"[^"]*"): 允许引号内的属性值,[^"<>]+ 表示没有引号的属性,"[^"]*" 表示引号内的属性。
  • ([ss]*?): 捕获脚本标签中间的内容。[ss] 匹配任何字符,包括换行符和空格,*? 表示非贪婪匹配,得到最短匹配。
  • (</script>): 与 </script> 标签的结束部分匹配。
来源:1729997030