首页　>　文章列表　>　如何用正则表达式排除HTML代码中中文加冒号的字符串？

如何用正则表达式排除HTML代码中中文加冒号的字符串？

131 2025-03-06

正则表达式：排除中文加冒号格式字符串

匹配 html 代码中两个 <td> 标签之间内容时，遇到中文加冒号的格式（如：“张无忌：”)，传统正则表达式会把这些内容也匹配到，导致结果不符合预期。

为了排除中文加冒号格式字符串，我们可以使用负向前瞻断言，即：preg_match_all('/<td>(?!.*[x{4e00}-x{9fa5}：]).*</td>/u', $input, $matches);

<td>: 匹配 <td> 标签开始符
(?!.*[x{4e00}-x{9fa5}：]).*: 负向前瞻断言，确保其后没有中文加冒号的子串
</td>: 匹配 <td> 标签结束符

示例：

$input = '<td&gt;我是张三分&lt;/td&gt;
<td&gt;张无忌: 你真的是张三分？&lt;/td&gt;';

preg_match_all('/&lt;td&gt;(?!.*[x{4e00}-x{9fa5}：]).*&lt;/td&gt;/u', $input, $matches);

print_r($matches[0]);

输出：

Array
(
    [0] => <td&gt;我是张三分&lt;/td&gt;
)

如你所见，符合条件的只有没有中文加冒号的字符串。

来源：1733134588

上一篇　如何有效查看电脑信息：全面指南下一篇　PHP正则表达式：如何匹配两个标签之间的内容且排除包含中文冒号的字符串？

本类最新

查看更多

如何用正则表达式排除HTML代码中中文加冒号的字符串？

本类最新

热门推荐

热门教程