2024-12-02

PHP HTML过滤:如何高效移除HTML标签中不需要的属性?

php html过滤:如何高效移除html标签中不需要的属性?

在编写 php 中用于过滤 html 的函数时,需要从 html 标签中提取特定的属性,如 style、class、href、target 和 alt。为了实现这一目标,我们可以使用正则表达式来查找匹配的标签并只保留所需的属性。

此前,您提供的代码使用了正则表达式来匹配属性,但并未能够正确提取所需的属性。以下是修改后的正则表达式代码:

$re = '/onw+=(['"]).*?/m';
登录后复制

这个正则表达式匹配所有以 “on” 开头的属性,并提取其属性值,将其保存在捕获组中。

接下来,利用 preg_replace() 函数替换匹配项:

立即学习PHP免费学习笔记(深入)”;

$subst = '';

$result = preg_replace($re, $subst, $str);
登录后复制

将匹配的属性值替换为空字符串,从而只保留所需的属性。

应用修改后的代码后,输出结果如下:

<strong class="123" style="white-space: normal;">&nbsp</strong><div class="ccc">aaaaa</div>
<p style="white-space: normal;">bbbbb</p>
<strong class="123" style="white-space: normal;">12313123&nbsp</strong>
<strong>eeeeee&nbsp</strong><a href="http://www.xxx.com" target="_blank" class="aaaa">链接链接</a><p>ffff</p>
登录后复制

正如你所见,不需要的属性(如 onload)已被删除,只保留了所需的属性。

以上就是PHP HTML过滤:如何高效移除HTML标签中不需要的属性?的详细内容,更多请关注php中文网其它相关文章!

https://www.php.cn/faq/1123528.html

发表回复

Your email address will not be published. Required fields are marked *