同时匹配img标签中的src和alt的正则表达式

首发 PHP社区
QRI的头像

QRI

这人还不错哦!

做内容发布系统的时候,需要将发布的文章中的远程图片做本地缓存处理,那么这就涉及到使用正则表达式来匹配img标签中的src属性和alt属性等。

img标签中的属性顺序不固定,因此不能使用常见的顺序匹配,这里就需要一个兼容所有可能的正则表达式,具体请看下方代码。

$imgRegex='/<\s*img[\s\S]+?(?:src=[\'"]([\S\s]*?)[\'"]\s*|alt=[\'"]([\S\s]*?)[\'"]\s*|[a-z]+=[\'"][\S\s]*?[\'"]\s*)+[\s\S]*?>/i';

// 这里最重要的就是中间括号的非捕获部分。
// (?:src=[\'"]([\S\s]*?)[\'"]\s*|alt=[\'"]([\S\s]*?)[\'"]\s*|[a-z]+=[\'"][\S\s]*?[\'"]\s*)+
// 将src alt 列出来,同时将其他可能的属性也作为匹配
// src=[\'"]([\S\s]*?)[\'"]\s*
// alt=[\'"]([\S\s]*?)[\'"]\s*
// [a-z]+=[\'"][\S\s]*?[\'"]\s*

上面的正则表达式即可匹配无顺序的 img标签中的 src属性和alt属性

发布于 2019-11-17 02:02:14
阅读:1 0 2019-11-17
文章被以下专栏收录
PHP社区

PHP技术分享,干货分享

目录