curl_multi_exec 可实现 PHP 多 URL 并发请求,需为每个 URL 独立初始化 cURL 句柄并加入 multi 句柄,通过循环调用 curl_multi_exec + curl_multi_select 驱动执行,响应体用 curl_multi_getcontent 获取,超时等选项须设在单个句柄上,并逐个检查 curl_errno 判定真实错误。

curl_multi_exec 一次性并发请求多个远程文件
PHP 原生 curl 单次只能处理一个连接,想同时下载或访问多个远程文件(比如图片、JSON 接口、CSS 资源),必须用 curl_multi_init 系列函数。它不是“自动组合”,而是手动管理一批 CURL 句柄,由 PHP 底层调度 I/O,比循环调用 curl_exec 快得多。
常见错误是直接复用同一个 $ch 句柄多次 curl_setopt,结果只有最后一个 URL 生效;或者忘了调用 curl_multi_remove_handle,导致句柄泄漏。
- 每个远程 URL 需独立调用
curl_init()创建句柄,再统一加入 multi 句柄 - 必须在
curl_multi_exec循环中检查CURLM_CALL_MULTI_PERFORM返回值,不能只跑一次 - 响应体要通过
curl_multi_getcontent($ch)获取,而不是curl_exec - 超时需设在单个句柄上(
curl_setopt($ch, CURLOPT_TIMEOUT, 5)),multi 层不接管超时逻辑
function fetchMultipleUrls(array $urls): array {
$multi = curl_multi_init();
$handles = [];
$responses = [];
foreach ($urls as $url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_multi_add_handle($multi, $ch);
$handles[] = $ch;
}
$running = null;
do {
curl_multi_exec($multi, $running);
curl_multi_select($multi, 0.1); // 防止忙等
} while ($running > 0);
foreach ($handles as $ch) {
$responses[] = [
'url' => curl_getinfo($ch, CURLINFO_EFFECTIVE_URL),
'http_code' => curl_getinfo($ch, CURLINFO_HTTP_CODE),
'body' => curl_multi_getcontent($ch),
];
curl_multi_remove_handle($multi, $ch);
curl_close($ch);
}
curl_multi_close($multi);
return $responses;
}
file_get_contents + stream_context_create 支持基础并发但不推荐
有人用 file_get_contents 配合 stream_context_create 设定超时和 header,误以为能“并发”。实际上它仍是同步阻塞——即使你开多个线程(PHP 不原生支持),也只是顺序执行。它的优势仅在于写法简单、适合单次小资源获取。
典型误用:把多个 file_get_contents 写在 foreach 里,以为加了 ignore_user_abort(true) 就能并行,其实只是让脚本不随 HTTP 连接断开而终止,I/O 本身仍串行。
立即学习“PHP免费学习笔记(深入)”;
-
file_get_contents无法控制 DNS 缓存、连接复用、HTTP/2,底层还是封装的 cURL 或 streams,但抽象层太厚,出错时难定位 - 若远程服务返回 404 或超时,
file_get_contents默认报Warning并返回false,不抛异常,容易漏判 - 不支持 POST body、cookie 持久化、自定义 TCP keepalive 等高级控制
curl_setopt_array 批量设置参数避免重复调用
每个 curl_init() 后如果逐个 curl_setopt,代码冗长且易漏。用 curl_setopt_array 一次性注入配置数组,更安全也更易维护。
注意:数组键必须是 CURLOPT_* 常量,不能是字符串名(如 'CURLOPT_URL');值类型要匹配,比如 CURLOPT_SSL_VERIFYPEER 必须是布尔值,传 "false" 字符串会导致 SSL 校验意外开启。
- 常用组合可抽成常量数组:
define('CURL_OPTS_BASIC', [CURLOPT_RETURNTRANSFER => true, CURLOPT_FOLLOWLOCATION => true]); - 敏感选项如
CURLOPT_USERPWD或CURLOPT_POSTFIELDS应动态注入,别硬编码进共享数组 -
CURLOPT_HEADER设为true会把响应头混进curl_multi_getcontent返回值里,解析时需手动分离
错误码和超时必须单独检查每个句柄
curl_multi_exec 只返回整体执行状态(如 CURLM_OK),不代表每个请求都成功。真正判断失败得查每个句柄的 curl_errno($ch) 和 curl_error($ch),否则 502、DNS 失败、SSL 握手超时都会被忽略。
典型现象:所有 http_code 都是 0,但 curl_errno 是 7(Failed to connect)或 28(Operation timed out),说明网络层已断开,根本没发出去。
- 不要只依赖
http_code >= 400判定失败——连接失败时http_code是 0 -
curl_getinfo($ch, CURLINFO_RESPONSE_CODE)和curl_getinfo($ch, CURLINFO_HTTP_CODE)是同义,但CURLINFO_HTTP_CODE更明确 - 调试阶段建议记录
curl_getinfo($ch, CURLINFO_REDIRECT_COUNT)和CURLINFO_TOTAL_TIME,排查重定向死循环或慢响应
实际用起来,curl_multi 的复杂度集中在句柄生命周期管理和错误归因上。多数人卡在“为什么有些请求没返回内容”,答案往往就藏在没调 curl_multi_getcontent,或忘了 curl_multi_remove_handle 导致后续句柄复用出错。
