php调用听书插件怎么对接语音合成接口_php对接听书语音合成法【联动】

PHP调用语音合成接口需先确认服务商是否提供HTTP API,再按鉴权、参数、格式等规范调用;百度TTS须先获取access_token,用cURL发送GET请求并校验MP3魔数;音频应存文件返回URL,避免直接输出;需缓存token和音频,且缓存key须包含全部参数。

php调用听书插件怎么对接语音合成接口_php对接听书语音合成法【联动】

PHP 调用语音合成接口前,先确认服务商是否提供 HTTP API

绝大多数听书类插件(如「讯飞听见」「百度语音合成 TTS」「阿里云智能语音交互」)不直接提供 PHP 插件,而是暴露标准 RESTful 接口。所谓“对接听书插件”,本质是 PHP 后端调用其 TTS 服务的 /v1/tts 或类似路径的 HTTPS 接口。如果插件文档里没写明 API 地址、鉴权方式、参数格式,基本可以判定它不支持外部调用——别硬连。

常见错误现象:curl_exec() returns false401 Unauthorized400 Invalid parameter,八成是因为没读清服务商的签名规则或 token 过期。

  • 必须检查服务商是否要求 Authorization 请求头(如 Bearer xxxAPPCODE xxx
  • 注意请求方法:百度用 POST,讯飞 WebAPI 用 POST + WebSocket 长连接,阿里云部分接口需 GET 签名后拼 URL
  • 音频格式(audio_format)务必与后端接收逻辑匹配,比如传 mp3 却用 file_get_contents() 直接 echo,浏览器可能无法播放

用 cURL 发起带鉴权的 TTS 请求(以百度语音合成为例)

百度 TTS 需要 access_token,得先用 client_idclient_secret 换取,再调用合成接口。不能跳过 token 获取这步——很多开发者卡在这里。

function baiduTts($text, $token) {
    $url = 'https://tsn.baidu.com/text2audio';
    $data = [
        'tex' => urlencode($text),
        'tok' => $token,
        'cuid' => 'php-server-123',
        'ctp' => 1,
        'lan' => 'zh',
        'per' => 1, // 普通女声
        'aue' => 6, // mp3 格式
    ];
    $query = http_build_query($data);
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url . '?' . $query);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
    $response = curl_exec($ch);
    $httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
    curl_close($ch);
    if ($httpCode === 200 && substr($response, 0, 2) === 'PK') {
        return $response; // 返回的是 MP3 二进制流
    }
    throw new Exception("TTS failed: HTTP {$httpCode}, response: " . substr($response, 0, 200));
}

关键点:curl_setopt($ch, CURLOPT_BINARYTRANSFER, true) 必须设,否则 MP3 流会被截断或乱码;substr($response, 0, 2) === 'PK' 是快速校验是否返回了合法 ZIP/MP3(百度响应头有时不规范,靠文件魔数比靠 Content-Type 更稳)。

立即学习PHP免费学习笔记(深入)”;

NeuralText

NeuralText

Neural Text是一个使用机器学习自动生成文本的平台

下载

把合成结果存为文件并返回前端播放地址

别在接口里直接 echo $audioData 给前端——这样没法控制缓存、不支持断点续传、CDN 也无法加速。应该保存到可公开访问的目录,返回 URL。

  • 生成唯一文件名:用 md5($text . $voice . time()),避免中文文本导致路径问题
  • 存储路径必须在 Web 根目录下(如 /var/www/html/audio/),且 PHP 有写权限
  • 返回前检查 file_put_contents() 是否成功,失败时抛异常而不是静默忽略
  • 前端用 ,不要用 base64 嵌入(大段文本转语音后 MP3 往往 >500KB)

示例保存逻辑:

$filename = '/var/www/html/audio/' . md5($text . 'baidu_female') . '.mp3';
if (file_put_contents($filename, $audioData) === false) {
    throw new Exception("Failed to write audio file: {$filename}");
}
echo json_encode(['url' => 'https://yoursite.com/audio/' . basename($filename)]);

并发高时要注意 token 复用和音频缓存

百度的 access_token 有效期 30 分钟,但每秒调用量有限(免费版约 5 QPS)。如果每次请求都重新获取 token,很快触发限流;如果完全不缓存音频,同一段文字反复合成浪费资源又拖慢响应。

  • apcu_store() 或 Redis 缓存 token,键名为 baidu_access_token,过期时间设为 1800 秒
  • 对相同 $text + $voice + $speed 组合做音频文件级缓存,先查文件是否存在再合成
  • 注意清理:定期用 find /var/www/html/audio -name "*.mp3" -mmin +1440 -delete 清理 24 小时前的文件(加到 crontab)

最易被忽略的一点:不同用户提交相同文字,但用了不同语速/音色参数,却共用一个缓存 key——结果张三选了男声,李四听到却是女声。参数必须完整参与哈希计算。

https://www.php.cn/faq/1978691.html

发表回复

Your email address will not be published. Required fields are marked *