
本教程详细介绍了如何使用PHP的PDO扩展将CSV文件数据导入MySQL数据库。文章从建立数据库连接、处理CSV文件、构建预处理语句等方面逐步讲解,并特别指出并纠正了在PDO预处理语句中常见的参数占位符语法错误。此外,教程还提供了增强代码健壮性的最佳实践,包括事务管理、错误处理以及针对大文件的优化策略,旨在帮助开发者高效、安全地完成数据导入任务。
1. 引言:使用PHP导入CSV数据到MySQL
在web开发中,将外部数据(如csv文件)导入到数据库是常见的需求。php结合mysql数据库以及pdo(php data objects)扩展,提供了一种安全高效的方式来完成这项任务。pdo的预处理语句机制不仅可以防止sql注入攻击,还能提高重复执行相同sql语句的效率。本教程将引导您完成整个导入过程,并着重讲解一个在预处理语句中常犯的语法错误及其解决方案。
2. 数据库连接设置
首先,我们需要建立与MySQL数据库的连接。使用PDO连接数据库是推荐的做法,因为它提供了统一的API接口和强大的错误处理机制。
<?php
// 数据库连接参数
$dbHost = 'localhost'; // 数据库主机
$dbName = 'test'; // 数据库名
$dbChar = 'utf8mb4'; // 字符集,推荐utf8mb4以支持更广泛的字符
$dbUser = 'root'; // 数据库用户名
$dbPass = ''; // 数据库密码
try {
// 创建PDO实例
$pdo = new PDO(
"mysql:host=" . $dbHost . ";dbname=" . $dbName . ";charset=" . $dbChar,
$dbUser,
$dbPass,
[
PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION, // 设置错误模式为抛出异常
PDO::ATTR_DEFAULT_FETCH_MODE => PDO::FETCH_ASSOC, // 设置默认的查询结果获取模式
PDO::ATTR_EMULATE_PREPARES => false, // 禁用模拟预处理,使用真正的预处理语句
]
);
// 开启事务,确保数据导入的原子性
$pdo->beginTransaction();
} catch (PDOException $ex) {
// 捕获PDO连接或数据库操作异常
exit("数据库连接或操作失败: " . $ex->getMessage());
} catch (Exception $ex) {
// 捕获其他通用异常
exit("发生未知错误: " . $ex->getMessage());
}
// ... 后续CSV处理和数据导入逻辑
?>
注意事项:
- PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION:这是非常重要的设置,它会使PDO在遇到错误时抛出PDOException,便于我们捕获和处理。
- PDO::ATTR_EMULATE_PREPARES => false:禁用模拟预处理可以确保PDO将SQL语句和参数分开发送到数据库服务器,从而利用数据库自身的预处理功能,提高安全性和性能。
- $pdo->beginTransaction();:在开始导入大量数据前开启事务是最佳实践。如果导入过程中出现任何错误,可以回滚所有已执行的插入操作,保持数据一致性。
3. 处理CSV文件上传与读取
在PHP中,处理CSV文件通常涉及到文件上传和文件内容的读取。
<?php
// ... (数据库连接代码,如上所示)
// 假设文件通过HTML表单上传,表单input的name为"upcsv"
if (!isset($_FILES["upcsv"]) || $_FILES["upcsv"]["error"] !== UPLOAD_ERR_OK) {
exit("文件上传失败或未选择文件。请确保文件已成功上传。");
}
// 打开上传的CSV文件
$fh = fopen($_FILES["upcsv"]["tmp_name"], "r");
if ($fh === false) {
exit("无法打开上传的CSV文件。");
}
// ... 后续数据读取和插入逻辑
?>
关键函数 fgetcsv():fgetcsv() 函数用于从文件指针中读取一行并解析为CSV字段。它非常灵活,可以指定分隔符、Enclosure(包围符)和Escape(转义符)。
在示例CSV数据 BGYR002217;FK-066 中,字段之间使用的是分号(;)作为分隔符,而不是默认的逗号(,)。因此,在使用 fgetcsv() 时,必须明确指定分隔符。
// ... (文件打开代码)
// 准备SQL插入语句,并注意占位符的正确语法
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");
$rowCount = 0;
// 循环读取CSV文件的每一行
// 注意:fgetcsv的第三个参数是分隔符,这里指定为分号';'
while (($row = fgetcsv($fh, 0, ';')) !== false) {
// 简单的行数据校验:确保行有足够的元素
if (count($row) < 2) {
error_log("跳过无效CSV行 (元素不足): " . implode(',', $row));
continue; // 跳过此行并处理下一行
}
try {
// 执行预处理语句,将CSV行数据绑定到占位符
$stmt->execute([$row[0], $row[1]]);
$rowCount++;
} catch (PDOException $ex) {
// 记录插入失败的行和错误信息,可以选择继续或中断
error_log("插入数据失败,行内容: " . implode(',', $row) . " - 错误: " . $ex->getMessage());
// 如果希望在任何错误时都回滚并停止,可以取消注释以下两行
// $pdo->rollBack();
// exit("数据插入失败,已回滚所有操作: " . $ex->getMessage());
}
}
fclose($fh); // 关闭文件句柄
// ... 后续事务提交和完成信息
4. PDO预处理语句中的常见错误及纠正
原始代码中存在一个常见的语法错误:
立即学习“PHP免费学习笔记(深入)”;
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?;?)");
问题在于 VALUES (?;?)。在PDO的预处理语句中,问号 ? 是用于占位符的,它们之间不应该有其他字符(除非是命名占位符如 :name)。分号 ; 在SQL中通常表示语句的结束,在这里会破坏占位符的识别。
正确的语法应该是:
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");
每个问号代表一个独立的参数占位符,它们之间用逗号 , 分隔,就像SQL的 VALUES 子句中列值之间用逗号分隔一样。
5. 完整的导入脚本示例
结合上述所有部分,一个健壮的CSV导入脚本示例如下:
PDO::ERRMODE_EXCEPTION,
PDO::ATTR_DEFAULT_FETCH_MODE => PDO::FETCH_ASSOC,
PDO::ATTR_EMULATE_PREPARES => false,
]
);
$pdo->beginTransaction(); // 开启事务
// 2. 检查文件上传
if (!isset($_FILES["upcsv"]) || $_FILES["upcsv"]["error"] !== UPLOAD_ERR_OK) {
throw new Exception("文件上传失败或未选择文件。错误码: " . ($_FILES["upcsv"]["error"] ?? 'N/A'));
}
// 3. 打开上传的CSV文件
$fh = fopen($_FILES["upcsv"]["tmp_name"], "r");
if ($fh === false) {
throw new Exception("无法打开上传的CSV文件。");
}
// 4. 准备SQL插入语句 (注意:VALUES (?, ?) 是正确的语法)
// 假设数据库中有一个名为 'users' 的表,包含 'szam' 和 'forras_szam' 两列
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");
$rowCount = 0;
// 5. 循环读取CSV文件的每一行并插入数据
// 注意 fgetcsv 的第三个参数是分隔符,根据示例数据应为分号 ';'
while (($row = fgetcsv($fh, 0, ';')) !== false) {
// 简单的行数据校验:确保行有足够的元素
if (count($row) < 2) {
error_log("跳过无效CSV行 (元素不足或格式不正确): " . implode(';', $row));
continue;
}
try {
// 执行预处理语句,绑定CSV行数据
$stmt->execute([$row[0], $row[1]]);
$rowCount++;
} catch (PDOException $ex) {
// 记录错误,可以选择回滚并退出,或继续处理下一行
error_log("插入数据失败,行内容: " . implode(';', $row) . " - 错误: " . $ex->getMessage());
// 如果希望在遇到第一个错误时立即停止并回滚:
$pdo->rollBack();
exit("数据插入失败,已回滚所有操作: " . $ex->getMessage());
}
}
fclose($fh); // 关闭文件句柄
// 6. 提交事务
$pdo->commit();
echo "数据导入完成。共成功导入 " . $rowCount . " 条记录。";
} catch (PDOException $ex) {
// 捕获PDO相关的异常,并尝试回滚事务
if (isset($pdo) && $pdo->inTransaction()) {
$pdo->rollBack();
}
exit("数据库操作失败: " . $ex->getMessage());
} catch (Exception $ex) {
// 捕获其他通用异常
exit("操作失败: " . $ex->getMessage());
}
?>
为了让上述PHP脚本能够运行,您还需要一个简单的HTML表单来上传CSV文件:
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<title>CSV文件导入</title>
</head>
<body>
<h1>上传CSV文件导入到MySQL</h1>
<form action="import.php" method="post" enctype="multipart/form-data">
<label for="upcsv">选择CSV文件:</label>
<input type="file" name="upcsv" id="upcsv" accept=".csv">
<br><br>
<input type="submit" value="上传并导入" name="submit">
</form>
</body>
</html>
将上述HTML代码保存为 index.html,PHP代码保存为 import.php,确保它们在同一个目录下,并在您的Web服务器(如Apache或Nginx)上运行。
6. 进阶考虑与最佳实践
- 数据验证: 在实际应用中,您需要在 fgetcsv 读取数据后,对 $row 中的每个字段进行严格的验证(例如,数据类型、长度、格式等),以确保数据的完整性和正确性。
-
大型CSV文件: 对于非常大的CSV文件(例如,几十万甚至上百万行),PHP脚本可能会遇到内存限制或执行超时。在这种情况下,可以考虑以下替代方案:
- 分批处理: 逐行读取并插入,但每次提交一定数量的行(例如1000行)作为一个事务。
-
LOAD DATA INFILE: 这是MySQL提供的专门用于从文件高效导入数据的SQL语句。它通常比通过PHP逐行插入快得多,并且可以处理非常大的文件。缺点是需要文件在服务器上可访问,并且需要相应的MySQL权限。
LOAD DATA INFILE '/path/to/your/file.csv' INTO TABLE users FIELDS TERMINATED BY ';' -- 指定字段分隔符 ENCLOSED BY '' -- 如果字段没有被引号包围,则留空 LINES TERMINATED BY '/n' -- 行结束符,Windows可能是'/r/n' (szam, forras_szam); -- 指定列名
登录后复制您可以通过PHP执行这条SQL语句,但需要确保CSV文件位于MySQL服务器可以访问的路径,并且MySQL用户拥有 FILE 权限。
- 用户界面反馈: 在实际应用中,您应该向用户提供更友好的进度反馈和错误提示,而不是简单的 exit() 或 echo “DONE.”。
- 日志记录: 将错误和警告信息记录到日志文件(如 error_log())中,而不是直接输出到浏览器,这对于调试和生产环境的监控至关重要。
7. 总结
通过本文,您应该已经掌握了如何使用PHP PDO将CSV数据导入MySQL数据库,并了解了PDO预处理语句中占位符的正确用法。记住,在进行数据导入时,不仅要关注代码的功能性,更要注重其健壮性、安全性和性能,特别是通过事务管理、错误处理和选择合适的导入策略来应对不同规模的数据。
以上就是PHP PDO实现CSV文件导入MySQL:常见错误与最佳实践的详细内容,更多请关注php中文网其它相关文章!