タイトル: CSV読み込み
SEOタイトル: PHP CSV 読み込み完全ガイド (fgetcsv/SplFileObject)
| この記事の要点 |
|
基本: fopen + fgetcsv
PHP 標準の最もシンプルな CSV 読み込み方法です。1 行ずつ配列として取得できます。
$handle = fopen('users.csv', 'r');
if ($handle === false) {
throw new RuntimeException('CSV を開けません');
}
while (($row = fgetcsv($handle)) !== false) {
// $row = ['1', '田中', 'tanaka@example.com'] のような数値添字配列
[$id, $name, $email] = $row;
echo "$id: $name <$email>\n";
}
fclose($handle);
ヘッダー行のスキップ + 連想配列化
$handle = fopen('users.csv', 'r');
// 1 行目をヘッダーとして取得
$header = fgetcsv($handle);
// ['id', 'name', 'email']
while (($row = fgetcsv($handle)) !== false) {
// ヘッダーと組み合わせて連想配列に
$data = array_combine($header, $row);
// ['id' => '1', 'name' => '田中', 'email' => 'tanaka@example.com']
echo $data['name'] . "\n";
}
fclose($handle);
SplFileObject (推奨)
SplFileObject は CSV をイテレータとして扱え、より OOP らしく書けます。
$file = new SplFileObject('users.csv', 'r');
$file->setFlags(
SplFileObject::READ_CSV // CSV としてパース
| SplFileObject::READ_AHEAD // 先読み(末尾空行回避)
| SplFileObject::SKIP_EMPTY // 空行スキップ
| SplFileObject::DROP_NEW_LINE // 改行除去
);
// 区切り文字 / 囲い文字を変更したい場合
$file->setCsvControl(',', '"', '\\');
foreach ($file as $row) {
if ($row === [null]) continue; // 空行
print_r($row);
}
str_getcsv (文字列から)
すでにメモリ上にある CSV 文字列をパースするには str_getcsv() を使います:
$line = '1,"田中, 太郎","tanaka@example.com"';
$row = str_getcsv($line);
// ['1', '田中, 太郎', 'tanaka@example.com']
// CSV 全体を行ごとにパース
$csv = "id,name\n1,田中\n2,佐藤";
$rows = array_map('str_getcsv', explode("\n", $csv));
Shift-JIS (SJIS-WIN) CSV を読む
Excel が日本語環境で保存した CSV はSJIS-WIN (CP932) エンコーディングが多く、PHP のデフォルト UTF-8 と齟齬します。
// 方法1: 読み込み時にストリームフィルタを噛ます
$handle = fopen('sjis.csv', 'r');
stream_filter_append($handle, 'convert.iconv.SJIS-WIN/UTF-8');
while (($row = fgetcsv($handle)) !== false) {
print_r($row); // UTF-8 で取得できる
}
fclose($handle);
// 方法2: 1 行ずつ手動変換
$handle = fopen('sjis.csv', 'r');
while (($row = fgetcsv($handle)) !== false) {
$row = array_map(
fn($v) => mb_convert_encoding($v, 'UTF-8', 'SJIS-win'),
$row
);
print_r($row);
}
fclose($handle);
// 方法3: setlocale 経由(fgetcsv が SJIS を理解できるよう)
setlocale(LC_ALL, 'ja_JP.SJIS');
BOM 除去
Excel の「CSV UTF-8」保存は先頭に BOM (EF BB BF, 3 バイト) が付きます。最初のカラム名が "\xEF\xBB\xBFid" のようになり、ヘッダー連想配列が壊れます。
function removeBom(string $s): string {
return preg_replace('/^\xEF\xBB\xBF/', '', $s);
}
// ヘッダー読み込み時に適用
$header = fgetcsv($handle);
$header[0] = removeBom($header[0]);
大ファイル向け: Generator パターン
100MB を超えるような CSV では全行をメモリに乗せず、generator で逐次処理します:
function readCsv(string $path): Generator
{
$handle = fopen($path, 'r');
try {
$header = fgetcsv($handle);
$header[0] = preg_replace('/^\xEF\xBB\xBF/', '', $header[0]);
while (($row = fgetcsv($handle)) !== false) {
if ($row === [null]) continue;
yield array_combine($header, $row);
}
} finally {
fclose($handle);
}
}
// 使用: 100 万行でもメモリ数 MB
foreach (readCsv('big.csv') as $i => $user) {
User::create($user);
if ($i % 1000 === 0) {
echo "$i 件処理\n";
}
}
Laravel: League/Csv パッケージ
Laravel エコシステムで最も使われている CSV ライブラリ:
composer require league/csvuse League\Csv\Reader;
$csv = Reader::createFromPath(storage_path('app/users.csv'), 'r');
$csv->setHeaderOffset(0); // 1 行目をヘッダーに
// Shift-JIS なら
$csv->addStreamFilter('convert.iconv.SJIS-WIN/UTF-8');
foreach ($csv->getRecords() as $record) {
// ['id' => '1', 'name' => '田中', ...]
User::create($record);
}
// 統計
echo count($csv) . " 行\n";
// クエリビルダ風フィルタ
use League\Csv\Statement;
$stmt = (new Statement())->where(fn($r) => (int)$r['age'] >= 20)
->limit(100);
foreach ($stmt->process($csv) as $r) {
// ...
}
よくあるトラブル
| 症状 | 原因 | 対処 |
|---|---|---|
| 日本語が文字化け | SJIS-WIN を UTF-8 で読んでいる | ストリームフィルタ or mb_convert_encoding |
| 1 列目のヘッダー名がおかしい | BOM が付いている | preg_replace('/^\xEF\xBB\xBF/', '', ...) |
| 改行 (CRLF) で列がずれる | セル内の \r\n を区切り扱い | ini_set('auto_detect_line_endings', '1') (PHP 8.1 まで) or SplFileObject 利用 |
| カンマを含むセルで列数が増える | クォート無し | Excel 経由で再保存 or 元データ修正 |
| 1 行目だけ読めない | BOM を含むファイルを file() で読んでいる | BOM 除去 or fgetcsv 利用 |
FAQ
Q: TSV (タブ区切り) を読みたい
A: fgetcsv($handle, 0, "\t") のように区切り文字を指定。SplFileObject なら setCsvControl("\t")。
Q: メモリエラーが出る
A: file() や file_get_contents() + explode はファイル全体をメモリに載せます。fgetcsv ループや generator に切り替えてください。
Q: PHP 8.4 で fgetcsv() の挙動が変わったと聞いた
A: PHP 8.4 で escape 引数のデフォルト変更があります。RFC 4180 準拠を期待するなら明示的に fgetcsv($h, 0, ",", '"', "") と空文字を渡すのが安全。