2.

テキスト・ドキュメント形式一覧 — .txt .md .pdf .docx .xlsx .csv の使い分け

編集
この記事の要点
  • テキスト・ドキュメント系: 人間が読む文書ファイル全般
  • プレーン (.txt .md) / オフィス (.docx .xlsx .pptx) / 表計算 (.csv .tsv) / 携行可能 (.pdf .rtf) の 4 系統
  • 文字コード改行コードが互換性の最大の落とし穴。UTF-8 (BOM 無し) + LF が現代の事実標準
  • Office Open XML (.docx 等) は実体が ZIP + XML。unzip で中身を確認できる
  • PDF は固定レイアウト用、Markdown は流動レイアウト用と使い分ける

このカテゴリについて

テキスト・ドキュメント系は、人間が読むことを前提とした文書ファイルの総称です。プレーンテキスト(.txt .md)のように文字だけのものから、書式情報を持つ .docx .pdf、表計算の .csv .xlsx まで幅広く含みます。

このジャンルは文字コード(character encoding)改行コードの罠が多く、UTF-8 / Shift-JIS / EUC-JP / CRLF / LF / CR の組み合わせで文字化けや差分汚染が頻発します。現代では UTF-8(BOM 無し)+ LF が事実上の標準ですが、Excel が出力する CSV は依然 Shift-JIS + CRLF だったり、古い Windows アプリは BOM 必須だったりと、業務では場面ごとの判断が必要です。

テキスト・ドキュメント形式で扱う主な拡張子

拡張子概要
.txtプレーンテキスト。最もシンプルだが文字コード・改行で揉める
.mdMarkdown。GitHub / Qiita / Zenn など開発ドキュメントの主流
.pdfPortable Document Format。固定レイアウト印刷の事実標準
.docxMicrosoft Word。実体は ZIP + XML(Office Open XML)
.xlsxMicrosoft Excel。同じく Office Open XML
.pptxMicrosoft PowerPoint。同じく Office Open XML
.csvComma-Separated Values。区切りはカンマ、引用符はダブルクォート
.tsvTab-Separated Values。タブ区切り。CSV より引用符問題が少ない
.rtfRich Text Format。Microsoft が策定した可搬性高い書式付きテキスト
.odt / .ods / .odpOpenDocument。LibreOffice / OpenOffice の標準

用途別の使い分け

目的推奨形式理由
印刷・配布(レイアウト固定).pdf環境依存せず同じ見た目で表示できる
共同編集.docx / Google Docs変更履歴・コメント・同時編集対応
開発ドキュメント.mdGit で diff が見やすい、自動ビルド可能
システム間のデータ受け渡し.csv / .tsv軽量、ほぼすべてのツールで読める
長期保存・アーカイブ.pdf/AISO 19005 標準、長期再現性が保証される
テンプレート配布.rtf / .docxOS 標準ツールで開ける

関連カテゴリ・記事

編集
Post Share
子ページ
  1. PDF(.pdf)
  2. CSV(.csv)
  3. Markdown(.md)
  4. TXT(.txt)
  5. DOCX(.docx)
  6. XLSX(.xlsx)
  7. PPTX(.pptx)
  8. TSV(.tsv)
  9. RTF(.rtf)
  10. ODT / ODS / ODP(.odt / .ods / .odp)
同階層のページ
  1. ファイル拡張子とは
  2. テキスト・ドキュメント形式
  3. 画像形式
  4. 音声・動画形式
  5. アーカイブ・圧縮形式
  6. 実行ファイル・パッケージ
  7. プログラミング・スクリプト
  8. Web・データ・設定
  9. データベース・データ交換
  10. フォント
  11. システム・仮想化

最近更新/作成されたページ