42.

Linuxのfileコマンドの使い方|ファイルの種類・MIMEタイプを調べる

編集

Linuxのfileコマンドは、指定したファイルの種類(ファイルタイプ)を判定して表示するコマンドです。テキストか画像か実行ファイルかといった中身の正体を、拡張子ではなくファイルの内部データから調べられます。

この記事の要点
  • file は「そのファイルが何者か」を表示するコマンドで、基本の書き方は file ファイル名 です。
  • 判定は拡張子ではなく、ファイル先頭などに含まれるマジックナンバー(識別用の特徴的なバイト列)を手がかりに行われます。
  • -iMIMEタイプ-b でファイル名を省いた簡潔な表示、-z で圧縮ファイルの中身の種類を調べられます。
  • 複数ファイルやワイルドカードをまとめて渡せるため、拡張子のないファイルや正体不明のファイルの確認に便利です。
  • シンボリックリンクのリンク先の種類を知りたいときは -L を使います。

 

fileコマンドとは

file は、ファイルの種類を調べて表示するコマンドです。多くのLinuxディストリビューションに標準で用意されています。Windowsなどでは「.txt はテキスト、.jpg は画像」のように拡張子で種類を判断することが一般的ですが、Linuxでは拡張子に決まった意味を持たせない運用も多く、拡張子だけでは中身が分からない場面があります。

file コマンドは拡張子に頼らず、ファイルの中身を実際に読み取って種類を推定します。判定の主な手がかりになるのがマジックナンバーと呼ばれるデータです。多くのファイル形式は、先頭付近に「この形式である」ことを示す特徴的なバイト列を持っています。file はこの特徴を照合し、テキスト・画像・実行ファイル・圧縮ファイルなどを区別します。テキストファイルの場合は、含まれる文字コード(ASCIIやUTF-8など)も併せて表示されることがあります。

そのため、拡張子を変更したファイルや、拡張子が付いていないファイルでも、中身に基づいた判定結果を得られるのが特徴です。

基本的な使い方

もっとも基本的な使い方は、調べたいファイル名を引数に渡す形です。

$ file ファイル名

 

実行すると、「ファイル名: 種類」という形式で結果が表示されます。次の例では、ディレクトリやシンボリックリンクが判定されています。

$ file bin

bin: directory

 

$ file initrd.img

initrd.img: symbolic link to boot/initrd.img-4.18.0-17-generic

 

このように、ディレクトリは directory、シンボリックリンクは symbolic link to ~ のように、ファイル以外の種類も判定されます。

主なオプション

用途に応じて、表示形式や判定方法を変えるオプションが用意されています。よく使われるものを示します。

オプション 意味
-i (または --mime 種類をMIMEタイプ(例: text/plainimage/png)の形式で表示する。文字コード情報が付くこともある。
-b--brief 先頭のファイル名を省き、種類だけを簡潔に表示する。スクリプトで結果を扱うときに便利。
-z--uncompress 圧縮ファイルを展開したと仮定し、中身(圧縮されているデータ)の種類も併せて判定する。
-L--dereference シンボリックリンク自体ではなく、リンク先のファイルの種類を判定する。
-f 一覧ファイル 調べたいファイル名を1行ずつ書いたリストを読み込み、まとめて判定する。
--help 利用できるオプションの一覧(ヘルプ)を表示する。

 

複数のファイルを一度に調べたい場合は、ファイル名を並べて指定したり、ワイルドカードを使ったりできます。

# 複数ファイルをまとめて判定

$ file memo.txt photo.png run.sh

 

# カレントディレクトリのすべてのファイルを判定

$ file *

 

種類ごとの判定例

代表的なファイルを file で調べると、次のような結果が表示されます。実際の出力は環境やファイルの内容によって変わりますが、おおむね以下のような傾向になります。

# テキストファイル

$ file memo.txt

memo.txt: ASCII text

 

# PNG画像

$ file photo.png

photo.png: PNG image data, 1280 x 720, 8-bit/color RGBA, non-interlaced

 

# 実行ファイル(ELFバイナリ)

$ file /bin/ls

/bin/ls: ELF 64-bit LSB pie executable, x86-64, ...

 

# MIMEタイプで表示

$ file -i photo.png

photo.png: image/png; charset=binary

 

画像や実行ファイルでは、画像の縦横サイズやビット深度、実行ファイルのアーキテクチャといった詳しい情報まで表示されることがあります。

拡張子に頼らないことの利点

ファイル名の拡張子は、利用者が自由に付け替えられます。たとえば中身が画像のファイルに .txt という拡張子が付いていても、ファイル名だけ見れば「テキスト」と誤解しかねません。

file は中身を読み取って判定するため、こうした拡張子と中身の食い違いを見抜くのに役立ちます。次の例では、拡張子が .txt でも、中身がPNG画像であれば画像として判定されます。

$ file picture.txt

picture.txt: PNG image data, 1280 x 720, 8-bit/color RGBA, non-interlaced

 

拡張子のないファイルや、ダウンロードしたばかりで正体が分からないファイルの確認、シェルスクリプトでファイルの種類によって処理を分けたい場面などで活用できます。

使うときの注意点

注意したいポイント
  • 中身が空のファイルは判定の手がかりがないため、empty のように表示されます。
  • マジックナンバーに合致するパターンがない場合は、data のように「種類を特定できない汎用的なデータ」として扱われることがあります。表示はあくまで推定であり、必ずしも厳密な形式名とは限りません。
  • シンボリックリンクをそのまま指定すると、リンク自体(symbolic link to ~)が表示されます。リンク先の種類を知りたいときは -L を付けます。
  • 判定はファイルの中身に基づくため、拡張子が正しいかどうかの保証にはなりません。逆に、表示された種類が常に安全・正当なファイルであることを保証するものでもありません。

 

シンボリックリンクのリンク先を判定する例を示します。

# リンク自体を表示

$ file link-to-log

link-to-log: symbolic link to /var/log/syslog

 

# リンク先を判定

$ file -L link-to-log

link-to-log: ASCII text

 

よくある質問

Q. fileコマンドの判定結果はどのくらい正確ですか。
A. 多くの一般的な形式は、マジックナンバーをもとに高い精度で判定されます。ただし結果は推定であり、特徴的なパターンを持たないファイルや独自形式のファイルでは、data のように大まかな表示になったり、判定が一致しない場合もあります。重要な判断では、ほかの方法と併せて確認すると安心です。

Q. 拡張子を変えても種類を見抜けますか。
A. はい。file はファイル名ではなく中身を読み取って判定するため、拡張子を変更しても中身に応じた種類が表示されます。拡張子と実体の食い違いを確認する用途に向いています。

Q. 圧縮ファイルの中身の種類を知ることはできますか。
A. -z オプションを使うと、圧縮されている内側のデータについても種類の判定を試みます。圧縮形式そのものだけでなく、中に格納されたデータの種類を確認したいときに役立ちます。

編集
Post Share
子ページ

子ページはありません

同階層のページ
  1. ls ファイル/ディレクトリ一覧表示
  2. sudo ユーザー指定
  3. cron/crontab ジョブの自動実行と登録方法
  4. wget http通信によるファイルダウンロード
  5. rm ファイル/ディレクトリ削除
  6. pwd カレントディレクトリの表示
  7. cd ディレクトリの移動
  8. ./configure
  9. make
  10. make install
  11. unzip ファイルの解凍
  12. mv ファイル/ディレクトリの移動および名称変更
  13. mkdir ディレクトリの作成
  14. touch 空ファイルの新規作成
  15. vi テキストディタの使用
  16. find ファイル/ディレクトリ検索
  17. grep 文字列の検索
  18. tail ファイルの末尾表示
  19. curl HTTP通信によるリクエスト
  20. nslookup ドメインのIP解決
  21. apt update パッケージリストの情報を更新
  22. apt upgrade パッケージの更新
  23. ln リンク/ショートカットの作成と削除
  24. rsync ファイル/ディレクトリの同期
  25. ssh リモートとの暗号化通信
  26. scp sshを利用したファイルのコピー
  27. unzip zip ファイルを解凍する
  28. cp ファイル/ディレクトリのコピー
  29. diffファイルの差分抽出
  30. fdisk ハードディスクに対する操作
  31. lsblk デバイスをツリー状で表示する
  32. kill プロセスを終了させる
  33. zip ファイルやディレクトリをzip形式に圧縮する
  34. hostコマンド
  35. chmod 権限の変更
  36. ip IPアドレスの確認
  37. chown コマンド(所有者の変更)
  38. chgrp ファイル/ディレクトリのグループ情報の変更
  39. nohupと'&' プログラムのバックグラウンド実行(ssh接続時)
  40. lsof 開いているポート番号の確認
  41. tar ファイルの圧縮と解凍
  42. file ファイルの種類を表示
  43. cat ファイルの中身を表示
  44. head ファイルの先頭部分を表示
  45. wc 行数/単語数/文字数を確認
  46. shutdown システムのシャットダウンと再起動
  47. ps プロセスの確認
  48. which コマンドの絶対パスを調べる
  49. yum RedHat系ディストリビューションの管理
  50. mount ファイルシステムのマウント
  51. 特定フォルダ以下の特定拡張子のファイルを再帰的に削除する方法
  52. 特定のフォルダとそのサブフォルダ内にある特定のファイル名のファイルを再帰的に削除
  53. sed テキスト処理用ストリームエディタ
  54. awk フィールド単位の柔軟なテキスト処理
  55. sort 行の並び替え
  56. uniq 重複行の除去・カウント
  57. cut 行から特定列を切り出し
  58. tr 文字の置換・削除
  59. less ページャでファイルを読む
  60. more 古典ページャ
  61. xargs 標準入力をコマンド引数に変換
  62. paste 複数ファイルを列方向に結合
  63. top プロセスの動的監視
  64. htop 強化版インタラクティブプロセス監視
  65. nice プロセスの優先度を指定して起動
  66. renice 実行中プロセスの優先度を変更
  67. jobs シェル管理下のジョブ一覧
  68. bg ジョブをバックグラウンドで実行
  69. fg バックグラウンドジョブをフォアグラウンドに
  70. killall プロセス名でまとめて終了
  71. pgrep プロセス名から PID を検索
  72. pkill プロセス名でシグナルを送信
  73. uname システム情報の表示
  74. uptime システム稼働時間とロードアベレージ
  75. free メモリ使用状況の表示
  76. df ディスク使用量 (ファイルシステム単位)
  77. du ディレクトリ・ファイル単位の使用量
  78. lscpu CPU 情報の表示
  79. lsmod 読み込み済みカーネルモジュール一覧
  80. lspci PCI デバイス一覧
  81. dmesg カーネルリングバッファの表示
  82. w ログイン中ユーザーと負荷の表示
  83. ping ホストへの到達性とラウンドトリップ確認
  84. traceroute ホストまでの経路を表示
  85. netstat ネットワーク接続・ルーティング表示 (旧式)
  86. ss netstat 後継、ソケット統計
  87. ifconfig ネットワークインターフェース表示・設定 (旧式)
  88. dig DNS リゾルバ問い合わせの定番
  89. route ルーティングテーブル表示 (旧式)
  90. iptables Linux パケットフィルタリング
  91. telnet TCP 接続診断・古典的リモートログイン
  92. arp ARP テーブルの表示・編集 (旧式)
  93. useradd ユーザーアカウントの作成
  94. usermod 既存ユーザーアカウントの変更
  95. userdel ユーザーアカウントの削除
  96. passwd パスワードの変更・管理
  97. groupadd グループの追加
  98. id ユーザーとグループの ID・所属を表示
  99. whoami 現在のユーザー名を表示
  100. su 別ユーザーに切り替え
  101. dnf Red Hat 系の次世代パッケージマネージャ (yum 後継)
  102. pacman Arch Linux のパッケージマネージャ
  103. echo 文字列・変数の出力
  104. export 環境変数の設定と継承
  105. alias コマンドの別名定義
  106. source / . スクリプトをカレントシェルで実行
  107. history コマンド履歴の表示・操作
  108. type コマンドの種別 (組み込み/関数/エイリアス/外部) を表示
  109. env 環境変数表示と一時設定でコマンド実行
  110. set シェルオプションと位置パラメータの操作
  111. unset 変数・関数の削除
  112. printf C 風書式付き出力
  113. systemctl systemd ユニットの管理
  114. service init.d 互換のサービス管理
  115. journalctl systemd ジャーナルログの参照
  116. crontab 定期実行ジョブの登録・編集
  117. at 指定時刻に 1 回だけコマンド実行
  118. umount ファイルシステムのアンマウント
  119. reboot システムを再起動
  120. halt システムを停止
  121. date 日付・時刻の表示と設定
  122. hostname ホスト名の表示・設定
  123. gzip ファイルを Deflate で圧縮
  124. gunzip gzip 圧縮ファイルの展開
  125. bzip2 高圧縮率の圧縮コマンド
  126. xz LZMA2 ベースの高圧縮コマンド
  127. zstd Facebook 製の高速圧縮コマンド
  128. dpkg Debian パッケージの低レベル操作
  129. rpm Red Hat パッケージの低レベル操作
  130. snap Canonical の sandbox パッケージマネージャ
  131. apt Debian/Ubuntu の高レベルパッケージマネージャ
  132. 7z 7-Zip コマンドラインツール

最近更新/作成されたページ