ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
本稿は ONNX Runtime (ONNX ランタイム) に関する記事です。
| この記事の要点 |
|---|
|
ONNX と ONNX Runtime の関係
| 名前 | 指すもの |
|---|---|
| ONNX (Open Neural Network Exchange) | モデルの中間表現 (フォーマット)。.onnx 拡張子 |
| ONNX Runtime (ORT) | .onnx モデルを実行する推論ランタイム。Microsoft が中心に開発 |
| ONNX 仕様 | 演算子セット (Opset) と型の標準。バージョンで対応演算子が変わる |
| ORT Training | 推論だけでなく学習もサポート(限定的) |
| ONNX Runtime Web | ブラウザ上で WASM / WebGL / WebGPU 実行 |
| ONNX Runtime Mobile | iOS / Android 向け軽量ビルド |
ONNX Runtime の主な特徴
- マルチプラットフォーム — Windows / Linux / macOS / iOS / Android / Web
- マルチ言語 SDK — Python / C# / C++ / Java / JavaScript / Rust 等
- Execution Provider (EP) による高速化 — CUDA、TensorRT、ROCm、CoreML、DirectML、OpenVINO、QNN 等を後付け
- グラフ最適化 — 演算子融合・定数畳込みなどで PyTorch の eager より速い
- 量子化サポート — INT8 / INT4 量子化で推論軽量化
- 一貫した API — どのモデル元 (PyTorch / TF / scikit-learn) でも同じ呼び方
- 本番運用に向く — マルチスレッド・バッチング・複数モデル同時実行
典型的なワークフロー
| ステップ | 担当 |
|---|---|
| 1. 学習 (Train) | PyTorch / TensorFlow / scikit-learn 等 |
| 2. ONNX エクスポート | torch.onnx.export / tf2onnx / skl2onnx |
| 3. ONNX モデルの検証・最適化 | onnx、onnxruntime.tools |
| 4. (任意) 量子化 | onnxruntime.quantization |
| 5. 推論 | ONNX Runtime (各言語 SDK) |
| 6. デプロイ | Triton Inference Server、自前サーバ、モバイル組込み、ブラウザ |
最小サンプル: PyTorch → ONNX → 推論
|
import torch |
Execution Provider (EP) の代表
| Provider | 対象ハードウェア |
|---|---|
| CPUExecutionProvider | すべての CPU。デフォルト |
| CUDAExecutionProvider | NVIDIA GPU (CUDA) |
| TensorrtExecutionProvider | NVIDIA GPU (TensorRT、最速) |
| ROCmExecutionProvider | AMD GPU |
| CoreMLExecutionProvider | Apple Silicon (Mac / iOS) |
| DirectMLExecutionProvider | Windows GPU 全般 (DirectX 12) |
| OpenVINOExecutionProvider | Intel CPU / iGPU / VPU |
| QNNExecutionProvider | Qualcomm SoC (NPU) |
| WebGPU / WebGL (ORT Web) | ブラウザ |
使うのが向くシーン
| ニーズ | ONNX Runtime の適合度 |
|---|---|
| PyTorch / TF で学習 → 他環境で推論したい | 非常に適合 |
| 同じモデルを Windows / Linux / Mac / モバイル / Web に | 非常に適合 |
| C# / C++ / Java から推論 | 得意 (SDK 多言語) |
| CPU でも速くしたい | ○ (最適化済みカーネル) |
| NVIDIA GPU で最速 | TensorRT EP で◎ |
| 学習自体を任せたい | △ (ORT Training はある程度可だが本格学習は PyTorch 等) |
| LLM 推論 (テキスト生成サーバ) | △ (専用の vLLM / TGI が一般的) |
緑行が ONNX Runtime の真価が出るシナリオ。
類似プロダクトとの比較
| プロダクト | 立ち位置 |
|---|---|
| ONNX Runtime | クロスプラットフォーム推論。Microsoft が中心 |
| TensorRT | NVIDIA GPU で最速 (ONNX を入力に取れる) |
| TFLite | モバイル・組込み (TensorFlow 系) |
| Core ML | Apple デバイス専用 |
| OpenVINO | Intel 系最適化 |
| vLLM / TGI | LLM テキスト生成の高スループットサーバ |
| Triton Inference Server | NVIDIA。複数バックエンド (ONNX / TensorRT / PyTorch) を統合運用 |
インストール
|
# CPU 版 (Python) |
JavaScript (Web / Node) では onnxruntime-web / onnxruntime-node。C# は NuGet で Microsoft.ML.OnnxRuntime。
運用上のヒント
| Tips |
|---|
|
注意点
| よくある落とし穴 |
|---|
|
関連
- 親カテゴリ: AIライブラリ
- 関連: PyTorch / TensorFlow / Hugging Face Transformers
- 背景: ディープラーニング
ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
子ページはありません
人気ページ
- 1 Eclipseで「サーバーに追加または除去できるリソースがありません。」の原因と対処法
- 2 tomcat の起動 / 停止ログと catalina.log・catalina.out の違い
- 3 JavaScript base URL 取得方法|window.location.origin と SSR/Node.js 対応
- 4 YouTube Data API v3 エラー一覧|403/400/404 の主要原因と切り分け
- 5 Spring Frameworkのアノテーション一覧
- 6 Laravel エラー一覧|500/Blade/DB 接続/ルーティングの代表エラー
- 7 3Dグラフィックスとは|モデリング/レンダリング/主要ソフトウェア (Blender / Maya)
- 8 【Spring】@Valueアノテーションとは
- 9 CATALINA_HOME の確認方法 (Linux / Mac)
- 10 【Spring】@Autowiredアノテーションとは
最近更新/作成されたページ
- IPv6とは|128bitアドレス・コロン16進表記/::省略・リンクローカル・SLAAC・デュアルスタック NEW 2026-06-22 12:34:44
- MAC アドレスフィルタリングの仕組みと限界 | ネットワーク入門 NEW 2026-06-22 12:19:10
- VPNとは|暗号トンネル・サイト間/リモートアクセス・IPsec/SSL-VPN/WireGuardを解説 NEW 2026-06-22 12:19:10
- WebRTC とは ブラウザ間 P2P の音声・映像・データ通信 | ネットワーク入門 NEW 2026-06-22 12:17:25
- HTTP/2 とは 多重化・HPACK・バイナリフレーム | ネットワーク入門 NEW 2026-06-22 12:17:25
- Web通信プロトコル入門 HTTP/2・HTTP/3・WebSocket・gRPC・WebRTC | ネットワーク入門 NEW 2026-06-22 12:17:25
- gRPC とは HTTP/2 + Protocol Buffers の高速 RPC | ネットワーク入門 NEW 2026-06-22 12:17:25
- HTTP/3 (QUIC) とは UDP ベースの低遅延 Web 通信 | ネットワーク入門 NEW 2026-06-22 12:17:25
- WebSocket とは 全二重リアルタイム通信 ws/wss | ネットワーク入門 NEW 2026-06-22 12:17:25
- 証明書と認証局(CA)とは|X.509・信頼チェーン・DV/OV/EV・失効(CRL/OCSP)を解説 NEW 2026-06-22 12:17:24
- ファイアウォールとは|パケットフィルタ・ステートフル・DMZ・次世代FW(L4/L7)を解説 NEW 2026-06-22 12:17:24
- iptables/nftablesとは|テーブル・チェーン・ルール例・永続化をLinux視点で解説 NEW 2026-06-22 12:17:24
- HAProxy とは frontend/backend と設定例 | ネットワーク入門 NEW 2026-06-22 12:17:24
- CDN とは エッジキャッシュ・TTL・Cloudflare/CloudFront | ネットワーク入門 NEW 2026-06-22 12:17:24
- TLS/SSLの仕組み|ハンドシェイク・暗号スイート・前方秘匿性・証明書検証をわかりやすく解説 NEW 2026-06-22 12:17:24
コメントを削除してもよろしいでしょうか?