ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
本稿は ONNX Runtime (ONNX ランタイム) に関する記事です。
| この記事の要点 |
|---|
|
ONNX と ONNX Runtime の関係
| 名前 | 指すもの |
|---|---|
| ONNX (Open Neural Network Exchange) | モデルの中間表現 (フォーマット)。.onnx 拡張子 |
| ONNX Runtime (ORT) | .onnx モデルを実行する推論ランタイム。Microsoft が中心に開発 |
| ONNX 仕様 | 演算子セット (Opset) と型の標準。バージョンで対応演算子が変わる |
| ORT Training | 推論だけでなく学習もサポート(限定的) |
| ONNX Runtime Web | ブラウザ上で WASM / WebGL / WebGPU 実行 |
| ONNX Runtime Mobile | iOS / Android 向け軽量ビルド |
ONNX Runtime の主な特徴
- マルチプラットフォーム — Windows / Linux / macOS / iOS / Android / Web
- マルチ言語 SDK — Python / C# / C++ / Java / JavaScript / Rust 等
- Execution Provider (EP) による高速化 — CUDA、TensorRT、ROCm、CoreML、DirectML、OpenVINO、QNN 等を後付け
- グラフ最適化 — 演算子融合・定数畳込みなどで PyTorch の eager より速い
- 量子化サポート — INT8 / INT4 量子化で推論軽量化
- 一貫した API — どのモデル元 (PyTorch / TF / scikit-learn) でも同じ呼び方
- 本番運用に向く — マルチスレッド・バッチング・複数モデル同時実行
典型的なワークフロー
| ステップ | 担当 |
|---|---|
| 1. 学習 (Train) | PyTorch / TensorFlow / scikit-learn 等 |
| 2. ONNX エクスポート | torch.onnx.export / tf2onnx / skl2onnx |
| 3. ONNX モデルの検証・最適化 | onnx、onnxruntime.tools |
| 4. (任意) 量子化 | onnxruntime.quantization |
| 5. 推論 | ONNX Runtime (各言語 SDK) |
| 6. デプロイ | Triton Inference Server、自前サーバ、モバイル組込み、ブラウザ |
最小サンプル: PyTorch → ONNX → 推論
|
import torch |
Execution Provider (EP) の代表
| Provider | 対象ハードウェア |
|---|---|
| CPUExecutionProvider | すべての CPU。デフォルト |
| CUDAExecutionProvider | NVIDIA GPU (CUDA) |
| TensorrtExecutionProvider | NVIDIA GPU (TensorRT、最速) |
| ROCmExecutionProvider | AMD GPU |
| CoreMLExecutionProvider | Apple Silicon (Mac / iOS) |
| DirectMLExecutionProvider | Windows GPU 全般 (DirectX 12) |
| OpenVINOExecutionProvider | Intel CPU / iGPU / VPU |
| QNNExecutionProvider | Qualcomm SoC (NPU) |
| WebGPU / WebGL (ORT Web) | ブラウザ |
使うのが向くシーン
| ニーズ | ONNX Runtime の適合度 |
|---|---|
| PyTorch / TF で学習 → 他環境で推論したい | 非常に適合 |
| 同じモデルを Windows / Linux / Mac / モバイル / Web に | 非常に適合 |
| C# / C++ / Java から推論 | 得意 (SDK 多言語) |
| CPU でも速くしたい | ○ (最適化済みカーネル) |
| NVIDIA GPU で最速 | TensorRT EP で◎ |
| 学習自体を任せたい | △ (ORT Training はある程度可だが本格学習は PyTorch 等) |
| LLM 推論 (テキスト生成サーバ) | △ (専用の vLLM / TGI が一般的) |
緑行が ONNX Runtime の真価が出るシナリオ。
類似プロダクトとの比較
| プロダクト | 立ち位置 |
|---|---|
| ONNX Runtime | クロスプラットフォーム推論。Microsoft が中心 |
| TensorRT | NVIDIA GPU で最速 (ONNX を入力に取れる) |
| TFLite | モバイル・組込み (TensorFlow 系) |
| Core ML | Apple デバイス専用 |
| OpenVINO | Intel 系最適化 |
| vLLM / TGI | LLM テキスト生成の高スループットサーバ |
| Triton Inference Server | NVIDIA。複数バックエンド (ONNX / TensorRT / PyTorch) を統合運用 |
インストール
|
# CPU 版 (Python) |
JavaScript (Web / Node) では onnxruntime-web / onnxruntime-node。C# は NuGet で Microsoft.ML.OnnxRuntime。
運用上のヒント
| Tips |
|---|
|
注意点
| よくある落とし穴 |
|---|
|
関連
- 親カテゴリ: AIライブラリ
- 関連: PyTorch / TensorFlow / Hugging Face Transformers
- 背景: ディープラーニング
ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
子ページはありません
人気ページ
- 1 Eclipseで「サーバーに追加または除去できるリソースがありません。」の原因と対処法
- 2 tomcatの起動/停止ログとcatalina.log/catalina.outの違い
- 3 【Javascript】base urlを取得する方法
- 4 YouTube Data API (v3) のエラー一覧|403系エラーの確認ポイント
- 5 Spring Frameworkのアノテーション一覧
- 6 Laravelのエラー一覧|原因と対処の入口ページ
- 7 3Dグラフィックス
- 8 【Spring】@Valueアノテーションとは
- 9 CATALINA_HOMEの確認方法(Linux, Mac)
- 10 【Spring】@Autowiredアノテーションとは
最近更新/作成されたページ
- AIの基礎概念 NEW 2026-05-13 10:24:45
- ディープラーニングとは?CNN・RNN・Transformer・LLM の入門 2026-05-13 10:24:07
- 機械学習とは?教師あり・教師なし・強化学習・代表アルゴリズム 2026-05-13 10:24:07
- AIサービスとは?ChatGPT・Claude・Copilot・Gemini など主要サービスの比較 2026-05-13 10:20:39
- AIに必要な数学:線形代数・微積分・確率統計・情報理論・最適化 2026-05-13 10:20:39
- AIライブラリ一覧:PyTorch・TensorFlow・Hugging Face・LangChain 等の比較 2026-05-13 10:20:39
- AIとは?人工知能(機械学習・ディープラーニング・LLM)の入門 2026-05-13 10:20:39
- PyTorch とは?深層学習フレームワークの使い方・TensorFlow との比較 NEW 2026-05-13 10:11:42
- ONNX Runtime とは?クロスプラットフォーム AI 推論エンジン NEW 2026-05-13 10:11:19
- JAX とは?Google 製の関数型数値計算フレームワーク NEW 2026-05-13 10:11:18
- LangChain とは?LLM アプリ開発フレームワークの使い方・RAG NEW 2026-05-13 10:11:17
- LlamaIndex とは?RAG / LLM データ統合フレームワークの使い方 NEW 2026-05-13 10:11:17
- Hugging Face Transformers とは?OSS LLM 利用の標準ライブラリ NEW 2026-05-13 10:11:16
- TensorFlow とは?使い方・Keras・本番デプロイ(vs PyTorch) 2026-05-13 10:11:16
- AIベンダー一覧:OpenAI・Anthropic・Google DeepMind・Microsoft・Meta NEW 2026-05-13 10:00:16
コメントを削除してもよろしいでしょうか?