ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
本稿は Hugging Face Transformers に関する記事です。
| この記事の要点 |
|---|
|
Hugging Face と Transformers の関係
| 名前 | 指すもの |
|---|---|
| Hugging Face | 米国/フランス発の AI 企業&コミュニティ。本拠はモデル・データセットのHub |
| Hugging Face Hub | モデル/データセット/Space (デモ) を公開・配布するプラットフォーム |
| Transformers | Hub のモデルをロード・推論・学習するためのPython ライブラリ |
| Diffusers | 同社の画像生成 (Stable Diffusion 等) 向けライブラリ |
| Datasets | データセットの統一ロード/前処理ライブラリ |
| Tokenizers | 高速なトークナイザライブラリ (Rust 実装) |
| Accelerate | 分散学習・量子化等の共通化ライブラリ |
| PEFT | LoRA など軽量ファインチューニング |
| TRL | RLHF / DPO 等の嗜好学習 |
主な特徴
- 統一 API — どんなモデルでも
AutoModel.from_pretrained(name)でロード - マルチタスク対応 — テキスト分類・生成・QA・翻訳・要約・画像分類・物体検出・音声認識・TTS まで一つの API
- マルチフレームワーク — PyTorch を中核に、TensorFlow / JAX バックエンドもサポート
- 事前学習モデルの巨大エコシステム — Llama / Mistral / Qwen / Phi / Gemma / BERT / GPT-2 / Whisper 等が公開
pipelineヘルパ — ロード・トークナイズ・推論を 1 行で- Trainer — 学習ループを自前で書かずに済む高レベル API
- safetensors 対応 — 安全な重みフォーマット
- 量子化対応 — bitsandbytes / GPTQ / AWQ / 4-bit 等で省 VRAM 推論
最小サンプル: pipeline で 3 行推論
|
from transformers import pipeline |
低レベル API: AutoModel + AutoTokenizer
|
from transformers import AutoTokenizer, AutoModelForCausalLM |
対応タスクの代表例
| タスク | pipeline 名 | 代表モデル |
|---|---|---|
| テキスト分類 | text-classification | BERT、DistilBERT |
| テキスト生成 | text-generation | Llama、Mistral、Qwen、GPT-2、Phi |
| 翻訳 | translation | NLLB、M2M、MarianMT |
| 要約 | summarization | BART、Pegasus、T5 |
| 質問応答 (抽出) | question-answering | BERT、RoBERTa |
| 固有表現抽出 (NER) | token-classification | BERT 系 |
| 埋め込み (Embedding) | feature-extraction | BGE、e5、Sentence Transformers |
| 画像分類 | image-classification | ViT、ResNet、ConvNeXt |
| 物体検出 | object-detection | DETR、YOLOS |
| セグメンテーション | image-segmentation | SegFormer、SAM |
| 音声認識 (STT) | automatic-speech-recognition | Whisper、Wav2Vec2 |
| 音声合成 (TTS) | text-to-speech | SpeechT5、Bark |
| マルチモーダル (画像+テキスト) | image-to-text / visual-question-answering | BLIP、LLaVA、Qwen-VL |
関連ライブラリの組合せ
| 用途 | 使うライブラリ |
|---|---|
| モデル読込・推論 | transformers |
| データセット | datasets(load_dataset) |
| 分散・量子化補助 | accelerate |
| 軽量ファインチューニング | peft (LoRA / QLoRA) |
| 嗜好学習 / RLHF | trl (DPO / SFT / PPO) |
| 高速トークナイズ | tokenizers |
| 画像生成 (Diffusion) | diffusers |
| 評価 | evaluate |
| 推論サーバ | text-generation-inference (TGI)、vLLM |
| UI / デモ | gradio、Spaces で 1 クリックホスティング |
Hugging Face Hub の構成
- Models: 50 万件以上の事前学習モデル(テキスト・画像・音声・マルチモーダル)
- Datasets: 学習・評価用のオープンデータセット
- Spaces: Gradio / Streamlit でホスティングされた AI デモ
- Papers: 論文と関連実装の連携
- Discussions / PR: モデルカード上で議論・変更提案
- Inference Endpoints: 任意のモデルをマネージドでデプロイ
インストール
|
# 基本セット |
運用上のヒント
| Tips |
|---|
|
注意点
| よくある落とし穴 |
|---|
|
関連
- 親カテゴリ: AIライブラリ
- 関連: PyTorch / scikit-learn / TensorFlow
- 背景: ディープラーニング / AI 人工知能
ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
子ページはありません
- PyTorch
- TensorFlow(テンソルフロー)
- scikit-learn
- Hugging Face Transformers
- LangChain
- LlamaIndex
- JAX
- ONNX Runtime
人気ページ
- 1 Eclipseで「サーバーに追加または除去できるリソースがありません。」の原因と対処法
- 2 tomcat の起動 / 停止ログと catalina.log・catalina.out の違い
- 3 JavaScript base URL 取得方法|window.location.origin と SSR/Node.js 対応
- 4 YouTube Data API v3 エラー一覧|403/400/404 の主要原因と切り分け
- 5 Spring Frameworkのアノテーション一覧
- 6 Laravel エラー一覧|500/Blade/DB 接続/ルーティングの代表エラー
- 7 3Dグラフィックスとは|モデリング/レンダリング/主要ソフトウェア (Blender / Maya)
- 8 【Spring】@Valueアノテーションとは
- 9 CATALINA_HOME の確認方法 (Linux / Mac)
- 10 【Spring】@Autowiredアノテーションとは
最近更新/作成されたページ
- IPv6とは|128bitアドレス・コロン16進表記/::省略・リンクローカル・SLAAC・デュアルスタック NEW 2026-06-22 12:34:44
- MAC アドレスフィルタリングの仕組みと限界 | ネットワーク入門 NEW 2026-06-22 12:19:10
- VPNとは|暗号トンネル・サイト間/リモートアクセス・IPsec/SSL-VPN/WireGuardを解説 NEW 2026-06-22 12:19:10
- WebRTC とは ブラウザ間 P2P の音声・映像・データ通信 | ネットワーク入門 NEW 2026-06-22 12:17:25
- HTTP/2 とは 多重化・HPACK・バイナリフレーム | ネットワーク入門 NEW 2026-06-22 12:17:25
- Web通信プロトコル入門 HTTP/2・HTTP/3・WebSocket・gRPC・WebRTC | ネットワーク入門 NEW 2026-06-22 12:17:25
- gRPC とは HTTP/2 + Protocol Buffers の高速 RPC | ネットワーク入門 NEW 2026-06-22 12:17:25
- HTTP/3 (QUIC) とは UDP ベースの低遅延 Web 通信 | ネットワーク入門 NEW 2026-06-22 12:17:25
- WebSocket とは 全二重リアルタイム通信 ws/wss | ネットワーク入門 NEW 2026-06-22 12:17:25
- 証明書と認証局(CA)とは|X.509・信頼チェーン・DV/OV/EV・失効(CRL/OCSP)を解説 NEW 2026-06-22 12:17:24
- ファイアウォールとは|パケットフィルタ・ステートフル・DMZ・次世代FW(L4/L7)を解説 NEW 2026-06-22 12:17:24
- iptables/nftablesとは|テーブル・チェーン・ルール例・永続化をLinux視点で解説 NEW 2026-06-22 12:17:24
- HAProxy とは frontend/backend と設定例 | ネットワーク入門 NEW 2026-06-22 12:17:24
- CDN とは エッジキャッシュ・TTL・Cloudflare/CloudFront | ネットワーク入門 NEW 2026-06-22 12:17:24
- TLS/SSLの仕組み|ハンドシェイク・暗号スイート・前方秘匿性・証明書検証をわかりやすく解説 NEW 2026-06-22 12:17:24
コメントを削除してもよろしいでしょうか?