ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
本稿は Hugging Face Transformers に関する記事です。
| この記事の要点 |
|---|
|
Hugging Face と Transformers の関係
| 名前 | 指すもの |
|---|---|
| Hugging Face | 米国/フランス発の AI 企業&コミュニティ。本拠はモデル・データセットのHub |
| Hugging Face Hub | モデル/データセット/Space (デモ) を公開・配布するプラットフォーム |
| Transformers | Hub のモデルをロード・推論・学習するためのPython ライブラリ |
| Diffusers | 同社の画像生成 (Stable Diffusion 等) 向けライブラリ |
| Datasets | データセットの統一ロード/前処理ライブラリ |
| Tokenizers | 高速なトークナイザライブラリ (Rust 実装) |
| Accelerate | 分散学習・量子化等の共通化ライブラリ |
| PEFT | LoRA など軽量ファインチューニング |
| TRL | RLHF / DPO 等の嗜好学習 |
主な特徴
- 統一 API — どんなモデルでも
AutoModel.from_pretrained(name)でロード - マルチタスク対応 — テキスト分類・生成・QA・翻訳・要約・画像分類・物体検出・音声認識・TTS まで一つの API
- マルチフレームワーク — PyTorch を中核に、TensorFlow / JAX バックエンドもサポート
- 事前学習モデルの巨大エコシステム — Llama / Mistral / Qwen / Phi / Gemma / BERT / GPT-2 / Whisper 等が公開
pipelineヘルパ — ロード・トークナイズ・推論を 1 行で- Trainer — 学習ループを自前で書かずに済む高レベル API
- safetensors 対応 — 安全な重みフォーマット
- 量子化対応 — bitsandbytes / GPTQ / AWQ / 4-bit 等で省 VRAM 推論
最小サンプル: pipeline で 3 行推論
|
from transformers import pipeline |
低レベル API: AutoModel + AutoTokenizer
|
from transformers import AutoTokenizer, AutoModelForCausalLM |
対応タスクの代表例
| タスク | pipeline 名 | 代表モデル |
|---|---|---|
| テキスト分類 | text-classification | BERT、DistilBERT |
| テキスト生成 | text-generation | Llama、Mistral、Qwen、GPT-2、Phi |
| 翻訳 | translation | NLLB、M2M、MarianMT |
| 要約 | summarization | BART、Pegasus、T5 |
| 質問応答 (抽出) | question-answering | BERT、RoBERTa |
| 固有表現抽出 (NER) | token-classification | BERT 系 |
| 埋め込み (Embedding) | feature-extraction | BGE、e5、Sentence Transformers |
| 画像分類 | image-classification | ViT、ResNet、ConvNeXt |
| 物体検出 | object-detection | DETR、YOLOS |
| セグメンテーション | image-segmentation | SegFormer、SAM |
| 音声認識 (STT) | automatic-speech-recognition | Whisper、Wav2Vec2 |
| 音声合成 (TTS) | text-to-speech | SpeechT5、Bark |
| マルチモーダル (画像+テキスト) | image-to-text / visual-question-answering | BLIP、LLaVA、Qwen-VL |
関連ライブラリの組合せ
| 用途 | 使うライブラリ |
|---|---|
| モデル読込・推論 | transformers |
| データセット | datasets(load_dataset) |
| 分散・量子化補助 | accelerate |
| 軽量ファインチューニング | peft (LoRA / QLoRA) |
| 嗜好学習 / RLHF | trl (DPO / SFT / PPO) |
| 高速トークナイズ | tokenizers |
| 画像生成 (Diffusion) | diffusers |
| 評価 | evaluate |
| 推論サーバ | text-generation-inference (TGI)、vLLM |
| UI / デモ | gradio、Spaces で 1 クリックホスティング |
Hugging Face Hub の構成
- Models: 50 万件以上の事前学習モデル(テキスト・画像・音声・マルチモーダル)
- Datasets: 学習・評価用のオープンデータセット
- Spaces: Gradio / Streamlit でホスティングされた AI デモ
- Papers: 論文と関連実装の連携
- Discussions / PR: モデルカード上で議論・変更提案
- Inference Endpoints: 任意のモデルをマネージドでデプロイ
インストール
|
# 基本セット |
運用上のヒント
| Tips |
|---|
|
注意点
| よくある落とし穴 |
|---|
|
関連
- 親カテゴリ: AIライブラリ
- 関連: PyTorch / scikit-learn / TensorFlow
- 背景: ディープラーニング / AI 人工知能
ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
子ページはありません
- PyTorch
- TensorFlow(テンソルフロー)
- scikit-learn
- Hugging Face Transformers
- LangChain
- LlamaIndex
- JAX
- ONNX Runtime
人気ページ
- 1 Eclipseで「サーバーに追加または除去できるリソースがありません。」の原因と対処法
- 2 tomcatの起動/停止ログとcatalina.log/catalina.outの違い
- 3 【Javascript】base urlを取得する方法
- 4 YouTube Data API (v3) のエラー一覧|403系エラーの確認ポイント
- 5 Spring Frameworkのアノテーション一覧
- 6 Laravelのエラー一覧|原因と対処の入口ページ
- 7 3Dグラフィックス
- 8 【Spring】@Valueアノテーションとは
- 9 CATALINA_HOMEの確認方法(Linux, Mac)
- 10 【Spring】@Autowiredアノテーションとは
最近更新/作成されたページ
- AIの基礎概念 NEW 2026-05-13 10:24:45
- ディープラーニングとは?CNN・RNN・Transformer・LLM の入門 2026-05-13 10:24:07
- 機械学習とは?教師あり・教師なし・強化学習・代表アルゴリズム 2026-05-13 10:24:07
- AIサービスとは?ChatGPT・Claude・Copilot・Gemini など主要サービスの比較 2026-05-13 10:20:39
- AIに必要な数学:線形代数・微積分・確率統計・情報理論・最適化 2026-05-13 10:20:39
- AIライブラリ一覧:PyTorch・TensorFlow・Hugging Face・LangChain 等の比較 2026-05-13 10:20:39
- AIとは?人工知能(機械学習・ディープラーニング・LLM)の入門 2026-05-13 10:20:39
- PyTorch とは?深層学習フレームワークの使い方・TensorFlow との比較 NEW 2026-05-13 10:11:42
- ONNX Runtime とは?クロスプラットフォーム AI 推論エンジン NEW 2026-05-13 10:11:19
- JAX とは?Google 製の関数型数値計算フレームワーク NEW 2026-05-13 10:11:18
- LangChain とは?LLM アプリ開発フレームワークの使い方・RAG NEW 2026-05-13 10:11:17
- LlamaIndex とは?RAG / LLM データ統合フレームワークの使い方 NEW 2026-05-13 10:11:17
- Hugging Face Transformers とは?OSS LLM 利用の標準ライブラリ NEW 2026-05-13 10:11:16
- TensorFlow とは?使い方・Keras・本番デプロイ(vs PyTorch) 2026-05-13 10:11:16
- AIベンダー一覧:OpenAI・Anthropic・Google DeepMind・Microsoft・Meta NEW 2026-05-13 10:00:16
コメントを削除してもよろしいでしょうか?