ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
本稿は 機械学習 (Machine Learning / ML) に関する記事です。
| この記事の要点 |
|---|
|
本ページの子ページ
- ディープラーニング — 多層ニューラルネットによる学習
機械学習とは?
機械学習 (Machine Learning) は、データから自動的にパターン (規則性) を抽出し、それを使って予測・分類・意思決定を行う AI の中核手法です。「人が if/else でルールを書く」古典的なプログラミングと違い、大量のデータから機械自身に法則を見つけさせるのが特徴です。
近年の AI ブーム (生成 AI / LLM / 画像認識) はすべてこの機械学習、特にディープラーニングを土台にしています。
機械学習の 4 つの学習方式
| 学習方式 | 入力データ | 代表タスク | 代表アルゴリズム |
|---|---|---|---|
| 教師あり学習 | 入力 + 正解ラベル | 分類、回帰 | 線形回帰、ロジスティック回帰、決定木、ランダムフォレスト、SVM、ニューラルネット |
| 教師なし学習 | 入力のみ(ラベルなし) | クラスタリング、次元削減、異常検知 | k-means、DBSCAN、PCA、t-SNE、UMAP |
| 強化学習 | 環境からの状態と報酬 | 方策学習、最適制御 | Q学習、DQN、PPO、SAC、AlphaGo 系 |
| 自己教師あり学習 | 入力からラベルを自動生成 | 事前学習、表現学習 | マスク予測 (BERT)、次トークン予測 (GPT)、対比学習 (SimCLR) |
| 補足: 自己教師あり学習が現代 AI の鍵 |
|---|
| LLM (GPT / Claude / Gemini) の事前学習は自己教師あり学習です。「次の単語を当てる」「文の一部を隠して当てる」というタスクをラベルなしの大量テキストから自動で作って学習します。これにより、人手でアノテーションせずに大規模学習が可能になりました。基盤モデル時代の土台です。 |
典型的なワークフロー
| ステップ | 内容 |
|---|---|
| 1. 問題設定 | 何を予測するか、ビジネス指標は何か、許容できる精度は |
| 2. データ収集 | RDB、ログ、API、外部データ、ラベル付け |
| 3. 探索的データ分析 (EDA) | 分布・相関・欠損・外れ値を可視化 |
| 4. 前処理 | 欠損補完、外れ値処理、スケーリング、エンコーディング |
| 5. 特徴量エンジニアリング | 新しい特徴量の作成、不要な列の削除 |
| 6. データ分割 | train / validation / test に分割(時系列なら時間順) |
| 7. モデル選定・学習 | 複数候補を試し、ハイパーパラメータ調整 |
| 8. 評価 | タスクに合った指標 + ベースラインとの比較 |
| 9. 解釈・デバッグ | 誤り分析、SHAP/LIME で特徴量寄与を見る |
| 10. デプロイ | 推論 API・バッチ・エッジ。監視 (drift / 精度劣化) |
| 11. 再学習 | 定期的に新データで再学習・モデル更新 |
代表的なアルゴリズム
教師あり学習
| アルゴリズム | 用途 | 特徴 |
|---|---|---|
| 線形回帰 / ロジスティック回帰 | 回帰 / 二値分類 | 解釈しやすい・ベースラインに最適 |
| 決定木 | 分類 / 回帰 | 非線形を扱える・可視化しやすい |
| ランダムフォレスト | 分類 / 回帰 | 決定木のアンサンブル・頑健 |
| 勾配ブースティング (XGBoost / LightGBM / CatBoost) | 分類 / 回帰 | 表データで最強級。Kaggle 定番 |
| SVM (サポートベクターマシン) | 分類 / 回帰 | カーネル法で非線形対応 |
| k-NN | 分類 / 回帰 | シンプル。大量データで遅い |
| ナイーブベイズ | 分類 | テキスト分類で軽量に効く |
| ニューラルネット / ディープラーニング | 分類 / 回帰 / 生成 | 画像・音声・言語の非構造化データに強い |
教師なし学習
| アルゴリズム | 用途 |
|---|---|
| k-means | クラスタリング(クラスタ数 k 指定) |
| DBSCAN | 密度ベースクラスタリング(クラスタ数自動) |
| 階層的クラスタリング | 樹形図で階層構造 |
| PCA (主成分分析) | 次元削減・可視化 |
| t-SNE / UMAP | 高次元データの 2D 可視化 |
| Isolation Forest / One-class SVM | 異常検知 |
| Autoencoder | 次元削減・異常検知(NN ベース) |
強化学習
| アルゴリズム | 用途 |
|---|---|
| Q学習 / DQN | 離散行動の強化学習 |
| PPO / SAC / DDPG | 連続行動の強化学習 |
| AlphaZero / MuZero | 自己対戦による戦略学習 |
| RLHF / RLAIF | LLM の人間嗜好学習 |
評価指標(タスク別)
| タスク | 主な指標 | 何を見ているか |
|---|---|---|
| 二値分類 | Accuracy / Precision / Recall / F1 / AUC-ROC / AUC-PR | クラス不均衡では F1 / AUC を重視 |
| 多クラス分類 | Accuracy / Macro F1 / 混同行列 | クラスごとに見る |
| 回帰 | RMSE / MAE / R² | 誤差の大きさと当てはまり |
| レコメンド | nDCG / HitRate / MRR / Recall@k | 順位品質 |
| クラスタリング | シルエット / Davies-Bouldin / 純度 | クラスタ品質 |
| 異常検知 | Precision-Recall / AUC-PR | 陽性が稀でも安定 |
| LLM / 生成 | パープレキシティ / BLEU / ROUGE / BERTScore / 人手評価 | 自動指標は限界あり。人手評価も |
バイアスとバリアンス、過学習・未学習
| 症状 | 原因 | 対処 |
|---|---|---|
| 過学習 (Overfitting) | モデルが訓練データに過適合 | 正則化 (L1 / L2 / Dropout)、データ拡張、早期停止、より単純なモデル |
| 未学習 (Underfitting) | モデルが単純すぎる | より表現力の高いモデル、特徴量追加、学習回数増 |
| 高バイアス | 仮定が強すぎる | モデル複雑化 |
| 高バリアンス | データのノイズに敏感 | 正則化、データ追加、アンサンブル |
近年のキーワード(基盤モデル時代)
| 用語 | 概要 |
|---|---|
| 基盤モデル (Foundation Model) | 大量データで事前学習した汎用モデル。下流タスクに転用 |
| 事前学習 + ファインチューニング | 巨大な汎用モデルを小規模データで用途特化 |
| 転移学習 | あるタスクで学んだ知識を別タスクで活用 |
| 少数ショット学習 (Few-shot) | 少例だけで適応 |
| ゼロショット学習 (Zero-shot) | 学習データに無いクラスを推論 |
| RLHF / DPO | 人間の好みでモデルを整える後段学習 |
| LoRA / QLoRA | 軽量ファインチューニング(パラメータの一部のみ更新) |
| マルチタスク学習 | 1 モデルで複数タスクを同時に学習 |
主要ライブラリ
| 用途 | 代表ライブラリ |
|---|---|
| 古典 ML (表データ) | scikit-learn、XGBoost、LightGBM、CatBoost |
| 深層学習 | PyTorch、TensorFlow、JAX |
| LLM 利用 | Hugging Face Transformers |
| LLM アプリ | LangChain、LlamaIndex |
| 本番推論 | ONNX Runtime、TensorRT |
| データ処理 | NumPy、pandas、Polars |
| 可視化 | Matplotlib、seaborn、Plotly |
| 実験管理 | MLflow、Weights & Biases、TensorBoard |
主な応用分野
- 画像認識: 顔認識、医療画像、製造ライン異常検知
- 音声認識・合成: 文字起こし、TTS、音声アシスタント
- 自然言語処理: 翻訳、要約、感情分析、チャットボット、LLM
- 推薦・パーソナライズ: EC、動画配信、広告
- 異常検知: 不正取引、サイバー攻撃、設備故障予測
- 需要予測・在庫最適化: 小売・物流
- 自動運転・ロボティクス: 物体検出、経路計画、模倣学習
- 科学・医療: タンパク質構造予測 (AlphaFold)、創薬、診断補助
運用上のヒント
| Tips |
|---|
|
注意点
| よくある落とし穴 |
|---|
|
学習ロードマップの例
- AI に必要な数学(線形代数・確率統計・微積)を基礎レベルで押さえる
- scikit-learn でタイタニックや住宅価格のような定番題材を実装
- 評価指標と交差検証、データ漏洩・過学習の感覚をつかむ
- 勾配ブースティング (XGBoost / LightGBM) を試す
- ニューラルネットへ進み、ディープラーニングへ
- Hugging Face Transformers で事前学習モデルを使う
- LLM API + RAG (LangChain / LlamaIndex) で業務応用へ
関連
ページの作成
親となるページを選択してください。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球
子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール
親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!
子ページ
人気ページ
- 1 Eclipseで「サーバーに追加または除去できるリソースがありません。」の原因と対処法
- 2 tomcat の起動 / 停止ログと catalina.log・catalina.out の違い
- 3 JavaScript base URL 取得方法|window.location.origin と SSR/Node.js 対応
- 4 YouTube Data API v3 エラー一覧|403/400/404 の主要原因と切り分け
- 5 Spring Frameworkのアノテーション一覧
- 6 Laravel エラー一覧|500/Blade/DB 接続/ルーティングの代表エラー
- 7 3Dグラフィックスとは|モデリング/レンダリング/主要ソフトウェア (Blender / Maya)
- 8 【Spring】@Valueアノテーションとは
- 9 CATALINA_HOME の確認方法 (Linux / Mac)
- 10 【Spring】@Autowiredアノテーションとは
最近更新/作成されたページ
- Laravel キャッシュクリア完全ガイド(cache:clear / config:clear / 2026-05-18 07:42:07
- プロジェクトの作成と削除 2026-05-18 07:42:07
- インストール直後にNetbeansが反応しない 2026-05-18 07:42:07
- 動画やチャンネルの検索 2026-05-18 07:42:07
- APIキー取得方法 2026-05-18 07:42:07
- チャンネル情報の取得 2026-05-18 07:42:07
- API 入門 — Web API(REST / GraphQL / gRPC / 2026-05-18 07:42:07
- インストール(eclipseプラグイン) 2026-05-18 07:42:07
- Laravel「Dotenv values containing spaces must be surrounded 2026-05-18 07:42:07
- エラー一覧 2026-05-18 07:42:07
- curl: (51) SSL: certificate subject name '~' does not match 2026-05-18 07:42:07
- インストール方法(Windows版) 2026-05-18 07:42:07
- JSONから配列に変換 2026-05-18 07:42:07
- 処理を一定時間待つ 2026-05-18 07:42:07
- A non well formed numeric value encountered 2026-05-18 07:42:07
コメントを削除してもよろしいでしょうか?