3.

AIの基礎概念:LLM/Transformer/Attention/RAG/エージェント など必須キーワード

編集

本稿は AI の基礎概念(LLM 時代の必須キーワード集)のハブページです。ChatGPT / Claude / Gemini など現代の生成 AI を理解・活用するために押さえるべき11 の核心概念をまとめています。

このページの使い方
  • 各概念は独立して読めるが、相互に関連している
  • 初学者は LLM → Transformer → Attention の順がおすすめ
  • 業務で AI を使う担当者は Prompt → RAG → トークン から
  • 開発者は Embedding → ファインチューニング → エージェント
  • 画像・動画 AI に関わる方は Diffusion Model、対話 AI なら マルチモーダル

本ページの子ページ(11 概念)

分類概念一言
モデル基礎LLM (大規模言語モデル)大量データで学習した巨大 Transformer。GPT/Claude/Gemini の本体
Transformer2017 年に登場した、現代 AI 全部の土台アーキテクチャ
Attention (注意機構)「どこに注目するか」を学ぶ Transformer の中核
表現と検索Embedding (埋め込み)テキスト・画像を意味を保ったベクトルに変換
トークンとコンテキストウィンドウLLM が処理する最小単位と入出力上限
使い方の技法Prompt Engineering指示文の設計で LLM の品質を引き上げる
RAG (検索拡張生成)外部知識を検索 → LLM に渡して回答
ファインチューニング事前学習モデルを用途特化(LoRA / RLHF)
AIエージェントLLM が自分で道具を使い多段タスクを実行
マルチモーダル / 生成マルチモーダルAIテキスト + 画像 + 音声 + 動画を統一的に扱う
Diffusion Model (拡散モデル)ノイズ除去で画像・動画を生成する方式

これらの概念がどう繋がっているか

概要マップ
  1. Transformer という土台アーキテクチャがあり、その中核に Attention がある
  2. Transformer を巨大化し、大量テキストで学習したのが LLM
  3. LLM の入出力はトークン単位で計算され、コンテキストウィンドウに上限
  4. テキストや画像は Embedding でベクトル化され、類似検索や RAG の土台に
  5. LLM を使うときの第一の改善手段は Prompt Engineering
  6. 外部知識が必要なら RAG、用途特化なら ファインチューニング
  7. 複数手順を自律実行させるのが AI エージェント(Tool Use 経由)
  8. テキストだけでなく画像・音声・動画も扱う方向が マルチモーダル
  9. 画像・動画の生成側で主流なのが Diffusion Model

学習順序の目安

読者像推奨順序
AI 初学者・全体像を知りたいLLM → Transformer → Attention → Embedding → トークン
ChatGPT 等を業務で使う担当者Prompt Engineering → トークン → RAG → AIエージェント
RAG / 社内 QA を作る開発者Embedding → RAG → Prompt Engineering → ファインチューニング
LLM アプリ・エージェント開発者LLM → Tool Use → AIエージェント → RAG → ファインチューニング
画像・動画 AI 開発Diffusion Model → マルチモーダル → Transformer
研究・論文を読みたいAttention → Transformer → LLM → ファインチューニング

関連

編集
Post Share
子ページ
  1. LLM (大規模言語モデル)
  2. Transformer
  3. Attention (注意機構)
  4. Embedding (埋め込み)
  5. Prompt Engineering
  6. RAG (検索拡張生成)
  7. ファインチューニング
  8. AIエージェント
  9. マルチモーダルAI
  10. トークンとコンテキストウィンドウ
  11. Diffusion Model (拡散モデル)
同階層のページ
  1. 機械学習
  2. AIに必要な数学
  3. AIの基礎概念
  4. AIサービス
  5. AIライブラリ