この内容は古いバージョンです。最新バージョンを表示するには、戻るボタンを押してください。
バージョン:13
ページ更新者:atom
更新日時:2026-05-13 10:20:39

タイトル: AI 人工知能
SEOタイトル: AIとは?人工知能(機械学習・ディープラーニング・LLM)の入門

この記事の要点
  • AI は人間の知的活動を機械に肩代わりさせる技術の総称。記号処理 → 機械学習 → ディープラーニング → 大規模言語モデル (LLM) と進化
  • 現代の主流は生成 AI と LLM。ChatGPT / Claude / Gemini / Microsoft Copilot などが代表
  • 分類軸: 能力の幅 (特化型 / AGI)、手法 (機械学習 / DL)、学習方式 (教師あり / なし / 強化 / 自己教師あり)、出力 (識別 / 生成 / エージェント)
  • キーワード: 基盤モデル / Transformer / Attention / Embedding / RAG / ファインチューニング / エージェント / マルチモーダル
  • 学習ロードマップ: 機械学習 → DL → 数学 → ライブラリ実装 → LLM サービス活用 → 業務応用

本稿は AI (Artificial Intelligence / 人工知能) のハブページです。AI は人間の知的な能力をコンピュータ上で実現する技術の総称で、近年は大規模言語モデル (LLM)生成 AI の登場で実用化が一気に進みました。

本ページの子ページから項目を選択してください。

本ページの子ページ

AI とは?

AI は Artificial Intelligence(人工知能)の略で、認識・推論・意思決定・言語理解・創造といった人間の知的活動を機械に肩代わりさせる技術の総称です。歴史的には記号処理ベースの「ルールベース AI」から始まり、現在は大量データから自動的にパターンを学習する機械学習・ディープラーニングが主流になっています。

AI の分類(よく使われる軸)

分類軸区分概要
能力の幅特化型 AI (Narrow AI / ANI)特定タスク用。現在の AI は基本これ
汎用人工知能 (AGI)人間並みに何でもできる AI。研究段階
実装手法ルールベース AI人が書いた知識・ルールで推論。エキスパートシステム
機械学習 (ML)データから自動でパターンを学習。現在の主流
ディープラーニング (DL)多層ニューラルネット。LLM や画像認識の土台
学習方式教師あり学習正解ラベル付きデータで予測モデルを学習
教師なし学習クラスタリング・次元削減・異常検知など
強化学習報酬最大化で行動方策を学習。ゲーム・ロボティクス
自己教師あり学習データ自身から擬似ラベルを作る。LLM 事前学習の根幹
アウトプット識別系 AI分類・判定・予測(画像認識、需要予測 等)
生成系 AI (Generative AI)テキスト・画像・音声・動画・コードを新規生成
エージェント系 AI道具を使い、複数ステップでタスクを自律実行

現代 AI の地図(2020年代の重要キーワード)

キーワード意味
基盤モデル (Foundation Model)大量データで事前学習した汎用モデル。下流タスクに転用
LLM (大規模言語モデル)テキスト生成・理解の基盤モデル。GPT / Claude / Gemini 等
Transformer2017年登場のニューラルネット構造。LLM の土台
AttentionTransformer の中心機構。"Attention is All You Need"
Embedding単語や文書を高次元ベクトルに変換。意味の数値化
事前学習 / ファインチューニング大量データで土台を作り、用途別に微調整
RLHF / DPO人間の好みでモデルを整える後段学習
Prompt Engineering指示文の設計で出力品質を引き上げる技法
RAG (検索拡張生成)外部知識を検索して LLM に渡し回答精度を上げる
AI エージェントLLM がツールを使い自律的にタスク実行
マルチモーダルテキスト+画像+音声を一体扱う
Diffusion Modelノイズ除去を学習。画像生成の主流方式 (Stable Diffusion 等)
ベクトル DBEmbedding を保存・近傍検索する DB。RAG の必須部品

代表的な現代 AI モデル系統

ベンダーモデル系列用途
OpenAIGPT-4 / GPT-4o / GPT-5 系列、o1 / o3 (推論特化)、DALL·E、Sora、Whisper汎用 LLM、画像、動画、音声
AnthropicClaude 3 / 3.5 / 4 (Sonnet / Opus / Haiku)汎用 LLM、コード、エージェント
Google DeepMindGemini、Imagen、Veoマルチモーダル LLM、画像、動画
MicrosoftCopilot 系 (Azure OpenAI ベース)業務統合・コーディング・検索
MetaLlama 系 (OSS)商用利用可能なオープン LLM
Mistral / xAI / DeepSeek 等Mistral、Grok、DeepSeek新興プレイヤー / OSS LLM
Stability AIStable Diffusion 系列OSS 画像生成

主な応用領域

領域典型用途
自然言語処理翻訳、要約、チャットボット、文書検索
コーディング支援GitHub Copilot、Claude Code、Cursor、Codex
画像認識・生成顔認識、医用画像、Midjourney、Stable Diffusion
音声認識・合成Whisper、文字起こし、音声アシスタント、TTS
レコメンドEC・動画配信のおすすめ、広告配信
異常検知不正取引、製造ラインの不良品検出、サイバー攻撃検知
自動運転・ロボティクス物体検出、経路計画、操作学習
科学・医療創薬、タンパク質構造予測 (AlphaFold)、診断補助
業務自動化RPA との連携、エージェントによる多段タスク

メリットとデメリット

メリットデメリット / 注意点
大量データの解析・自動化学習データの偏りで差別的判断が生じうる
24時間稼働・高速処理ハルシネーション (もっともらしい誤回答)
個別化された提案・回答機密情報の入力・流出リスク
人間が困難な作業 (タンパク質予測等)運用に GPU・電力コスト・専門人材が必要
創造的補助 (文章・コード・画像)著作権・倫理・社会的影響 (雇用) の議論

AI を使うときの基本セキュリティ・運用観点

  • プロンプトに機密情報を入れない(学習データ化や第三者閲覧の可能性)
  • 業務利用はエンタープライズ契約や Azure OpenAI / AWS Bedrock 等で学習オフ設定を確認
  • 生成物の事実性確認 (ファクトチェック) は人間が担う前提で運用
  • RAG・ガードレールでハルシネーション軽減
  • 監査ログ・コスト監視・モデル切替の仕組みを設計に含める
  • 個人情報・PII の取り扱いは各国法令 (GDPR / 個人情報保護法等) に従う

学習ロードマップの例

  1. 機械学習の基礎 (教師あり/なし、評価指標) を学ぶ → 機械学習
  2. ニューラルネットと深層学習を学ぶ → ディープラーニング
  3. 必要な数学を補強 → AI に必要な数学
  4. 実装ライブラリで手を動かす → AI ライブラリ (PyTorch / TensorFlow / scikit-learn)
  5. LLM / 生成 AI を触ってみる → AI サービス (ChatGPT / Claude / Copilot 等)
  6. 業務応用 (RAG・エージェント・ファインチューニング) を実装してみる

注意点

  • 「AI」の指す範囲は時代によって変わる。1980年代のエキスパートシステムから現在の LLM まで地続き
  • 生成 AI の出力は確率的で同じ入力でも結果が変わる。再現性確保には temperatureseed 設定や RAG が必要
  • 過学習や評価データの汚染 (data contamination) でベンチマークが当てにならないケースに注意
  • モデル選定は性能 / コスト / レイテンシ / プライバシのトレードオフ
  • 本記事は IT 学習者向けに整理した俯瞰。各論は子ページを参照

関連