2.

ElevenLabs 使い方完全ガイド|AI 音声 / Voice Cloning / 商用利用

編集
この記事の要点
  • ElevenLabs: AI 音声合成の最高峰、29 言語対応
  • 無料版で月 10,000 文字、Starter $5/月で 30,000 文字 + 商用利用可
  • 主要機能: Text to Speech / Voice Cloning / Dubbing / Sound Effects
  • 強み: 自然な抑揚・感情表現・声クローン
  • 用途: YouTube ナレーション / オーディオブック / アプリ音声 / 翻訳吹き替え

ElevenLabs とは

ElevenLabs (イレブンラボ) は、世界最高クラスの AI 音声合成サービス。テキストを入力すると、人間と区別がつかないレベルの自然な音声が生成されます。29 言語に対応し、日本語も非常に自然

2024 年に話題になった「Voice Cloning(自分の声を AI に学習させる)」機能は、業界の革新として注目されました。

始め方

  1. elevenlabs.io にアクセス
  2. 「Sign up」→ Google / メール
  3. 無料で月 10,000 文字まで生成可能

料金プラン

プラン料金特徴
Free$0月 10,000 文字、商用不可、Voice Cloning 不可
Starter$5 / 月★ 30,000 文字、商用可、Voice Cloning 10 個
Creator$22 / 月100,000 文字、Professional Voice Cloning
Pro$99 / 月500,000 文字
Scale$330 / 月〜大量生成

主要機能

1. Text to Speech

テキストを入力 → 音声生成。デフォルトで 1,000 以上のプリセット音声が用意されている。

2. Voice Cloning

自分の声 (1〜30 分のサンプル) をアップロード → AI が学習 → 任意のテキストを自分の声で読み上げ

3. Dubbing

動画をアップロード → 別言語で同じ話者の声で吹き替え。リップシンクは未対応だが、声の同一性は維持される。

4. Sound Effects

テキスト指示から効果音を生成(例: "波の音 8 秒")。

5. Studio

長文向けの編集 UI。チャプター分割・話者切替・SE 挿入を一括管理。

音声生成の基本

1. Voices ライブラリから声を選ぶ
   - "Alice" (英語、明るい)
   - "Daniel" (英語、落ち着いた男性)
   - "Asahi" (日本語、ナチュラル)
   など多数

2. テキストを入力
3. Settings (Stability, Style, Similarity Boost) を調整
4. Generate
5. ダウンロード or API 連携

主要設定

設定説明推奨
Stability抑揚の安定性(高いほど一定、低いほど感情豊か)50%
Similarity Boost原声への忠実度75%
Styleスタイル誇張0〜20%
Speaker Boost話者の特徴強化ON

API で使う

# pip install elevenlabs
from elevenlabs.client import ElevenLabs
from elevenlabs import play

client = ElevenLabs(api_key='YOUR_API_KEY')

audio = client.generate(
    text='こんにちは、ElevenLabs の AI 音声です。',
    voice='Asahi',
    model='eleven_multilingual_v2',
)

play(audio)
# または保存
with open('output.mp3', 'wb') as f:
    for chunk in audio:
        f.write(chunk)

用途別の使い方

  • YouTube ナレーション: 顔出し不要、声出し不要
  • オーディオブック: 自分の小説を朗読化
  • アプリ・ゲーム: NPC のセリフ、音声ガイド
  • ポッドキャスト: 1 人で 2 人ポッドキャストを作る
  • 翻訳吹き替え: 日本語動画を英語版に
  • e-learning: 教材ナレーション
  • 視覚障害者向け: 文書の音声化

商用利用と倫理

  • Starter 以上で商用可
  • 本人許可なしの声クローン NG: 利用規約で禁止
  • 有名人の声を真似た詐欺・偽情報: 法的・倫理的問題
  • 透かし: ElevenLabs は出力に微弱な検出可能な透かしを入れる場合あり

競合との比較

サービス強み
ElevenLabs★ 品質最高峰、Voice Cloning
OpenAI TTSAPI 安価、Voice 6 種
Google Cloud TTS多言語、安価
Microsoft Azure TTS多様な声、企業向け
Coqui TTSOSS、ローカル動作可
VOICEVOX★ 日本語特化、無料、OSS

関連リンク

  • Suno で曲を作る方法
  • 音声・音楽 AI カテゴリ

Voice Cloning の手順

  1. Voices タブ → 「Add Voice」→ 「Instant Voice Cloning」
  2. サンプル音声をアップロード(1〜10 分、ノイズ少なめ推奨)
  3. 音声に名前を付ける
  4. 「Create Voice」→ 即時利用可能
  5. Professional Voice Cloning(Creator 以上)は 30 分以上のサンプルで高品質クローン

サンプル音声の準備のコツ

  • ノイズなし: 静かな部屋で録音、エアコン音も避ける
  • 感情豊かに: 平坦な棒読みでなく、抑揚をつける
  • 多様な内容: 質問・断定・感嘆など色々な文型
  • サンプリングレート: 44.1kHz / 48kHz 推奨
  • 形式: MP3 / WAV 両方 OK

多言語ダビング

Dubbing 機能で:

  1. 動画をアップロード(最大 45 分、Pro 以上)
  2. 翻訳先言語を選択(英→日、日→英、29 言語対応)
  3. 「話者ごとに分離」を有効化
  4. 生成 → ダウンロード

注意点: リップシンクは未対応のため、口の動きと音声のズレは生じる。

編集
Post Share
子ページ

子ページはありません

同階層のページ
  1. Suno で曲を作る方法
  2. ElevenLabs で AI 音声合成