CapCutのテキスト読み上げ・ボイスチェンジャー・カスタム音声

作成されてから30日以上経過した
Facebookライブ動画は削除(汗)
イーンスパイアの横田です。
https://www.enspire.co.jp

とりあえずダウンロードしておきました。
Facebookも縮小に向かってますね。
過去の歴史も載せておきます。
2017年3月23日、Facebookライブ動画配信が個人アカウントでもパソコンからも可能に
2017年1月14日、Facebookページでパソコンのブラウザからもライブ配信が可能に
個人アカウントはパソコンからのライブ配信は現時点2017.1.14時点では出来ません。
2016年5月24日、Facebook、ライブ動画「Facebook Live」の時間制限90分を廃止へ
2016年3月11日、Facebookページのスマホからライブ配信が可能になりました。
2016年1月29日、Facebookの「ライブ動画」、日本でも一部ユーザーで利用可能に
さて、本題です。
CapCutの生成AIを活用した新機能を
3つ紹介して解説していきます。
https://www.youtube.com/watch?v=ufAcI9EiiJI
CapCutテキスト読み上げ
https://www.capcut.com/magic-tools/text-to-speech
CapCutボイスチェンジャー
https://www.capcut.com/magic-tools/text-to-speech?tab=voice-changer
CapuCutマイ音声(カスタム音声)
https://www.capcut.com/voice-list
CapCutの生成AI機能で音声を自在に操る✨
2025年3月11日にネットビジネス・アナリスト横田秀珠がお届けする最新情報です。CapCutに追加された新機能の中から特に注目の音声関連のAI機能をご紹介します。
CapCutのWeb版とアプリ版に、「テキスト読み上げ」と「ボイスチェンジャー」がそれぞれNEWとして登場しています!
さらに「マイ音声(カスタム音声)」機能も追加されました。これはわずか5〜10秒の録音で自分の声をクローン化できる機能です。
自分の声を録音して、別の声に変換することができます。録音は最大15分まで可能ですが、こちらも日本語のイントネーションの再現に課題があります。
イントネーションの再現度が低いため、実用的に使うにはまだ発展途上と言えそうです。
最も注目すべき新機能は「マイ音声」です。わずか5秒(PCの場合)または10秒(スマホの場合)の録音から、あなたの声をクローン化できます。
良い点
- 声のトーンの再現性は比較的高い
- 現時点では無料で利用可能
- スマホアプリでは日本語の例文も表示される
課題点
- PCでは英語の例文しか表示されない
- 日本語テキストの読み上げは現時点で不完全
- 短い学習時間のため精度はまだ低い
CapCutの生成AI機能はまだ発展途上ですが、無料で試せるのが大きなメリットです。特にカスタム音声機能は将来性が高く、日本語対応が進めば非常に実用的なツールになるでしょう。ぜひ試してみてください!
CapCutのテキスト読み上げ、ボイスチェンジャー、カスタム音声
CapCutの生成AI機能について解説している。テキスト読み上げ、ボイスチェンジャー、カスタム音声(自分の声のクローン作成)という3つの機能を紹介し、実際に試している。日本語の音声変換はまだ精度が低く、特にカスタム音声は英語対応が中心で実用性に課題がある。ただしスマホアプリでは日本語対応の可能性もあり、現在は無料で利用できるため試してみる価値はある。

- はじめに
- テキスト読み上げ機能の使い方
- ボイスチェンジャー機能の実践
- カスタム音声(自分の声をクローン)機能
- PCとスマホでの機能の違い
- おわりに
- よくある質問
はじめに
動画編集ツールとして人気を集めているCapCutですが、最近では生成AI機能も充実してきています。特に「テキスト読み上げ」「ボイスチェンジャー」「カスタム音声(声のクローン)」という音声関連の新機能が注目を集めています。これらの機能を使うことで、動画制作の幅が大きく広がるかもしれません。
今回は2025年3月11日現在、CapCutのWeb版とスマホアプリで利用できる音声関連のAI機能について詳しく解説していきます。特に「5秒で自分の声をクローンに」というキャッチフレーズで紹介されているカスタム音声機能は、短時間の音声サンプルから自分の声を再現できる技術として注目に値します。まだ発展途上の技術ではありますが、無料で試せる機会ということで、実際に試してみた結果をお伝えしていきましょう。
テキスト読み上げ機能の使い方
CapCutのWeb版では、「すべてのツール」の中に「テキスト読み上げ」という新機能があります。これはテキストを入力すると、AIが音声に変換してくれる機能です。
実際に使ってみると、まずテキストを入力します。今回は私の挨拶文「みなさん、こんにちは。ネットビジネス・アナリスト横田秀珠です。今日もネットビジネスに関する情報を生中継で15分間お届けしてまいります。今日もよろしくお願いします。」を入力してみました。
次に右側にある音声の種類を選びます。様々な声が用意されていますが、日本語対応しているものを選ぶ必要があります。また、声のスピードも調整可能で、標準の1倍速でも十分聞き取りやすいです。
音声を選んだら「5秒で試聴」ボタンを押して生成します。生成された音声はダウンロードして保存することができます。
実際に聞いてみると、残念ながらイントネーションがかなり不自然です。「横田」の読み方も間違えており、中国製のツールということもあって、日本語の精度はまだまだ改善の余地がありそうです。女性の声に変えても同様に不自然さが目立ちました。ChatGPTのように流暢に話す音声生成とは、まだレベルに差があると感じました。
ボイスチェンジャー機能の実践
次に「ボイスチェンジャー」機能を試してみました。こちらは既存の音声を別の声に変換する機能です。
まず自分の声を録音します。「みなさん、こんにちは。ネットビジネス・アナリスト横田秀珠です。今日もネットビジネスに関する情報を生中継で15分間お届けしてまいります。今日もよろしくお願いします。」という15秒程度の音声を録音しました。
録音後、様々な声の中から変換先の声を選びます。こちらも日本語対応のものを選ぶと良いでしょう。声を選んだら「生成」ボタンを押します。
生成された音声を聞いてみると、これもイントネーションがうまく再現できておらず、実用的なレベルには達していないように感じました。声質は変わっていますが、自然な日本語としては聞こえにくい結果となりました。
カスタム音声(自分の声をクローン)機能
CapCutの最も新しい機能である「マイ音声」または「カスタム音声」を試してみました。これはわずか5秒(PCの場合)または10秒(スマホの場合)の音声サンプルから、自分の声をクローン化する機能です。
PC版では「AIアセット」内の「マイ音声」から利用できます。「新規作成」をクリックして進むと、英語のサンプル文が表示されます。このサンプル文を読み上げて録音すると、AIが声を学習します。
録音後、「よこたんボイス」という名前をつけて保存しました。保存された声を使って、テキスト読み上げを試みましたが、残念ながら日本語には対応していませんでした。英語のテキストは自分の声に似た感じで読み上げられましたが、日本語のテキストは中国語のような発音になってしまい、実用的ではありませんでした。
PCとスマホでの機能の違い
興味深いことに、スマホアプリ版では状況が少し異なります。スマホ版では録音時に日本語のサンプル文が表示されました:「パン屋から漂う焼きたてパンの香りは人生のシンプルな喜びを味わうことへの抗いがたい誘いであり、温かく心地よい香りが通りを期待で満たす」
この日本語サンプルを読み上げて録音したところ、PCよりは日本語対応の可能性が高いように感じました。「横田秀珠2」という名前で保存してみましたが、実際の読み上げテストの結果は確認できませんでした。
おわりに
CapCutの生成AI機能、特に音声関連の新機能について実際に試してみましたが、現時点では日本語対応の精度はまだまだ発展途上といえるでしょう。テキスト読み上げ、ボイスチェンジャー、カスタム音声のいずれも、英語や中国語と比べると日本語の自然さには課題が残ります。
しかし、技術の進化は日進月歩です。現在は無料で試すことができるこれらの機能が、将来的には日本語にも完全対応し、より自然で実用的な音声生成が可能になる可能性は十分にあります。特にカスタム音声(自分の声のクローン)機能は、わずか5〜10秒の音声サンプルから声を再現できる点で非常に興味深いです。
現段階ではエンターテイメント目的や実験的な使用にとどまりますが、CapCutの生成AI機能は今後も注目していく価値があります。ぜひ皆さんも無料のうちに試してみて、その可能性を体感してみてください。
よくある質問
Q1: CapCutの音声生成機能は全て無料で使えますか?
A1: 2025年3月11日現在、テキスト読み上げ、ボイスチェンジャー、カスタム音声(マイ音声)の機能は無料で利用できます。ただし、CapCutは一部機能が有料化されていますので、将来的に変更される可能性もあります。
Q2: カスタム音声機能で作成した自分の声は、どのくらいの長さのテキストを読み上げられますか?
A2: 公式の情報によると「読む文字数に上限があります」と記載されています。長文の読み上げには制限がありますので、短めのテキストでの使用が推奨されます。
Q3: 日本語の音声生成の精度はいつ改善されますか?
A3: 具体的な改善時期は公表されていませんが、AIの進化は非常に速いため、今後のアップデートで改善される可能性があります。CapCutの公式発表をチェックしておくとよいでしょう。
Q4: PCとスマホアプリでは、どちらの方が機能が充実していますか?
A4: 現時点では、スマホアプリの方が日本語サンプル文が表示されるなど、日本語対応が進んでいる可能性があります。ただし、基本的な機能はどちらも同様に利用できます。PCではサンプル録音が5秒、スマホでは10秒という違いもあります。
Q5: 生成した音声の著作権や利用制限はありますか?
A5: CapCutの利用規約に従う必要がありますが、一般的に自分で生成した音声は個人利用の範囲であれば問題ないとされています。ただし、商用利用や他者の声の無断利用については、法的な制限がある可能性があるため注意が必要です。
詳しくは15分の動画で解説しました。
https://www.youtube.com/watch?v=xE3CasMcgQo
0:00 👋 挨拶と自己紹介
1:08 🔎 CapCutの新機能紹介
2:14 📱 CapCutアプリ版の操作解説
3:18 🖊️ テキスト読み上げ機能の実演
5:41 🔊 テキスト読み上げ機能の結果と評価
6:52 👩 女性の声での読み上げ実演
8:02 🎤 ボイスチェンジャー機能の実演
10:23 🧪 マイ音声(カスタム音声)機能の実演
11:33 📊 マイ音声の結果と評価
13:53 📲 スマホアプリでのマイ音声を実演
14:47 🏁 まとめと締めくくり
上記の動画はYouTubeメンバーシップのみ
公開しています。詳しくは以下をご覧ください。
https://yokotashurin.com/youtube/membership.html
YouTubeメンバーシップ申込こちら↓
https://www.youtube.com/channel/UCXHCC1WbbF3jPnL1JdRWWNA/join
CapCutのテキスト読み上げ、ボイスチェンジャー、カスタム音声

🎬 CapCut
中国発の動画編集ツールで、PCとスマホの両方に対応している。テキスト読み上げやボイスチェンジャーなどの生成AI機能を搭載し、無料版と有料版がある。
🗣️ テキスト読み上げ
CapCutの機能の一つで、入力されたテキストを音声に変換する。様々な声から選択可能だが、日本語のイントネーションにはまだ課題がある。
🎭 ボイスチェンジャー
録音した音声を別の声質に変換する機能。様々なキャラクターの声に変えられるが、日本語のイントネーションが不自然になる場合がある。
🎙️ カスタム音声
5秒(PC)または10秒(スマホ)の音声サンプルから自分の声をクローン化する機能。現状では英語対応が中心で日本語対応は限定的。
💻 Web版
PCでブラウザから利用できるCapCutのバージョン。スマホアプリとは若干機能や使い勝手が異なる。
📱 アプリ版
スマートフォンで利用できるCapCutのバージョン。一部機能ではWeb版より日本語対応が進んでいる可能性がある。
🆓 無料機能
現時点でテキスト読み上げやカスタム音声などの機能が無料で利用可能。将来的には有料化される可能性もある。
🇯🇵 日本語対応
CapCutの生成AI機能の日本語対応はまだ完全ではなく、特にイントネーションや漢字の読み方に課題がある。
⏱️ 録音時間
カスタム音声を作成する際のサンプル録音時間。PCでは5秒、スマホでは10秒と案内されている。
🔄 生成AI
人工知能を使って新しいコンテンツを作成する技術。CapCutでは音声生成に応用され、テキスト読み上げやボイスチェンジャーなどの機能を実現している。
超要約1分ショート動画こちら↓
https://www.youtube.com/shorts/XnMbavMyvpE
CapCutのテキスト読み上げ、ボイスチェンジャー、カスタム音声
CapCutの生成AI機能(テキスト読み上げ、ボイスチェンジャー、カスタム音声)は、手軽に利用できる反面、イントネーションの不自然さやPC版の日本語対応の遅れなど課題も残る。しかし、無料で高度なAI機能を試せる点は大きな魅力であり、今後の技術進化に期待できる。特にスマホアプリ版のカスタム音声機能は、日本語対応も優れ、手軽に自分の声のクローンを作成できるため、試してみる価値がある。動画制作の可能性を広げる第一歩として、CapCutの生成AI機能を活用してみてはいかがだろうか。

1. はじめに
1.1 配信内容
1.1.1 2025年3月11日の配信内容
2025年3月11日、動画編集アプリとして広く知られるCapCutは、生成AIを活用した革新的な3つの新機能を発表しました。これらの機能は、動画制作のワークフローを大きく変革する可能性を秘めており、クリエイターコミュニティから大きな注目を集めています。今回発表されたのは、テキスト読み上げ機能、ボイスチェンジャー機能、そしてカスタム音声機能です。テキスト読み上げ機能は、入力したテキストを自然な音声で読み上げることで、ナレーション作成の効率化に貢献します。ボイスチェンジャー機能は、録音した音声を多様な声質に変換し、動画にエンターテイメント性や表現の幅をもたらします。そして、カスタム音声機能は、ユーザー自身の声のクローンを作成し、AIによる音声合成に利用できるという、パーソナライズされた表現を可能にする機能です。これらの新機能は、CapCutが動画編集の可能性をさらに広げ、クリエイターの創造性を刺激するための重要な一歩となるでしょう。本記事では、これらの生成AI機能の詳細な概要、具体的な使用方法、そして実際に使用してみた上での実用性評価について、詳細に解説していきます。CapCutが提供するこれらの革新的なツールが、動画制作の現場にどのような変化をもたらすのか、その全貌を明らかにしていきます。動画クリエイターはもちろん、動画編集に興味がある全ての方にとって、必見の内容です。
2. テキスト読み上げ機能
2.1 機能概要
2.1.1 機能表示
CapCutのテキスト読み上げ機能は、アプリのユーザーインターフェース内で、非常にアクセスしやすい場所に配置されています。具体的には、「すべてのツールのおすすめ」セクションに、新機能として明確に表示されています。このセクションは、CapCutが提供する豊富な機能の中でも、特に注目すべきツールをまとめたものであり、テキスト読み上げ機能の重要性が伺えます。機能名の横には、視覚的に分かりやすく「New」というラベルが表示されており、ユーザーは一目で新機能であることを認識できます。これにより、CapCutを頻繁に利用するユーザーだけでなく、初心者ユーザーであっても、最新のAI機能を迷うことなくすぐに試すことができます。また、この機能表示は、CapCutが常にユーザーエクスペリエンスを重視し、新機能を積極的にアピールすることで、ユーザーに最新の動画編集技術を体験してもらいたいという意図の表れと言えるでしょう。テキスト読み上げ機能へのアクセスのしやすさは、CapCutがユーザーフレンドリーなアプリであることを示す一例であり、多くのユーザーにとって利便性の高い設計となっています。この機能を通じて、より多くのユーザーがAI技術を活用した動画制作を体験し、新たな表現の可能性を広げていくことが期待されます。
2.2 使用方法
2.2.1 手順
CapCutのテキスト読み上げ機能は、その高度な機能とは裏腹に、非常にシンプルで直感的な操作で使用することができます。まず、ユーザーはテキスト入力欄に、読み上げさせたい文章をコピー&ペースト、または直接入力します。この入力欄は、長文にも対応しており、動画のナレーションなど、まとまった量のテキストを一度に処理することが可能です。次に、CapCutが提供する豊富な音声ライブラリから、好みの声を選択します。声の種類は、性別、年齢、声のトーンなど、多様なバリエーションが用意されており、動画の内容や雰囲気に合わせて最適な声を選ぶことができます。さらに、声のスピード調整機能も搭載されており、動画のテンポや演出に合わせて、読み上げ速度を細かく調整することが可能です。声の選択とスピード調整が終わったら、「5秒で試聴」ボタンをクリックすることで、実際に生成される音声をプレビューできます。このプレビュー機能により、生成される音声の品質やニュアンスを事前に確認し、必要に応じて声の種類やスピードを再調整することができます。プレビューで音声に問題がないことを確認したら、最後に「生成」ボタンを押すことで、テキストから音声への変換処理が実行されます。生成された音声データは、CapCutの編集プロジェクトにすぐに組み込むことができ、動画制作 workflow をスムーズに進めることができます。このように、CapCutのテキスト読み上げ機能は、簡単な手順で高品質な音声を生成できるため、動画編集初心者からプロのクリエイターまで、幅広いユーザーにとって非常に有効なツールとなるでしょう。
2.3 実用性評価
2.3.1 評価内容
CapCutのテキスト読み上げ機能を実際に使用してみると、手軽に音声素材を作成できる点は非常に評価できます。しかし、生成される音声のイントネーションには、まだ改善の余地があると感じました。特に、日本語の固有名詞や複合語の読み上げにおいて、不自然なイントネーションになるケースが散見されます。例えば、人名や地名、専門用語などを読み上げさせた場合、期待していたほど自然な発音にならないことがあります。また、句読点や文末表現によっては、音声の抑揚が単調になり、全体的に機械的な印象を受けることもあります。他のAI音声生成ツール、例えばOpenAIのChatGPTなどが提供する音声生成機能と比較すると、CapCutのテキスト読み上げ機能は、まだ流暢さや自然な会話のニュアンスにおいて、一歩及ばないと言えるでしょう。ChatGPTの音声生成は、より人間らしい自然なイントネーションや抑揚を実現しており、まるで人が話しているかのような滑らかな音声を作り出すことができます。もちろん、CapCutのテキスト読み上げ機能は無料で利用できるという大きなメリットがあり、手軽に試せる点は魅力です。しかし、より高品質なナレーションや、自然な会話のような音声表現を動画に取り入れたい場合は、現時点ではChatGPTなどの他のAI音声生成ツールの方が適しているかもしれません。CapCutのテキスト読み上げ機能は、今後のアップデートによって、音声品質が向上していくことを期待したいです。特に、日本語のイントネーションの改善、より自然な抑揚の表現、そして多様な感情表現の追加などが実現されれば、さらに実用的なツールとして、多くの動画クリエイターに活用されるようになるでしょう。
3. ボイスチェンジャー機能
3.1 機能概要
3.1.1 機能表示
CapCutのボイスチェンジャー機能は、テキスト読み上げ機能と同様に、アプリのツール一覧内で「New」というラベルと共に表示されており、新機能であることが強調されています。この機能は、ユーザーが録音した音声を、様々な声質やキャラクターの声にリアルタイムで変換することを可能にするもので、動画コンテンツにエンターテイメント性やユニークな表現を加えるための強力なツールとなります。例えば、動画のキャラクターに合わせた声を作ったり、性別や年齢の異なる声に変化させたり、あるいはロボットのような特殊効果音声を生成したりと、アイデア次第で様々な使い方が可能です。ボイスチェンジャー機能は、ライブ配信やゲーム実況、アニメーション制作、教育コンテンツなど、幅広いジャンルの動画制作において、表現の幅を広げ、視聴者の興味を引くための効果的な手段となり得ます。CapCutがこの機能を導入した背景には、動画コンテンツの多様化と、クリエイターがより手軽に高度な音声編集を行えるようにしたいという意図があると考えられます。ボイスチェンジャー機能へのアクセスのしやすさは、CapCutがユーザーに革新的な機能を提供し、動画制作の可能性を常に追求している姿勢を示していると言えるでしょう。この機能を通じて、より多くのクリエイターが音声表現の自由度を高め、創造性を最大限に発揮することが期待されます。今後のアップデートで、さらに多くの声の種類やエフェクトが追加され、より高度なボイスチェンジが可能になることにも期待したいです。
3.2 使用方法
3.2.1 手順
CapCutのボイスチェンジャー機能は、非常にユーザーフレンドリーな設計で、簡単な手順で利用できます。まず、ボイスチェンジャー機能を使用するには、アプリ内で音声を録音する必要があります。録音ボタンをタップし、変換したい音声をマイクに向かって録音します。録音時間の上限は最大15分となっており、比較的長時間の音声も処理することが可能です。録音後、CapCutが提供する豊富な声の種類の中から、変換したい声を選択します。声の種類は、男性の声、女性の声、子供の声、ロボットのような機械的な声、アニメキャラクターのような声など、多岐にわたります。ユーザーは、動画のテーマや表現したいイメージに合わせて、最適な声を選ぶことができます。声を選択したら、最後に「生成」ボタンをタップします。すると、AIが録音された音声を解析し、選択した声質に変換する処理が実行されます。変換処理は、通常数秒から数十秒程度で完了し、すぐに変換後の音声を確認することができます。生成された音声は、元の動画素材に重ねたり、別の動画プロジェクトで使用したりと、自由に活用できます。このように、CapCutのボイスチェンジャー機能は、録音から変換まで、わずか数ステップで完結するため、動画編集初心者でも手軽に高度な音声効果を動画に取り入れることができます。複雑な設定や専門知識は不要で、直感的な操作でボイスチェンジを楽しめる点が、この機能の大きな魅力と言えるでしょう。
3.3 実用性評価
3.3.1 評価内容
CapCutのボイスチェンジャー機能を実際に試してみたところ、声質を変化させるという点においては、期待通りの効果を発揮してくれました。例えば、男性の声から女性の声へ、あるいは子供の声やロボットの声へと、明確に声質を変化させることが可能です。声の種類によっては、コミカルな効果や、ミステリアスな雰囲気を動画に加えることができ、エンターテイメント性を高めるのに役立ちます。しかし、一方で、イントネーションの再現性には課題が残るという印象を受けました。声は確かに選択したキャラクターのように変化するものの、元の音声が持っていた自然な話し方や抑揚、感情のニュアンスなどが、完全に再現されるわけではありません。特に、複雑な感情表現や、微妙な声のトーンの変化などは、ボイスチェンジャーによって失われてしまうことがあります。そのため、ボイスチェンジャー機能は、声質を大きく変化させて楽しむ用途には適していますが、元の音声の自然な話し方を維持したまま、声だけを自然に変化させたいという場合には、まだ改善の余地があると感じます。より自然な会話のようなボイスチェンジを求めるのであれば、現時点では、CapCutのボイスチェンジャー機能は、まだ発展途上であると言えるでしょう。今後の技術的な進化によって、イントネーションの再現性や、より自然な声質変換が実現されることを期待したいです。それでも、手軽に声を変えて動画に面白い効果を加えたい、という用途には、十分に活用できる機能であると言えます。
4. カスタム音声(自分の声のクローン)機能
4.1 機能概要
4.1.1 機能表示
CapCutのカスタム音声機能、別名「マイ音声」機能は、アプリ内の「AIアセット」セクションに配置されています。このセクションは、AI技術を活用した様々なクリエイティブアセットを提供する場所であり、カスタム音声機能もその一つとして、ユーザーに提供されています。カスタム音声機能は、ユーザー自身の声をAIに学習させ、声のクローンを作成することを可能にする画期的な機能です。この機能を利用することで、ユーザーはわずか5秒または10秒という短い音声サンプルを提供するだけで、AIがその声の特徴を捉え、独自のカスタム音声モデルを生成します。作成されたカスタム音声は、テキスト読み上げ機能と組み合わせて使用することができ、入力したテキストを自分の声でAIに読み上げさせることが可能になります。これは、動画のナレーションを自分の声で作成したい場合や、キャラクターに自分の声を割り当てたい場合など、パーソナライズされた音声表現を実現するための強力なツールとなります。カスタム音声機能の登場は、AI技術が動画制作の領域に新たな可能性をもたらすことを示しており、クリエイターはこれまで以上に自由な発想で動画制作に取り組むことができるようになるでしょう。CapCutがこの機能を導入したことは、ユーザーに最先端のAI技術を体験してもらい、より創造的な動画制作を支援したいという強い意志の表れと言えるでしょう。
4.2 使用方法(PC版)
4.2.1 手順
PC版CapCutでカスタム音声を作成する手順は、シンプルでありながら、いくつかのステップを踏む必要があります。まず、CapCutアプリをPCで起動し、「AIアセット」セクションに移動します。次に、セクション内にある「マイ音声」という項目を選択します。「マイ音声」を選択すると、カスタム音声作成に関する説明と、利用規約への同意を求める画面が表示されます。内容を確認し、同意する場合は同意ボタンをクリックします。同意後、音声サンプルの録音画面に遷移します。PC版では、サンプルとして英文が表示されるため、この英文をマイクに向かってはっきりと読み上げます。録音時間は5秒または10秒と非常に短いため、集中してクリアな音声を録音することが重要です。録音を終えたら、作成したカスタム音声に任意の名前を付け、保存します。保存が完了すると、カスタム音声モデルの生成が開始されます。生成には数分かかる場合があります。生成が完了すると、テキスト読み上げ機能などで、作成したカスタム音声を選択して利用できるようになります。PC版でのカスタム音声作成は、主に英語での利用を想定しているため、サンプル文が英文である点に注意が必要です。日本語での利用を考えている場合は、後述するスマホ版の方が適している可能性があります。しかし、PC版でも基本的な手順は同じであり、手軽にカスタム音声を作成できる点は評価できます。
4.3 使用方法(スマホ版)
4.3.1 手順
スマホ版CapCutでカスタム音声を作成する手順は、PC版と基本的な流れは同じですが、サンプル文の言語が異なるなど、いくつかの点で違いがあります。スマホ版CapCutアプリを起動し、ホーム画面または編集画面から「すべてのツール」を選択します。ツール一覧の中から「カスタム音声」という項目を探し、選択します。「カスタム音声」を選択すると、機能の説明と利用規約への同意画面が表示されるので、内容を確認して同意します。次に、音声サンプルの録音画面に移動します。スマホ版では、サンプルとして日本語の文章が表示されるため、この日本語の文章を、PC版と同様にマイクに向かってはっきりと読み上げます。録音時間は5秒または10秒です。録音後、作成するカスタム音声に名前を付けて保存します。保存が完了すると、カスタム音声モデルの生成がバックグラウンドで開始されます。生成時間は、ネットワーク環境やサーバーの混雑状況によって変動しますが、通常数分程度で完了します。生成が完了すると、テキスト読み上げ機能などで、作成したカスタム音声を選択し、自分の声でテキストを読み上げさせることが可能になります。スマホ版のカスタム音声作成は、サンプル文が日本語であるため、日本語を母語とするユーザーにとっては、PC版よりも直感的で使いやすいと言えるでしょう。また、スマホで手軽にカスタム音声を作成できるため、場所を選ばずに利用できる点もメリットです。
4.4 言語対応の違い
4.4.1 言語の違い
CapCutのカスタム音声機能には、PC版とスマホ版で、言語対応に明確な違いが見られます。PC版のカスタム音声作成機能では、音声サンプルの録音時に、英語のサンプル文が表示されます。これは、PC版が主に英語圏のユーザーをターゲットに開発された、あるいは英語での利用を推奨している可能性を示唆しています。一方、スマホ版のカスタム音声作成機能では、日本語のサンプル文が表示されます。これは、スマホ版が日本語を含む多言語への対応を強化しており、より幅広いユーザー層をターゲットにしていることを示唆しています。この言語対応の違いは、カスタム音声の作成しやすさ、ひいてはユーザーエクスペリエンスに大きな影響を与えます。日本語を母語とするユーザーの場合、PC版で英語のサンプル文を読み上げることに抵抗を感じるかもしれませんし、発音に自信がない場合もあるでしょう。その点、スマホ版であれば、日本語のサンプル文を自然に読み上げるだけでカスタム音声を作成できるため、言語の壁を感じることなく、スムーズに機能を利用できます。特に、CapCutの主要なユーザー層として考えられる、若い世代や動画編集初心者にとっては、スマホ版の日本語対応の方が親しみやすく、利用しやすいと言えるでしょう。このように、PC版とスマホ版の言語対応の違いは、CapCutがターゲットとするユーザー層や、各プラットフォームにおける利用シーンの違いを反映していると考えられます。今後は、PC版においても日本語を含む多言語への対応が進むことで、より多くのユーザーがカスタム音声機能を快適に利用できるようになることが期待されます。また、言語対応だけでなく、音声サンプルの種類や録音環境の改善、カスタム音声の品質向上など、機能全体の更なる進化にも期待したいところです。
4.5 実用性評価
4.5.1 評価内容
CapCutのカスタム音声機能を実際に試用してみた結果、声のクローン作成という点においては、ある程度の成功を収めていると感じました。5秒または10秒という短い音声サンプルから、自分の声の特徴を捉えたAI音声が生成されるのは、技術的に非常に興味深い成果です。生成されたカスタム音声をテキスト読み上げ機能で利用してみると、確かに自分の声に似たAI音声がテキストを読み上げていることを確認できます。しかし、完璧なクローンとまでは言えず、まだ改善の余地があるのも事実です。特に、声の抑揚や細かなニュアンス、感情表現などは、オリジナル音声と比べると、やや機械的で平板な印象を受けることがあります。また、PC版に関しては、日本語対応が不十分であり、英語のサンプル文を使用する必要があるため、日本語ユーザーにとってはハードルが高いと感じました。英語の発音に自信がない場合や、日本語で自然なカスタム音声を作成したい場合は、スマホ版を利用する方が良いでしょう。スマホ版は日本語対応が優れており、日本語のサンプル文で手軽にカスタム音声を作成できますが、それでも完璧な日本語のクローン音声とは言えません。イントネーションや発音の正確性など、まだ改善の余地はあります。しかし、無料で手軽に自分の声のクローンを試せるという点は非常に魅力的であり、今後の技術進化によって、より高品質なカスタム音声が作成できるようになることに期待したいです。現時点では、エンターテイメント用途や、実験的な動画制作など、クリエイティブな発想でこの機能を活用するのがおすすめです。
5. 総評
5.1 機能評価
5.1.1 テキスト読み上げとボイスチェンジャーの課題
CapCutの生成AI機能、特にテキスト読み上げ機能とボイスチェンジャー機能は、手軽に利用できる一方で、いくつかの課題も抱えています。最も顕著な課題は、生成される音声のイントネーションの不自然さです。テキスト読み上げ機能では、日本語の固有名詞や複合語の読み上げにおいて、不自然なイントネーションになるケースが目立ちます。また、ボイスチェンジャー機能においても、声質は変化するものの、元の音声の自然なイントネーションや抑揚が完全に再現されるわけではありません。これらの機能は、まだ発展途上であり、特に日本語のような複雑なイントネーションを持つ言語においては、自然な音声生成が難しいという現状が伺えます。イントネーションの不自然さは、動画の品質を損なう可能性があり、特にプロフェッショナルな動画制作においては、これらの機能の利用は限定的かもしれません。今後のアップデートにおいては、イントネーションの自然さを向上させるための技術開発が不可欠となるでしょう。また、カスタム音声機能に関しては、PC版の日本語対応の遅れが課題として挙げられます。PC版は英語のサンプル文のみに対応しており、日本語ユーザーにとっては使いにくい面があります。スマホ版は日本語対応が進んでいるものの、PC版との機能差は、ユーザーエクスペリエンスの一貫性を損なう可能性があります。CapCutがグローバルな動画編集アプリとして、より多くのユーザーに利用されるためには、言語対応の拡充と、プラットフォーム間の機能を高めることが重要となるでしょう。
5.1.2 無料で試せる点の魅力
CapCutの生成AI機能は、まだ課題も残るものの、それを補って余りある魅力として、無料で試せるという点が挙げられます。高性能なAI技術を、ユーザーが無料で手軽に体験できるというのは、CapCutの大きな強みと言えるでしょう。テキスト読み上げ、ボイスチェンジャー、カスタム音声といった高度な機能を、費用を気にせずに試せることで、多くのユーザーがAI技術に触れる機会を得られます。特に、動画編集初心者や、AI技術に興味があるものの、高額なツールに手を出すのを躊躇していたユーザーにとっては、CapCutは非常に魅力的な選択肢となります。無料で試せることで、ユーザーはリスクなく機能を評価し、自身の動画制作 workflow にどのように組み込めるかを検討できます。また、CapCutは、無料でありながら、基本的な動画編集機能も充実しており、生成AI機能と組み合わせることで、より高度な動画制作を無料で行うことも可能です。技術はまだ発展途上であり、完璧ではないと述べましたが、裏を返せば、今後の技術進化によって、これらの機能がさらに向上する可能性を秘めているということです。ユーザーは、無料でこれらの機能を使い続けることで、CapCutの進化をリアルタイムで体験し、より高度な機能が追加される日を期待することができます。無料で高品質なAI機能を体験できるCapCutは、動画編集の民主化を推進し、より多くのクリエイターが創造性を発揮できる環境を提供していると言えるでしょう。
5.2 建議
5.2.1 スマホアプリ版の試用
CapCutの生成AI機能を試してみようと考えている方、あるいはどの機能から試すべきか迷っている方には、まずスマホアプリ版のカスタム音声機能を試してみることを強くおすすめします。今回解説した3つの機能の中で、カスタム音声機能は、特にユニークで、パーソナライズされた表現を可能にする点で、他の機能とは一線を画します。自分の声のクローンをAIで作成し、テキスト読み上げ機能で利用するという体験は、非常に新鮮で、動画制作の新たな可能性を感じさせてくれます。また、スマホアプリ版は、PC版と比較して、日本語対応が優れており、日本語のサンプル文で手軽にカスタム音声を作成できるため、日本語ユーザーにとっては、より使いやすい環境が整っています。カスタム音声の作成プロセスも、録音時間が短く、手順もシンプルなので、誰でも気軽に試すことができます。作成したカスタム音声は、動画のナレーションとして利用したり、キャラクターの声として利用したりと、様々な用途に活用できます。例えば、YouTube動画のナレーションを自分の声でAIに読ませたり、SNS向けのショート動画で、自分の声のキャラクターを登場させたりといったアイデアが考えられます。もちろん、カスタム音声の品質にはまだ改善の余地がありますが、無料で試せる範囲で、その可能性を十分に体験することができます。CapCutのスマホアプリ版をダウンロードして、カスタム音声機能を試すことは、新たな動画表現の扉を開き、あなたの動画制作をよりクリエイティブで、パーソナルなものにするための第一歩となるでしょう。ぜひ一度、お試しください。
#CapCut #キャップカット #横田秀珠 #CapCutコンサルタント #CapCutセミナー #CapCut講座 #CapCut講師 #CapCut講演 #CapCut研修 #CapCut勉強会
