人工知能・AIに関するニュース(2025年12月分)Podcast配信など

先日に静岡駅の1階にあるスーパーで
買い物した豚肉、なめこ、オクラ(笑)
イーンスパイアの横田です。
https://www.enspire.co.jp

新幹線メシ生活を始めて丸2年です。
さて、本題です。
人工知能AIに関するニュースなどは
以下で随時更新して配信しています。
早速、2025年12月分の人工知能(AI)に
関するニュースを解説したい所ですが
今年1年間のニュースを振り返りました。
https://www.youtube.com/watch?v=jumDRHow33A
上記の続きの動画はYouTubeメンバーシップの
デイリー会員(190円/月)に限定公開しています。
詳しくは以下をご覧ください。
https://yokotashurin.com/youtube/membership.html
YouTubeメンバーシップ申込こちら↓
https://www.youtube.com/channel/UCXHCC1WbbF3jPnL1JdRWWNA/join
生成AIによる動画・音声・スライド・カルーセル・図解による解説は無料
動画解説
https://www.youtube.com/watch?v=N-8OmAaT0OQ
音声解説
https://www.youtube.com/watch?v=E0fYAbGisLU
スライド解説
https://www.youtube.com/watch?v=TwquC5mB4JQ
スライド
https://www.docswell.com/s/6534747/5JQJRE-2025-12-27-203203
漫画解説
https://www.youtube.com/watch?v=kNcqAX6knw8
カルーセル解説
https://www.instagram.com/p/DSxCkGPDyoc/
漫画

インフォグラフィック解説

マインドマップ

人工知能・AIに関するニュース(2025年12月分)Podcast配信など
Deep Research
2025年2月ChatGPTに搭載
AIが自ら検索して最新情報を取得する時代へ
音声入力ツール
Aqua Voice SuperWhisper VoiceInkなど登場
24時間録音デバイス
PLAUD NotePin
Limitless
音声から日記・テキスト化
AIの知能指数は1年で IQ 130 → 150 へ急上昇!
※Grok 4は一時世界一に!(その後GPT-5に抜かれる)
NotebookLM 大進化の1年
🔓 クローズドな情報にAIがアクセス可能に!
GPT-Image 1 3月
ジブリ風で話題に!
日本語テキストを画像に反映可能に
Nano-Banana / Pro
8月・11月リリース
Google発の高精度画像生成
GPT-Image 1.5
12月OpenAI反撃
さらなる品質向上
Veo 3 / 3.1(Google)
5月:音声入り映像が初めて可能に!
10月:Veo 3.1で対抗
Sora 2(OpenAI)
10月:大ブレイク!
高品質な動画生成で話題沸騰
⚠️ 2026年注目:既存音楽を学習しない新モデルへ移行予定
LLM本家がエージェント機能を搭載し始めた!
Google Workspace
Gemini標準搭載
Microsoft 365
Copilot標準搭載予定
Notion AI
Mail・Calendar連携強化
- Google AIモード 9月〜日本運用開始
- Yahoo!アシスタント デフォルト搭載
- Amazon Rufus 対話型AI導入
- 楽天市場 発見タブ追加・AIチャット予定
- Googleマップ 店舗にAIチャット機能
- LINE AIメッセージ提案 + 公式アカウントBot
🗣️ 音声会話(成熟)
📹 映像会話(これから)
Castalk も注目!
※2026年は映像リアルタイム会話が本格化予想
ポジティブな動き
課題・問題
世界初
Arc発
Perplexity
ChatGPT
Brave
Opera
MCP
Anthropic提案(2024年11月〜)
各社が追随中
Agent Skill
Anthropic提案(2025年10月〜)
エージェント連携の新規格
Apps in ChatGPT
Canva他50以上のアプリと連携
2025年4月 誕生 → 10月 Google AI Studio導入
🚀 2026年の注目ポイント
- バイブコーディングのさらなる普及
- MCP・Agent Skill の標準化
- 映像リアルタイム会話の本格化
- Chrome AIブラウザ日本上陸
人工知能・AIに関するニュース(2025年12月分)Podcast配信など
2025年のAI業界は劇的に進化した1年だった。入力面ではDeep Researchや音声入力ツールが登場し、思考面ではGPT5やClaude4など各社のモデルがIQ150近くまで向上。出力面ではNotebookLMが音声・動画解説・図解に対応し、画像・動画・音楽生成AIも大幅に進化した。AIエージェント機能が各サービスに実装され、クラウド連携やMCP、バイブコーディングも普及。著作権問題ではディズニー提携など大きな動きがあり、AIブラウザも続々登場した。

- はじめに
- AIへの入力革命 ─ Deep Researchと音声入力の進化
- AIの思考力・IQの飛躍的進化と出力機能の充実
- コンテンツ生成AIの大躍進とプラットフォームの台頭
- AIの社会実装加速 ─ ブラウザ・著作権・バイブコーディング
- おわりに
- よくある質問(Q&A)
はじめに
2025年、AI業界はまさに「激動の1年」でした。毎月のように新しいサービスが登場し、既存のAIツールも驚くべきスピードで進化を遂げました。年初にはChatGPTにDeep Researchが搭載され、年末にはバイブコーディングという新しい概念が当たり前のように使われるようになりました。
振り返ってみると、私たちの働き方やクリエイティブの在り方が根本から変わった1年だったのではないでしょうか。AIが単なる「便利なツール」から「協働するパートナー」へと進化したことを実感された方も多いはずです。
本記事では、2025年のAI業界で起きた主要な出来事を、入力・思考・出力・社会実装という4つの切り口から徹底的に振り返ります。OpenAI、Google、Anthropic、xAIといった主要プレイヤーの動向はもちろん、NotebookLMやNoLangなどの注目サービスの進化、そして著作権問題やAIブラウザの登場まで、幅広くカバーしていきます。
この1年間のAIの進化を一緒に振り返りながら、2026年に向けた展望も考えていきましょう。

AIへの入力革命 ─ Deep Researchと音声入力の進化
Deep Researchの登場がもたらした革命
2025年のAI業界を語る上で、まず外せないのが「入力」の部分、つまりAIにインプットさせる情報がどのように変わったかという点です。
なんと気づいてみれば、Deep ResearchがChatGPTに搭載されたのは今年2025年の2月のことでした。遡ると去年2024年の11月1日にChatGPT Searchが追加になったことによって、入力モードとして何か情報を取得する方法が大きく変わりました。いわゆるChatGPTが学習済みの知識ではなく、ChatGPTが検索をして最新情報を取得するという機能です。ChatGPT Searchはその典型と言えるでしょう。
そして、今年2025年の1番大きい革命と言っていいのが、まさにDeep Researchだと考えています。もちろんGoogleは2024年の暮れから同等のサービスがあったのですが、ChatGPTへの搭載によって一気に普及が加速しました。Deep Researchによって、AIが自律的に複数の情報源を調査し、総合的なレポートを作成できるようになったことは、リサーチ業務の在り方を根本から変えたと言えます。
音声入力ツールの多様化
入力面でもう一つ大きな変化があったのが、音声入力ツールの充実です。
Aqua VoiceやSuperWhisper、そしてVoiceInkといった音声入力を便利にするツールが色々と登場しました。これらはMacでしか使えないものが結構多いのですが、音声でテキストを入力するという作業が格段に効率化されました。
さらに注目すべきは、PLAUD NotePinやLimitlessといったデバイス・サービスの登場です。これらは音声を24時間録音して、そのデータをもとに日記を作成したり、1日の活動をテキスト化したりすることができるようになりました。常時録音という新しいライフログの形が生まれた1年でもあったのです。
また、画像認識の精度も大幅に向上し、画像入力もかなり賢くなりました。AIへの入力方法が多様化し、より自然で効率的なインプットが可能になったことは、2025年の大きな特徴の一つです。

AIの思考力・IQの飛躍的進化と出力機能の充実
各社LLMの驚異的な進化
入れた情報に対してAIがどう考えるか、つまり思考・IQの部分がどのように進化したかを振り返ると、本当にすごい1年でした。
OpenAIの進化
OpenAIは3月にGPT4.5をリリースし、8月にはGPT5、そして11月にGPT5.1、12月にはGPT5.2と、めちゃくちゃ進化を遂げました。わずか1年間で4つもの大型アップデートがあったことになります。
Anthropic(Claude)の進化
Claudeの方も負けていません。3月にClaude 3.7 Sonnetが出まして、5月にClaude 4、そして9月にClaude Sonnet 4.5、11月にはClaude Opus 4.5がリリースされました。特にClaude Opus 4.5は、コーディングや長文理解において圧倒的な性能を発揮し、多くのユーザーから支持を集めています。
Googleの進化
Googleも負けていません。3月にGemini 2.5 Proが、4月にGemini 2.5 Flashがリリースされました。そして11月にGemini 3.0 Pro、12月にはGemini 3.0 Flashと、着実にアップデートを重ねてきました。
xAI(Grok)の進化
xAIの方も2月にGrok 3がリリースされ、7月にはGrok 4が登場しました。このGrok 4は瞬間的には一時的に世界一の性能を記録したのですが、すぐその後GPT5に抜かれてしまいました。しかし、xAIの急速な追い上げは業界に大きなインパクトを与えました。
AIの知能指数の向上
AIの知能指数は1年間でIQ130から150近くまで上がったのがこの2025年という1年間でした。この数字だけを見ても、いかにAIの思考能力が飛躍的に向上したかがわかります。
また、ChatGPTのProモードについても大きな変化がありました。このモデルは今まではMaxプランという月3万円でしか使えなかったのですが、Teamプランでも使えるようになり、価格的な引き下げが実現しました。Plusプランでは使えませんが、より多くのユーザーが高性能なモデルにアクセスできるようになったことは大きな進歩です。

出力機能の大幅な充実
今度は出力ベースの話ですが、これもやはり結構大きな変化がありました。
NotebookLMの驚異的な進化
出力面で特に注目すべきは、NotebookLMの進化です。気づいてみれば、今年2025年1年間で音声解説ができるようになって、英語しかできなかったのが日本語も可能になりました。そして動画解説もできるようになって、これも英語しかできなかったのが日本語も可能になりました。
さらに、Nano-Bananaの登場によってインフォグラフィックもできるようになり、スライド解説もできるようになりました。しかもNano-Banana Proになって精度も大幅に向上しました。そして表形式の出力もできるようになりました。これ全部が今年2025年に起きたことなのです。
NotebookLMと同様に、Feloにもインフォグラフィックやテキスト可視化図という機能がつきました。GeminiのDeep Researchにもインフォグラフィック機能が追加されましたよね。図解を使って説明するという出力形式は、かなり進化した1年だったと言えます。

RAG技術とNotebookLMの優位性
さらにRAG(Retrieval-Augmented Generation:検索拡張生成)という技術についても触れておきたいと思います。この分野では、やはりNotebookLMが外せません。結局のところ、この分野で本格的なサービスはNotebookLMしか出ていないのが現状です。
FeloのLiveDocという機能は似通った部分がありますが、実際には全然違うものです。何かインプットした情報に対して深く理解し、活用するという点では、やはりNotebookLM、つまりGoogleのサービスが一強だと考えています。
クラウド連携の進化
もう1つ大きな変化として、クラウド連携が進んだ1年でした。
例えばChatGPTでは、GoogleドライブやGmail、OneDrive、Dropbox、Boxといったクラウドサービスとの連携が可能になりました。Googleカレンダーとの連携もできるようになっています。Googleも同様に、Googleの関連サービスを中心に連携機能を強化してきました。
これによって、自分の公開されていないクローズドの情報にAIがアクセスして、様々な処理ができるようになったというのは非常に大きな進歩です。プライベートなデータを活用したAI処理が当たり前になったことは、今年2025年の1年間における大きな変化だと考えています。

コンテンツ生成AIの大躍進とプラットフォームの台頭
画像生成AIの進化
今度はコンテンツ生成の方を見ていきましょう。まずは画像生成についてです。
OpenAIからリリースされたGPT-Image 1は大きな話題を呼びました。特にジブリ風の画像が生成できることで注目を集めましたが、本当にすごかったのは日本語テキストを画像に正確に反映できるようになったことです。これは今年2025年3月のことでした。日本語の文字が画像内で正しく表示されるという、以前は非常に困難だった課題がクリアされたのです。
その後、8月にNano-Banana、11月にはNano-Banana Proが登場しました。これらは同じくGoogleからリリースされたもので、画像生成の品質をさらに高めました。それに対抗する形で、12月にOpenAIはGPT-Image 1.5をリリースしました。
Grokの方からもFLUX搭載の画像生成AIが出て話題になりましたね。さらに爆速の動画生成AIも出て大きな注目を集めました。

動画生成AIの革命
動画生成の分野では、気づけば今年2025年の5月にVeo 3がリリースされ、初めて音声入りの映像が生成できるようになりました。これは動画生成AIにとって画期的な進歩でした。
そして10月のSora 2のリリースは、かなり大きなブレイクスルーとなりました。高品質な動画を簡単に生成できるようになり、クリエイターの間で一気に普及が進みました。これに対抗してGoogleはVeo 3.1をリリースしました。
また、忘れてはいけないのがNoLangの進化です。今年2025年1年間で本当にいろんなことができるようになりました。対話型のコンテンツ生成、自分のキャラクターを登録する機能、ショート動画への対応、縦型動画への対応など、様々な機能が追加された1年でした。
音楽生成AIの進化
続いて音楽生成AIについてです。Sunoは去年2024年の12月頃からSuno 4になりまして、その後Suno 4.5を経て、現在はSuno 5になっています。音楽生成AIの進化も本当にすごい勢いで進んでいます。
2026年に向けて注目すべき点があります。Sunoは現在のモデルを全て使えなくして、おそらく新しくSuno 6になるのか、Suno 5.5になるのかは分かりませんが、今までの音楽を学習しないモデルに変わることが発表されています。この変更によってどのぐらいクオリティが保てるかということが、非常に話題になっています。著作権問題への対応として、学習データを一新するという大きな決断です。

その他の生成AI
結構忘れがちなのですが、GeminiのGemの中に入っているStorybookという絵本生成機能があります。この機能は結構使えるもので、今後のアップデートに期待しているのですが、今のところまだ大きな発表は来ていません。
AIプラットフォーム・AIラッピングサービスの台頭
AIプラットフォームやAIラッピングサービスと呼ばれるものの台頭も、2025年は目まぐるしいものがありました。
まずPerplexityはAI検索エンジンとしてSoftBankと提携し、「パプる」という言葉も普及しましたね。「パプる」とは、Perplexityで検索することを指すスラングです。そういえば、ChatGPTも「チャッピー」という愛称が流行語にノミネートされましたね。
いわゆるAI検索として様々なサービスが連携できるようになりました。Genspark、Felo、Skywork、Manusといったサービスが次々と登場しました。Manusについてはまだ詳しく解説していないのですが、いずれ取り上げたいと思っています。
このように同時に複数のAIモデルを使えるサービスが出てきたことも、今年2025年1年間でAIが普及した背景にあると考えています。
AIエージェントの進化
AIエージェントという概念も大きく進化しました。
例えばChatGPTにエージェントモードが追加になりました。Copilotにもエージェントモードが追加になり、Gensparkにもエージェントモード、そしてGeminiのGemにもエージェントモードが実装されました。
つまり、1つのラージランゲージモデル(LLM)の中で、AIが自立的に何かの作業を完遂させるということができるようになってきたのです。今まではエージェントモードというのは外部サービスのラッピングサービスが提供していたのですが、本家本元のLLMを開発している会社自身が実装を始めました。以前はGensparkやFeloといったサービスで使っていた機能が、今ではChatGPTやGeminiで直接使えるようになったということです。

ワークスペースへのAI統合
ワークスペースの進化も大きなトピックでした。
例えばGoogleのWorkspaceの中にもGeminiが標準搭載されてきました。Microsoft 365の中にもCopilotが標準搭載されるという発表がありました。これは早ければ年内と言われていたのですが、年末を迎えた今、おそらく年明けぐらいになると思われます。
Notion AIについても触れておきたいと思います。AIが搭載されたのは去年2024年ですが、今年2025年はさらにNotionメールやNotionカレンダーが追加され、GoogleカレンダーやGmailと連携できるようになりました。Notionというワークスペースの中で、連携している様々なサービスに対してAIが活用できるようになったというのは大きな進歩です。

AIの社会実装加速 ─ ブラウザ・著作権・バイブコーディング
様々なサービスへのAIチャット実装
個人的に注目しているのは、AIチャットの様々なサービスへの実装です。
まず、GoogleにはAIモードという形で、2025年9月から日本でも運用が開始されています。検索エンジンのYahooの方もYahoo!アシスタントというものがデフォルトで搭載されました。
Amazonの中にはRufusという対話型AIが導入されました。楽天市場も近日中に追加するという話があり、一応年内と言われていましたが、少しずれ込んでいる状況です。その準備として、発見タブが追加されバナー画像やショート動画の発見が可能になりました。いわゆるInstagramの発見タブに似たものが楽天市場に追加されましたが、次のステップとして対話型AIチャットが導入されると発表されています。
さらに、Googleマップの自分のお店の中にもAIチャット機能が実装されました。LINEの個人で使う方にも、AIがメッセージを考えてくれる機能が追加になりました。LINE公式アカウントの方にも、AIのチャットボットが応答するチャットProオプションというプランが使えるようになりましたね。
このように、私たちが日常的に使うサービスの中にAIチャットが当たり前のように組み込まれるようになったのが、2025年の大きな特徴です。

リアルタイム機能の進化
リアルタイム機能についても大きな進化がありました。
まず音声会話です。ChatGPTのAdvanced Voice Modeは、この1年でめちゃくちゃ進化しました。リアルタイム文字起こしが画面に表示できるようになり、より実用的なツールになりました。
Googleの方もGemini Liveで負けていません。MicrosoftのCopilotの方のCopilot Voice、そしてGrokもGrok 3、Grok 4と音声会話ができるようになりました。
しかし、意外にまだ追いついていないのが映像会話なんです。テレビ電話と言った方が分かりやすいかもしれませんが、この分野ではGrok 4がAniを搭載したことによってかなり話題になりました。ただ、ここにはまだ他社があまり追随してきていないという状況です。
来年2026年は、映像ベースのリアルタイム会話というのが本格的に登場してくると予想しています。非常に期待したいところです。注目しているサービスとしては、Castalkというサービスがすでに人物のリアルタイムの音声会話・映像会話ができるようになっていますね。

著作権問題の動向
著作権に関しても、様々な動きがありました。
ジブリ風の画像が生成されたことでジブリは静観の姿勢を取り、OpenAIの対応も話題になりました。その後、Soraの方でも日本のアニメが多数使われて話題になりましたが、これは日本から抗議があってすぐに中止となりました。
一方で、OpenAIはディズニーと提携しまして、2026年はディズニーの作った著作物をSoraで使えるようになるということで、これはかなり大きな動きです。ディズニーは著作物に関して最も厳しい企業として知られていただけに、衝撃的なニュースでした。
音声合成の分野では、「にじボイス」というサービスがありました。ここで学習に使っている声が著作権に違反しているのではないかということで様々なクレームが入り、サービス自体が中止になりました。一方でイレブンラボは声優さんと提携して、これから拡大していくという発表がありました。この両極端な2社の対応は非常に興味深いものでした。
そしてワーナーミュージックと揉めていたSunoは和解して提携しました。これによって先ほど触れたSunoの学習モデルが変わるという話につながるのですが、著作権問題への対応として業界全体が大きく動いた1年でした。

AIブラウザの登場
AIブラウザも続々と登場しました。
まず中国の世界初と言われているFellouというブラウザに始まって、ArcからはDia、PerplexityからはComet、ChatGPTからはAtlas、BraveからはLeo、OperaからはNeonがリリースされました。そしてClaude in Chromeという拡張機能も出てきました。
次はいよいよ大本命となるGoogle ChromeのAIブラウザではないかと考えています。これは海外では既に始まっていますが、日本にはまだ来ていません。しかし、来年2026年には確実に日本でも利用可能になるでしょう。
MCP・Agent Skill・アプリ連携の進化
連携機能についても大きな進展がありました。
いわゆるMCP(Model Context Protocol)と呼ばれるものが、2024年11月からAnthropicによって提案されました。各社が今、このMCPに追随している状況です。さらにAgent Skillという考え方もAnthropicが2025年10月から提案して、これを各社が追随する流れになってきています。
ChatGPTもApps in ChatGPTということで、アプリ連携をChatGPT内でできるような仕組みになりました。連携しているアプリはCanvaを始めとして50以上にも及びます。
バイブコーディングの台頭
最後に触れておきたいのが、バイブコーディングです。
これは今年2025年の4月に生まれた言葉で、10月にはGoogle AI Studioに導入されました。バイブコーディングとは、自然言語でAIに指示を出してコードを生成させるプログラミング手法のことです。
このAIコーディングサービスとして、Cursor、Devin 2.0、Claude Code、Codex、GitHub Copilot、Kiro、Jules、Replitといった様々なツールが登場しました。バイブコーディングが当たり前になった1年と言えるでしょう。

おわりに
2025年を振り返ってみると、本当に多くの革新的な出来事があった1年でした。
入力面では、Deep Researchによってリサーチ業務が自動化され、音声入力ツールの多様化によって24時間のライフログも可能になりました。思考面では、各社のLLMがIQ130から150近くまで飛躍的に性能を向上させ、人間の専門家に匹敵するレベルに達しました。
出力面では、NotebookLMを筆頭に音声解説・動画解説・インフォグラフィックといった多様な形式での情報発信が可能になりました。そしてクラウド連携によって、プライベートな情報をAIで活用することも当たり前になりました。
コンテンツ生成では、画像・動画・音楽のすべての分野で品質が大幅に向上し、AIエージェントやワークスペース統合によって業務効率化が一層進みました。著作権問題への対応も本格化し、ディズニーとの提携など業界全体が成熟に向かっています。
2026年に向けては、MCP・Agent Skill・バイブコーディングがさらに本格化すると予想されます。映像ベースのリアルタイム会話やGoogle ChromeのAIブラウザの日本上陸も期待されます。AI業界の進化はまだまだ止まりません。
よくある質問(Q&A)
Q1: 2025年で最も革命的だったAIサービスは何ですか?
A1: 入力面ではChatGPTのDeep Research、出力面ではNotebookLMが最も革命的だったと言えます。Deep Researchは自律的な情報調査を可能にし、NotebookLMは音声解説・動画解説・インフォグラフィックなど多様な出力形式に対応しました。これらのサービスによって、AIの活用範囲が大幅に広がりました。
Q2: 各社のLLM(大規模言語モデル)はどれくらい進化しましたか?
A2: 2025年の1年間で、AIの知能指数はIQ130から150近くまで上がりました。OpenAIはGPT4.5からGPT5.2まで、ClaudeはClaude 3.7 SonnetからClaude Opus 4.5まで、GoogleはGemini 2.5 ProからGemini 3.0 Flashまで進化しました。xAIのGrok 4は一時的に世界一の性能を記録するなど、競争が激化した1年でした。
Q3: バイブコーディングとは何ですか?
A3: バイブコーディングは2025年4月に生まれた言葉で、自然言語でAIに指示を出してコードを生成させるプログラミング手法のことです。Cursor、Claude Code、GitHub Copilot、Devin 2.0などのツールが代表的です。プログラミング経験がなくても、日本語で指示を出すだけでアプリケーションが作れる時代が到来しました。
Q4: AIと著作権の問題はどのように進展しましたか?
A4: 2025年は著作権問題への対応が本格化した年でした。ジブリ風画像やSoraでの日本アニメ使用が問題視された一方、OpenAIはディズニーと提携し2026年から公式に著作物を使用可能になります。Sunoはワーナーミュージックと和解・提携し、学習データを一新する方針を発表しました。音声合成の「にじボイス」は著作権問題でサービス終了となり、対照的にイレブンラボは声優との提携を進めています。
Q5: 2026年に期待されるAIの進化は何ですか?
A5: 2026年は以下の分野で大きな進化が期待されます。まず映像ベースのリアルタイム会話(テレビ電話型AI)の本格化、Google ChromeのAIブラウザの日本上陸、MCPとAgent Skillの普及によるAI連携の標準化、そしてバイブコーディングのさらなる浸透です。また、Sunoの新しい学習モデルや、各社のAIエージェント機能の強化も注目ポイントです。
詳しくは15分の動画で解説しました。
https://www.youtube.com/watch?v=ZZx0faSQuaM
0:00 📺 導入・2025年AIニュース年間振り返り
1:08 🔍 入力の進化(Deep Reseach・音声入力)
2:19 🧠 思考力の進化(GPT・Claude・Gemini・Grok)
4:14 📤 出力の進化(NotebookLM・インフォグラフィック)
5:12 ☁️ RAG・クラウド連携の進化
5:50 🎨 画像生成AI(GPT Image・Imagen)
6:46 🎬 動画・音楽・絵本生成AIの進化
7:53 🔗 AIプラットフォームの台頭
8:58 💼 ワークスペースへのAI統合
10:06 💬 各サービスへのAIチャット実装
11:09 🎙️ リアルタイム音声・映像会話の進化
12:18 ⚖️ 著作権問題と各社の対応
13:26 🌐 AIブラウザー・MCP・Agent Skill
14:30 👋 まとめ・来年の展望
上記の15分の動画はYouTubeメンバーシップの
デイリー会員(190円/月)に限定公開しています。
詳しくは以下をご覧ください。
https://yokotashurin.com/youtube/membership.html
YouTubeメンバーシップ申込こちら↓
https://www.youtube.com/channel/UCXHCC1WbbF3jPnL1JdRWWNA/join
人工知能・AIに関するニュース(2025年12月分)Podcast配信など

🔍 Deep Research Deep Researchとは、AIが自律的にウェブ検索を繰り返し、複数の情報源から深く調査・分析してレポートを作成する機能です。2025年2月にChatGPTに搭載され、従来の単発検索とは異なり、複雑な調査タスクを自動化できる点で革命的と評価されています。
📓 NotebookLM NotebookLMとは、Googleが提供するAIノートブックサービスです。2025年には音声解説・動画解説の日本語対応、インフォグラフィック生成、スライド解説、表形式出力など機能が大幅に拡張され、入力した情報を多様な形式で出力できるRAGツールの一強となりました。
🤖 AIエージェント AIエージェントとは、AIが自律的に複数のタスクを判断・実行する機能です。2025年にはChatGPT、Copilot、Genspark、GeminiなどLLM本家にもエージェントモードが実装され、単なる対話を超えた自動処理が可能になりました。
💻 バイブコーディング バイブコーディングとは、2025年4月に生まれた言葉で、自然言語の指示だけでAIがコードを生成・実行する開発手法です。Cursor、Devin、Claude Code、GitHub Copilotなど多数のサービスが登場し、プログラミングの民主化が進みました。
🔗 MCP(Model Context Protocol) MCPとは、Anthropic社が2024年11月に提案した、AIと外部ツール・データを連携させるための標準規格です。2025年には各社が追随し、AIが様々なアプリやサービスとシームレスに連携できる基盤として普及が進んでいます。
🎬 動画生成AI 動画生成AIとは、テキストや画像から動画を自動生成する技術です。2025年5月にGoogleのVeo 3が音声付き映像生成を実現し、10月にはOpenAIのSora 2が大ブレイク。映像制作の自動化が現実のものとなりました。
🖼️ GPT-Image GPT-Imageとは、OpenAIが2025年3月にリリースした画像生成モデルです。ジブリ風画像で話題になりましたが、最大の革新は日本語テキストを正確に画像内に反映できるようになったことで、日本語圏での実用性が大幅に向上しました。
☁️ クラウド連携 クラウド連携とは、AIがGoogleドライブ、Gmail、OneDrive、Dropboxなど外部クラウドサービスのデータにアクセスする機能です。2025年にChatGPTやGeminiに実装され、個人のプライベートな情報を活用したAI処理が可能になりました。
🌐 AIブラウザ AIブラウザとは、AI機能が統合されたウェブブラウザです。2025年には中国発のFellou、ArcのDia、PerplexityのComet、ChatGPTのAtlasなどが登場。ブラウジング体験そのものにAIが組み込まれる新時代が到来しました。
🎙️ リアルタイム音声会話 リアルタイム音声会話とは、AIと音声で即座に対話できる機能です。ChatGPTのAdvanced Voice Mode、Gemini Live、Copilot Voiceなどが2025年に大幅進化。次のステップとして映像付きのリアルタイム会話が2026年の注目トレンドとされています。
超要約1分ショート動画こちら↓
https://www.youtube.com/shorts/UpzpUSFGEzo
人工知能・AIに関するニュース(2025年12月分)Podcast配信など
序論:2025年AI業界の概観
2025年は、人工知能(AI)技術の進化と社会実装において、まさに画期的な一年となりました。AIの能力を構成する「入力」「思考」「出力」の各分野でブレークスルーが相次ぎ、技術は新たな次元へと到達しました。特に入力分野ではChatGPTへのDeep Research搭載が検索とAIの融合を決定づけ、思考分野ではモデルの知能指数が飛躍的に向上、出力分野ではマルチモーダルな表現力が格段に進化しました。本レポートは、この激動の一年間における主要プレイヤーの動向を中心に、技術革新と市場の変化を構造的に分析するものです。
この分析は、ネットビジネス・アナリストである横田秀珠氏が年末のポッドキャストで語った内容を基に構成されています。本レポートの目的は、2025年のAI業界における重要な進展を企業別に整理・解説し、読者が市場の競争環境と将来の方向性を理解するための一助となることです。
——————————————————————————–
1. OpenAI:市場をリードする圧倒的な進化の追求
2025年のOpenAIは、フラッグシップモデルの驚異的な高速アップデートと、マルチモーダルコンテンツ生成への本格参入を通じて、AI業界のリーダーとしての地位を盤石なものとしました。同社は、思考モデルの性能向上とエコシステム拡大の両輪を回すことで、市場全体の進化のペースを定義し続けています。
思考(LLM)の進化
OpenAIの思考モデル、すなわち大規模言語モデル(LLM)は、2025年を通じて圧倒的な進化を遂げました。その開発スピードは、競合他社を凌駕するものでした。
• 3月: GPT-4.5をリリース
• 8月: GPT-5をリリース
• 11月: GPT-5.1をリリース
• 12月: GPT-5.2をリリース
この一年足らずの間に4回ものメジャーアップデートが行われた結果、AIの知能指数(IQ)は130から150近くまで引き上げられました。これは、単なる性能向上に留まらず、より複雑で高度なタスクを遂行できるAIの登場を意味し、業界全体のベンチマークを絶えず更新し続けるというOpenAIの明確な戦略を示しています。
コンテンツ生成能力の拡大
OpenAIはLLMだけでなく、画像や動画といった非テキストコンテンツの生成能力においても、市場に大きなインパクトを与えました。
• 画像生成: 3月にリリースされたGPT-Image 1は、技術的に最も画期的であった日本語テキストを画像へ自然に反映できるようになった点で高く評価され、同時にいわゆる「ジブリ風」の画像を生成できることで一般層の注目も集めました。その後、GoogleがNano-Banana Proをリリースすると、OpenAIはすぐさま12月にGPT-Image 1.5を投入し、激しい競争を繰り広げました。
• 動画生成: 10月に発表されたSora 2は、業界に「大ブレイク」と評されるほどの衝撃を与えました。その一方で、学習データに日本のアニメが無断使用されているのではないかという著作権問題が浮上しましたが、日本からの抗議を受け迅速に利用を中止するという対応を取りました。
戦略的提携とエコシステム構築
モデル開発に加え、OpenAIは外部との連携を強化し、自社プラットフォームの価値向上にも注力しました。
• ディズニーとの歴史的提携: 2026年からディズニーが保有する著作物をSoraで公式に利用可能になるという提携は、業界に衝撃を与えました。著作権に世界で最も厳しい企業の一つであるディズニーとの提携は、生成AIの著作権問題に対するOpenAIの姿勢と、今後のビジネス展開の可能性を力強く示すものでした。
• 「Apps in ChatGPT」構想: Canvaをはじめとする50以上の外部アプリケーションとの連携を実現。これにより、ChatGPTは単なる対話型AIから、様々なタスクを実行できる統合プラットフォームへと昇華し始めました。
• クラウドサービス連携: Googleドライブ、OneDrive、Dropboxといった主要なクラウドストレージサービスとの連携機能が追加され、ユーザーは自身の非公開情報にアクセスし、よりパーソナライズされた作業を行えるようになりました。
OpenAIの動向を総括すると、同社はモデル性能の垂直的な進化と、外部サービスとの連携による水平的なエコシステム拡大を同時に推し進めることで、市場を強力に牽引しています。次に、この絶対的リーダーに対し、独自の戦略で対抗するGoogleの動向を分析します。
——————————————————————————–
2. Google:エコシステム連携とマルチモーダル出力の深化
2025年のGoogleは、OpenAIの猛追に対抗するため、自社が保有する強力なサービス群とのシームレスな連携と、革新的な情報出力手法の確立に注力しました。特に、情報を分かりやすく「解説」する能力において独自のポジションを築き、差別化を図っています。
思考(LLM)の継続的強化
Googleもまた、基盤となるLLMの性能向上を着実に進め、自社サービスへの統合を加速させました。
• 3月: Gemini 2.5 Proをリリース
• 4月: Gemini 2.5 Flashをリリース
• 11月: Gemini 3.0 Proをリリース
• 12月: Gemini 3.0 Flashをリリース
これらのモデルは順次、Google Workspaceや検索などのコアサービスに標準搭載され、エコシステム全体の知能を底上げする役割を担いました。
出力とRAG技術の革新(NotebookLM)
Googleの戦略を最も象徴するのが、RAG(Retrieval-Augmented Generation)技術を応用したNotebookLMの進化です。2025年だけで、以下の機能を次々と実装しました。
• 音声解説機能(日本語対応)
• 動画解説機能(日本語対応)
• インフォグラフィック生成機能(Nano-Banana搭載)
• スライド解説機能
• 表形式での出力機能
これらの機能は、単に情報をテキストで出力するのではなく、視覚的に分かりやすく要約・解説するという「図解による説明」という新たな価値を提供しました。競合としてFeloのLiveDocといった類似機能も存在するが、その実用性においてNotebookLMは他を圧倒しており、RAG分野における「一強」としての地位を固めています。
コンテンツ生成と独自機能
コンテンツ生成分野でも、Googleは独自の強みを発揮しました。
• 画像生成: 8月にNano-Banana、11月には高精度版のNano-Banana Proをリリースし、OpenAIのGPT-Imageシリーズと直接競合しました。
• 動画生成: 5月に発表したVeo 3では、業界に先駆けて音声付き動画の生成を実現。OpenAIのSora 2の登場後には、すぐさまVeo 3.1をリリースして対抗しました。
• 絵本生成: Gemini内のユニークな機能として「Storybook」を搭載。ユーザーが簡単な指示を出すだけで絵本を生成できるこの試みは、今後のさらなるアップデートが期待されています。
サービスへのAI実装
Googleは、開発したAI技術を既存の広範なサービスへと積極的に実装しました。
• Google WorkspaceへのGemini標準搭載
• 日本における検索の「AIモード」開始(9月)
• GoogleマップへのAIチャット機能実装
• Google AI Studioへの「バイブコーディング」概念の導入(10月)
Googleの戦略は、自社の広大なエコシステムを最大限に活用し、特に情報の「解説」と「可視化」という点で他社との差別化を図るものです。続いて、これら二強とは異なるアプローチで市場に切り込むAnthropicとxAIの動向に焦点を移します。
——————————————————————————–
3. Anthropic & xAI:独自の哲学と高性能モデルで市場に切り込む挑戦者
2025年のAI市場は、OpenAIとGoogleの二強体制だけでなく、独自の哲学を持つAnthropicと、驚異的な開発スピードを誇るxAIという二つの有力な挑戦者の台頭により、より多様で競争的な環境へと変化しました。
3.1. Anthropic:業界標準を提案する思想的リーダー
Anthropicは、高性能モデルの開発と並行して、AI業界全体の発展を見据えた重要なコンセプトを提唱し、技術だけでなく思想的なリーダーシップを発揮しました。
思考(LLM)の進化
同社もまた、フラッグシップモデルであるClaudeのアップデートを精力的に行いました。
• 3月: Claude 3.7 Sonnet
• 5月: Claude 4
• 9月: Claude Sonnet 4.5
• 11月: Claude Opus 4.5
業界標準の提唱
Anthropicの最大の特徴は、AIの連携とスキル定義に関する先進的な提案です。
• MCP (Model Connect Protocol): 2024年11月に提唱されたこのコンセプトは、いわば「AI界のUSB」とも言えるもので、メーカーやモデルが異なるAI同士の相互運用性を確保するための標準規格を目指すものです。
• Agent Skill: 2025年10月には、AIエージェントが持つ能力(スキル)を標準化し、定義・共有するための枠組みとしてこの考え方を提唱しました。
Anthropicによるこれらの提案は、単一企業のプラットフォームにユーザーをロックインするのではなく、業界全体の相互運用性を高めることでエコシステムそのものを成長させようとする思想的リーダーシップの表れであり、GoogleやOpenAIの垂直統合戦略とは一線を画すものです。
3.2. xAI:瞬発力と独自機能で注目を集める新興勢力
イーロン・マスク氏率いるxAIは、その圧倒的な開発スピードと先進的な機能実装で、市場に大きなインパクトを与えました。
思考(LLM)の進化
xAIは少数精鋭ながら、非常に速いペースでモデルをリリースしました。
• 2月: Grok 3
• 7月: Grok 4
Grok 4はリリースされた瞬間、「一時的に世界一の性能」と評されるほどの高いベンチマークを記録しました(ただし、その直後にOpenAIのGPT-5に抜かれました)。
先進機能の実装
xAIは、他社に先駆けて革新的な機能を実装することで注目を集めました。
• FLUX技術を搭載した高効率な画像生成AIや、「爆速」と評される動画生成AIを開発。
• 特に注目すべきは、Grok 4にAniを搭載することで実現した**「映像会話」(テレビ電話)機能**です。リアルタイムで映像と音声を介した対話ができるこの機能は、他社がまだ追随できておらず、2026年にかけての主要なトレンドになる可能性を秘めています。
これら挑戦者の存在は、AI業界の技術革新のペースをさらに加速させ、市場全体の進化を促す重要な役割を果たしています。次に、これらの基盤モデルを活用して新たな価値を提供する、AIを取り巻くエコシステムの動向を見ていきます。
——————————————————————————–
4. AIを取り巻くエコシステムの多様な進化
2025年は、基盤モデルの開発競争が激化する一方で、それらを活用した多様なアプリケーションやサービスが花開いた年でもありました。AIは専門家のツールから社会インフラへと変貌を遂げ、私たちの仕事や生活の隅々にまで浸透し始めました。
• AIプラットフォームと検索エンジンの台頭 複数のAIモデルを切り替えて利用できるサービスの重要性が増しました。AI検索エンジンのPerplexityはソフトバンクとの提携で日本での認知度を高め、「パプる」という言葉が普及するほどの存在感を示しました。その他にもGenspark、Felo、Skywork、Manusといったサービスが登場し、ユーザーは目的に応じて最適なAIを選択できるようになりました。
• AIエージェント機能の標準化 自律的にタスクを実行する「エージェントモード」が、2025年の大きなトレンドとなりました。これまでは専門のラッピングサービスが提供する機能でしたが、ChatGPT、Copilot、Geminiといった基盤モデル開発元(本家)自身がこの機能を標準搭載し始めたことは、AIの自律性を大きく前進させる変化でした。
• ワークスペースへのAI統合加速 Microsoft 365へのCopilot標準搭載や、Notion AIが新たにリリースしたNotionメール・カレンダーと連携を開始するなど、私たちが日常的に使用する生産性ツールの中でAIがシームレスに利用できる環境が整備されました。
• AIチャットの社会実装 一般消費者が日常的に利用するサービスへのAIチャット導入が加速しました。
◦ 検索: Yahoo!アシスタント
◦ Eコマース: Amazon Rufus。楽天市場も導入が発表されたものの、当初の予定からは遅延が見られます。
◦ 地図: Googleマップ
◦ コミュニケーション: LINE、LINE公式アカウント
• リアルタイム・インタラクションの進化
◦ 音声会話: ChatGPTのAdvanced Voice Modeが大幅に進化し、Gemini LiveやCopilot Voiceも登場。リアルタイムでの自然な音声対話が当たり前になりました。
◦ 映像会話: Grok 4(Ani搭載)が先行するものの、他社の追随はまだ限定的です。Castalkのような専門サービスも注目を集めており、2026年の主要な戦場になると予想されます。
• 著作権とライセンスを巡る動向 AIの普及に伴い、著作権に関する動きも活発化しました。
◦ 提携と和解: OpenAIとディズニーの歴史的提携、音楽生成AIのSunoとワーナーミュージックの和解。
◦ 問題とサービス中止: Soraの日本アニメ利用問題や、音声合成サービス「にじボイス」のサービス中止。
◦ 新たなビジネスモデル: イレブンラボが声優と正式に提携するなど、クリエイターと共生する新たなモデルも生まれました。 これらの動きは、2025年が生成AIの著作権問題において、無法な利用が淘汰され、ライセンス契約を通じた共存モデルが本格的に模索され始めた転換点であったことを示しています。
• 新カテゴリーの登場(AIブラウザとバイブコーディング)
◦ AIブラウザ: Fellou、Arc Dia、Perplexity Comet、ChatGPT Atlas、Leo(Brave)、Neon(Opera)、そしてChrome拡張機能のClaude in Chromeなど、ブラウジング体験そのものをAIで変革しようとする新しいブラウザが次々と登場しました。次はいよいよ大本命であるGoogle ChromeのAIブラウザ登場が待たれる状況です。
◦ バイブコーディング: 2025年4月に生まれた、AIと対話しながらコーディングを進める新しい開発手法です。CursorやDevin 2.0といったツールが登場し、開発者の生産性を飛躍的に向上させる可能性を示しました。
——————————————————————————–
結論:2025年の総括と2026年への展望
2025年のAI業界は、思考モデルの性能向上という縦軸の競争が激化する一方で、出力の多様化、既存サービスへの統合、著作権という社会課題への対応といった横軸の広がりが同時に進んだ、極めてダイナミックな一年でした。
象徴的だったのは、ChatGPTの愛称である「チャッピー」が流行語にノミネートされたことです。これは、AIが一部の技術的なトピックから、社会全体が関心を持つ文化的な現象へと変化したことを示しています。
2026年の競争軸は、もはや単一モデルの性能指数だけでは測れません。開発手法そのものを変革する「バイブコーディング」の浸透度、そしてAI間の連携を規定し、業界の覇権を左右する「MCP」や「Agent Skill」といった標準化の主導権争いが、真の勝者を決定づけるでしょう。我々はこの構造変化をこそ、注視しなければならないのです。
#AI #人工知能 #横田秀珠 #生成AI #生成AIコンサルタント #生成AIセミナー #生成AI講師 #生成AI講演 #生成AI講座 #生成AI研修 #生成AI勉強会
















