新しいClaude 4がエージェントAIと共にリリース驚きの機能で世界最高と宣言

6,769 文字

NOVO Claude 4 Liberado Com Agentes iA Surpreende e Diz Ser o Melhor Do Mundo

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

皆さん、Anthropicが先ほどClaude 4をリリースしました。MCPエージェントに関する多くの新機能が含まれています。2ヶ月半前に3.7が出たばかりで新しかったあのモデルは、もう時代遅れになってしまいました。すでに新機能について話している状況です。では、この新しいClaudeで何が起こっているのか、簡単に見てみましょう。
一緒に来てください。そうです。さあ皆さん、いつものようにいいねを押してくれた皆さん、チャンネル登録してくれた皆さんに感謝しています。この人工知能チャンネルをスポンサーしてくれているチャンネルメンバー全員に特別な感謝を申し上げます。メンバーは独占的なインテリジェントエージェント動画と早期アクセス動画を利用できることを常に覚えておいてください。
では皆さん、見てください。今日、次世代のClaudeモデル、Claude Opus 4とClaude Sonnet 4を発表します。これらはコーディング、高度な推論、AIエージェントの新しい基準を定義しています。これがすでに新機能の一つですね。彼らはエージェンシックなものとの統合を行っています。そしてここに挑発的な発言が来ます。
Claude 4は世界最高のコーディングモデルで、複雑で長期間のタスクにおいて持続的なパフォーマンスを発揮します。最初の皮肉は、彼らが世界最高のコーダーだと言っていることです。そして皆さんご存知のように、Geminiはあちこちで2.5が最高だと宣伝しています。しかし明らかにダリオ・アモデイはGoogleが使用しているベンチマークのソースを気に入っておらず、今日使われているものよりもはるかに信頼できる新しいベンチマークを提案しています。
次に重要な部分は、彼らが複雑で長期間のタスクについて語っていることです。これは、アシスタントが小さな機能だけを実行したり、コードの一部だけを作成するモデルから脱却し、実際にはるかに大きな部分でコードを扱い始めることを意味しています。彼らは、このバージョン4は3.7からの大幅なアップデートで、優れたコーディング、推論を提供し、指示により正確に応答すると述べています。
そしてここで、モデルと一緒に新機能があります。ベータ版のツール使用を伴う拡張思考があり、これは拡張思考中にウェブ検索ができることを意味します。これが興味深いことの一つです。
彼らが今行っていること、実装し始めているエージェントは、推論し、ツールを呼び出し、その後コードか何かを作成し、推論に戻り、突然別のツールが必要だと気づき、ウェブ検索を行い、推論に戻るということができます。このようにして、はるかにインテリジェントな作業を続けることができます。
そして見てください、両方のモデルがツールを並行して使用できます。これはとても素晴らしいですね。これは一方で検索を行い、もう一方で問題なくコードを作成できることを意味します。彼らはまた、より正確に指示に従います。これは、Claudeが求められた以上のことをする傾向があるという評判があるために言われたことです。
ボタンの変更を頼んだら、レイアウト全体を変更してしまう。これが変わりました。今では、もっとやってほしい場合は、明示的に頼む必要があります。そして見てください、開発者のローカルファイルにアクセスできるようになると、大幅に改善されたメモリ機能を実証し、重要な事実を抽出して保存し、継続性を維持し、時間をかけて暗黙知を構築します。
これは、あなたのドキュメントやファイルを読みながら、すべてを詳細に覚えるのではなく、重要なことをメモしていくことを意味します。これは非常に興味深いです。もう利用可能です。つまり、ここのプラットフォームに来れば、新機能として、無料アカウントでも、ここにSonnet 4とOpusも表示されるということです。
ただし、OpusはProバージョンである必要があります。仕方ありません。そして古いバージョンは今すべてProになっています。つまり、ここで利用できる唯一のモデルはSonnet 4です。説明している間に、3Dカーゲームを作るリクエストをここで行うとどうなるか見てみましょう。このプロンプトは問題を起こすことをいつも覚えておいてください、皆さん。大きくなりすぎてClaudeが途中で止まって終わらないからです。
これが起こるのか、それとも正しく実行して最後まで問題なく進むのかを見てみましょう。そしてここで気づくでしょう、処理中。少々お待ちください。これはもう違いますね。始める前に少し時間がかかったのがわかります。要求されたすべての機能を備えた完全な3Dカーシミュレーターを作成します。
もうここにアップロードされて、コードがコーディングを始め、推論を始めました。彼が行き来をしているのがもうわかりますね。何かを考えて、コードを始めて、今コーディングしています。これがどう続くか見てみましょう。しかし、ニュースに戻りましょう。彼は今、4つの新しいAPI機能も持っています。
コード実行ツール。つまり、APIでコードを実行したい場合、以前は自分の側でプログラムを作る必要がありました。今では、コードを実行する関数を単純に呼び出すことができます。また、ネイティブMCPもあります。そうです、皆さん。APIでネイティブMCP。今度はファイルAPIもあります。これはAPI経由でファイルを送信できることを意味し、プロンプトを最大1時間キャッシュに保存する機能もあります。
これは、皆さん、お金を節約したい場合、以前のキャッシュは5分だったからです。これは何を意味するかというと、コーディングしていてキャッシュにものがある場合、トイレに行って戻ってきて5分経過すると、すでに送信したものにまたお金がかかり、その大きな履歴が再びお金を消費し始めることです。
今では最大1時間持続します。そして彼らは言います：「Opus 4とSonnet 4は、ほぼ瞬時の応答と、より深い推論のための拡張思考を提供するハイブリッドモデルです。そして、どのプランが必要ですか？Proプラン、Team Max、Enterpriseがすべてのモデルを含んでいます。しかし、ご覧の通り、無料アカウントでも使用できます。
彼らがここで言っているように、無料ユーザー向けです。両方のモデルはAnthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能です。価格は同じままです。つまり、高いと慣れ親しんでいた価格は、引き続き高いままです。値上がりすると思っていた場合、値上がりせず、同じままでした。
ベンチマークでは、私が話していたように、見てください、興味深いことに、ソフトウェアエンジニアリングでは、Opus 4とSonnet 4がここで、ほぼ80%の正解率で孤立してリードしており、ここで皆を置き去りにしています。自身のSonnet 3.7、OpenAIのCodex One（これはエージェント）、OpenAIのO3、GPT 4.1、さらにはGemini Proも含めてです。
そして正にここで、多くの人が知っているように、Gemini 2.5 Proを好み、Claudeより優れていると考える人がたくさんいます。しかし、開発者と話し、このチャンネルも含めて調査を行うと、実際にプログラミングし、日々それに取り組んでいる人々は、まだGeminiよりもClaudeを好んでいます。しかし、これはGeminiが悪いという意味でしょうか？いいえ、皆さん、Gemini 2.5 Proは優秀です。
問題は、プログラマーの間では、彼らにとっての最終的な答えはまだClaudeだということです。そして多くの人がClaudeを使わない理由は知性ではなく、価格が本当に少し高いと考えているからです。ですから、ここでご覧いただけるように、ベンチマークでは非常に高く評価されており、一般的にGemini 2.5 Proよりも、ここではO3と比較されています。
ただし、ここでGemini 2.5 Proが比較した場合、より高いスコアを獲得したり、基本的に同じレベルを達成したりしています。つまり、Geminiは競争力を保ち続けており、スコアがあり、輝く瞬間があります。例えば、ここで視覚推論では、Gemini 2.5 Proが彼らに勝っています。
そして、ここの条件や設定によって、Claudeは75%から90%、または70%から85%に達することができ、実行方法によってGeminiに勝ったり負けたりします。彼らはまた、モデルがタスクを完了するためにショートカットや抜け穴を使用する行動を大幅に削減したとコメントしています。
これは、時々タスクを終了せずに、実際にはまだ完了していない時に完了したと言い張る方法を見つけることがあったということを意味します。彼らはまた、メモリ容量がはるかに優れているというこの問題を強調しています。これは、例えばOpus 4が、重要な情報を保存するためのメモリファイルの作成と維持に非常に熟練していることを意味し、これは私たちが話していたことです。
そして彼らは、ポケモンをプレイさせることで、エージェンシーについて多くを学んだとコメントしました。これはGeminiが完了したと誇りに思っているゲームで、これは事実です。彼らは実際にそれをやりました。しかし、いずれにしても、ここでの問題は、このようなゲームで作業するには、コンテキストを理解し、段階を理解し、最終目標に向けて作業を開始する必要がある長期エージェントが必要だということです。
そして最後に、彼らは今、長い思考プロセスを凝縮するために小さなモデルを使用する思考要約を行います。基本的にはそれだけです。そして今、最も重要で興味深いのは、Claude Codeです。皆さん、Claude Codeはあなたのコンピューターで実行するエージェントで、今ではVS CodeとJetBrainsの拡張機能として、IDEに直接統合されます。
その通りです。もうClaude Codeアプリケーションを一方で実行し、もう一方でプロジェクトを行う必要はありません。両方がVS Code内で直接実行されます。IDE端末でClaude Codeを実行し、そこでインストールを行い、素晴らしいです。それです。
IDEに加えて、Claude Codeの同じメインエージェントを使用して独自のエージェントとアプリケーションを作成するためのSDKを作成しています。これは非常に素晴らしいですね、皆さん。Claude Codeに使用するインフラストラクチャを利用して、独自のエージェントを作成できるのです。これは素晴らしいです。そして今最も重要なことの一つは、彼のSDKがベータ版でGitHubと統合されていることですが、統合されています。
これは、プルリクエストでClaudeをタグ付けして、レビュアーのコメントに返答したり、エラーを修正したり、コードを変更したりできることを意味します。この部分は見る必要があります、皆さん。見てください、彼がここに入って、ここでClaudeをタグ付けしています。Claude、このプルリクエストのこの部分についてフィードバックをください。彼は単純に消えて、推論を行い、評価を実行します。
見てください、彼が重要だと思うことを段階的にすべて、何をする必要があるか、またはすべてが順調かを書きます。これは単純に素晴らしいです。私にとって、プログラマーの未来がもはやコードライターではないことが極めて明確になりました。その通りです。プログラマーは今、実際にプログラミングし、エージェントの調整と実際の小さな貢献により多くの注意を払うようになり、構文やより単純なことを心配するコードライターである代わりに。
これはすでに明らかになっていましたが、今では明白です。これは今後数年間に期待できることです、コーディングしない人々、その分野でない一般の人々も含めて。これは徐々により利用しやすくなり、人々はますますソフトウェアを開発できるようになり、状況は改善するだけです。
より一般的なコンテキストで何が起こっているかを理解するために、企業が今、長いコード作成プロセスと人々が行っているユースケースのデータセットを持っているため、長期思考が非常に重要であることが明らかになっています。これは最初にはそうではありませんでした、なぜならLLMが機能するかどうか誰も知らなかったからですが、今、それらが機能していることがわかったので、長期思考がますます明白になっています。
彼らはまた、Anthropic APIでエージェント構築のための新機能について話しています。そして私たちがすでに話したように、今彼らはコード実行、ネイティブMCP接続、ファイルAPI部分、および最大1時間プロンプトをキャッシュに保存する機能を持つことができます。私が言ったプロンプトキャッシュ部分、今変更されたのは5分から1時間に変わったことです。
これにより、エージェントははるかに節約できます。そしてこれは、今日VS Codeに統合されているClaude Codeでの実行で、SDKもありますが、基本的にタスクを要求し、実行を開始し、いくつかの情報を示すアセットチャートを作成できますが、基本的に物事が変わり、ますますインテリジェントになっています。
価格については、すでに述べたように、同じままです。Opusでは、入力で1500万トークン、出力で7500万トークンです。Sonnetでは、入力で300万トークン、出力で1500万トークンです。そしてここで彼らがコメントしているのは、バッチング（タスクのスケジューリング）を行う場合、50%の割引があることです。
コンテキストサイズは200kのまま変わりません。カーシミュレーターで何が起こったか見てみましょう。見てください、皆さん、彼は成功し、最初に実行し、そこで止まりませんでした。画面を大きくできるか見てみましょう。3Dカーシミュレーター。さあ、車。見てください、私たちのクレージーな列車です、皆さん。
さて、何が起こる必要があるでしょうか？コインがあり、列車があり、私と戦うAIがある必要があります。AIがそこでコインを取ろうとしています。おっと、列車が私にぶつかって爆発しました。衝突がある必要があり、それが起こりました。これらのコインが跳ねているのを見てください。なぜAIはコインを取れないのでしょうか？私は取れています。
木がある必要があります。衝突があると爆発する必要があります。爆発しています。木では爆発しませんでした。山で見てみましょう。山でも爆発しませんでしたが、青い車で見てみましょう。そして青い車と列車では爆発しています。ああ、彼女はかなりクレージーです。今度はバグが解消されました。衝突しました。おっと。
では皆さん、今度は機能したことがわかります。最初に機能しました。以前に起こっていた問題は発生しませんでした。AIはそこで少し混乱していて迷子になっていますが、非常にうまく機能しました。彼はここで彼のコメントを作成し、3D世界、ゲームメカニクス、ビジュアルなど、何をしたかを説明し、すべて美しくなっています。最初に機能しました。
これはバージョン4を使用した私の人生初のテストでした。ここで録画していますが、プレゼンテーションはまだ終わっていません。録画している瞬間、彼らはこの第2部を終えたばかりですが、今度はAIエージェントについて話し、その後Claude Codeをマスターする方法を説明する第3部があります。
では、これは午後6時で、これは午後8時になります。何もすることがない場合は、価値があるので見てください。これらのアップデートについてどう思うか、何を期待するかコメントしてください。ここでフレームワークに統合するかどうか、例えば、Claude Code、SDK上で実行、Jetbrainで実行、ここで統合されて、ここで端末で実行し、美しく小さなタスクを実行しています。
何を考えているかコメントしてください、知りたいです。このようなビデオを引き続き見るためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは独占的なインテリジェントエージェント動画と早期アクセス動画を利用できます。それです、いいねを押してください。ありがとうございました。