あなたのコンピュータでAGIを実行する方法 – QwQ 32B

8,223 文字

QwQ 32B - the AI model that changes everything

Try INFINITE THINKING in Vectal: start a business with AI Agents? Go here: me on Instagra...

これがあなたのノートパソコンで実行できるAGIに最も近いものです。これはリアルタイムで、速度を上げていません。見てください、この速度は信じられないほど速いです。これは、AlibabaのQwQ 32Bという新しいAIモデルです。このモデルはOpenAI o1やDeepSeek o1よりも優れているだけでなく、完全にオープンソースで、ノートパソコンで実行できるほど小さいのです。このビデオでは、モデルのインストール方法、ローカルマシンでの実行方法、そしてAIエージェントの構築方法をステップバイステップで紹介します。
このモデルが本当に素晴らしいのは、DeepSeek o1と同等のパフォーマンスを発揮しながら、20倍も小さいということです。これは単なる都合の良いデータではなく、数学的推論、コーディング能力、一般的な問題解決能力において証明されています。これはDeepSeek自体のリリースよりも大きな出来事かもしれません。
vla.aiではQwQ 32Bを使用した無限思考が利用できます。無限思考とは何かご存じない方のために説明すると、これはあなたのタスクについて常に考え、作業し続ける完全に自律型のAIエージェントです。見てください、これほど速く出力されています。毎秒何百トークンもの速さです。無限思考を利用したい場合は、vla.aiにアクセスして登録してください。
それでは、あなたのコンピュータでローカルに実行する方法をお見せします。Amaを使用します。これは素晴らしいツールで、まだAmaをお持ちでない方は、AIに真剣な方なら必須のツールです。ダウンロードは非常に簡単で、クリックしてアプリケーションをインストールするだけです。上部の「モデル」をクリックすると、今人気があるのでQwQモデルが既に表示されているはずです。もし表示されていなければ、上部に「QwQ」と入力してここをクリックしてください。
これをコピーして、ターミナルを開きます。「でもDavid、ターミナルの開き方がわからない」という方は、Macの場合はSpotlight検索で「terminal」と入力するだけです。さらに助けが必要な場合はvlaに聞いてください。これをコピーしてターミナルを開き、そのまま貼り付けます。
初めて実行する場合は、このように速くはありません。このモデルをインストールする必要があります。このモデルは約20GBなので、インターネット速度によって時間がかかりますが、一度インストールすれば、その後はすぐにチャットができます。「ビットコインの7つの強力なセールスポイントを挙げてください」と入力してみましょう。
私のMacBookはリソースを割り当てるにつれて、どんどん音が大きくなっていきます。録画もしていることを考慮してください。この速度は素晴らしいです。これらはすべて推論で、このモデルが強力な理由です。AIエージェントの構築を始める部分にまだ到達していないことも注目に値します。これが次のステップです。
システムプロンプトも見ることができます：「あなたは役立つ無害なアシスタントです。AlibabaによってQwenとして開発されました。ステップバイステップで考える必要があります」と表示されています。チャットを終了するにはslbyまたはcontrol+Dを使用します。
ターミナルの実行方法がわかったので、次のステップはこのモデルでAIエージェントの構築を始めることです。お見せしたように、これは無限の可能性を秘めたアプリケーションを解き放ちます。私はCursorを使用します。フォルダを閉じて、「プロジェクトを開く」をクリックし、QwQを選択します。これは現在空のフォルダです。もしCursorがまだインストールされていなければ、心配しないでください。vectlaに聞いてください。どんな作業をしていても、vectlaはあなたに適応します。
Cursorをインストールしたら、私がしたように空のプロジェクトを開きます。開くと、このように表示されるので、「プロジェクトを開く」をクリックしてQwQを選択し、どの空のフォルダでも構いません。AIエージェントを構築するためにOpen Routerを使用します。
チャットを小さくして、こちらに集中しましょう。Open Routerはこのウェブサイトで、複数のプロバイダーを通じてAIモデルを使用できます。クリックして検索すると、QwQ 32Bが欲しいモデルです。ここで様々なプロバイダーが見られます。Open Routerの素晴らしい点は、アップタイムを最大化しコストを削減するためにプロバイダーを選択することです。一部のプロバイダーがクラッシュしたりダウンタイムがあったりしても、Open Routerは別のプロバイダーに切り替えるため、AIエージェントは常に実行し続けることができます。そのためvectlaは非常に安定しています。バックエンドでOpen Routerを使用しているからです。
さらに素晴らしいのは、OpenAI SDKと互換性があるため、非常に簡単に構築できることです。私のビデオをいくつか見たことがある方や、以前にAIエージェントの構築を試みたことがある方には、これはおそらくそれほど怖くないでしょう。非常に単純なコードだからです。再度、コーディングにはCursorを使用します。2025年では、もはや構文やコードの行を覚える必要はありません。AIと一緒に構築できます。
実際、現在月間111,000ドルの収益を上げているvectla自体も、CursorとClaudeの助けを借りて私自身が構築したものです。「ソフトウェアを構築するにはプログラマーである必要がある」と信じている人々はまだいますが、まともな仕事倫理と少しの野心があれば、2025年に自分のAIスタートアップを構築することができます。私がそれをどのようにステップバイステップで行ったかを見たい場合は、すべてが新しいSocietyに記録されています。
教室の中では、私が1日目からどのようにvlaを構築したかを見ることができます。自分のAIスタートアップを構築したい方は、必ず新しいSocietyに参加してください。教室内のすべてのリソースや、週ごとのサポートコール、AIの最先端にいる700人以上のコミュニティがあります。これは下にリンクされています。
さて、APIをリンクしましょう。これが必要なので、Open Routerが提供するものを単純にコピーします。これがコーディングの範囲です。ドキュメントをコピーし、Cursorに貼り付け、「新しいmain.pyファイルを作成し、上記のコードを追加してください」と言います。どのモデルでも使用できますが、GPT-4.5またはClaude 3.7をお勧めします。
私たちが必要なのはAPIキーです。コピーしたものにはAPIキーが含まれていないので、右上に行き、Open Routerにログインしていることを確認してください。GitHubまたはGoogleを使用できます。非常に簡単で、ログインに20秒かかります。ログインしたら、右上をクリックして「クレジット」をクリックします。少なくとも2ドル程度のクレジットをチャージする必要があります。ケチらないでください。QwQ 32Bを使えば長期間使えます。
APIキーを取得する必要があります。右上をクリックし、「キー」をクリックし、「キーを作成」をクリックします。これを「QwQテスト」と名付け、制限を追加する必要はありません。ちなみに、おすすめフィードに私の動画をもっと表示させたい場合は、下にある登録ボタンをクリックしてください。
ここにコードがあります。APIキーを置き換えましょう。私は文字通りOpenが提供したものをコピーしました。引用符の間にあるものをAPIキーに置き換えます。警告：APIキーは機密情報です。パスワードとして扱ってください。私はこの動画をアップロードする前に自分のキーを取り消します。決して誰とも共有しないでください。
ここにこれがあると、OpenAIに下線が引かれています。何か問題があります。これはOpenAIパッケージをインストールする必要があるからです。Cursor内でそれの上にカーソルを置き、「チャットで修正」をクリックするだけです。問題が何かを説明してくれます。エラーはOpenAIパッケージがインストールされていないことを意味します。これを修正するには、単純にpipを使用してパッケージをインストールしてください。
Cursorのおかげで非常に簡単です。「実行」をクリックするだけでターミナルが開き、自動的にコマンドが実行されます。command+Jでターミナルを閉じることができ、これでインストールされました。APIキーも貼り付けたので、これで良さそうです。実際には、これら2つのものはオプションなので、extra_headersを削除し、extra_bodyも削除することができます。
「人生の意味とは何ですか」が表示されているので、「あなたはどのAI企業が最初にAGIに到達すると思いますか」に変更します。これは完全に応答するまで待機するので、おそらく最善ではありませんが、ウェブ検索をしてみましょう。GPT-4.5を使用し、「OpenAIチャット完了APIをストリーミングする方法について検索してください」と指示し、それをCursorに貼り付けます。
問題は現在、モデル全体が応答するのを待っていることです。これは推論モデルなので、時には多くの推論を行いますが、非常に速いです。もう一つの問題は、Open Routerではプロバイダーを定義する必要がありますが、現在定義していないため、遅いプロバイダーを選択している可能性があります。
これを修正する必要があります。トークンストリーミングに変更する必要があります。そうすれば、応答が生成されるのを見ることができます。そして、選びたいプロバイダーのリストを提供する必要があります。このモデルに関しては、モデルに行くとQwQ 32Bには多くのプロバイダーがあります。オープンソースモデルなので、多くの異なるプロバイダーが提供しています。最良のものを選ぶ必要があります。
vectlaからの結果をコピーします。ウェブ検索にはPerplexity Proを使用しています。vactlaの結果を貼り付け、「上記の検索結果を使用して、トークンを適切にストリーミングするようにmain.pyを更新してください」と言います。
私は単純な英語でタイプしており、高度な魔法を使っているわけではありません。全員がこれを行うことができます。少しの仕事倫理と摩擦を押し通す能力が必要です。英語でタイプできて、諦めなければ、すでに99%の人より先を行っています。ほとんどの人はわずかな不便さで諦めます。最初のエラーを見るとすぐに諦めます。それは本当に悲しいことです。だからほとんどの人は成功しないのです。
とにかく、Cursorが行った変更を受け入れましょう。再度、私は一行のコードも書いていません。Cursorが行ったことを受け入れただけです。スクリプトを実行すると、ストリーミングされるトークンが表示されるはずです。
そしてここにあります。QwQがいかに信じられないほど速いかがわかります。何百ものAIエージェントがあなたのために異なるタスク、異なる目標を実行していることを想像してみてください。次の6ヶ月は素晴らしいものになります。
さて、さらに2つのことをお見せします。Open Routerで構築しているエージェントにウェブ検索を提供する方法です。これは本当に素晴らしいことです。Open Routerは非常に簡単にしてくれました。ドキュメントに行くか、あるいは単純な方法はvlaに尋ねることです。「Open Router経由で使用するモデルにウェブ検索機能を持たせるにはどうすればよいですか」と尋ねます。
ちなみに、ここでちょっとしたスニークピークが見えるかもしれません。vectlaに音声入力を追加しています。これはおそらく最も要望の多かった機能で、今日遅くにリリースされる予定です。vectlaの顧客であれば、ソフトウェアの未来に影響を与えることができます。
これを行う方法がわかったので、これをコピーするだけです。「モデルをオンラインに更新してください。他は何も変更しないでください」と言います。Open Routerは非常に単純にしてくれました。QwQなどのどんなモデルにも関連するウェブ検索結果を組み込むことができます。これはオープンソースモデルなので、デフォルトではウェブ検索機能はありませんが、Open Routerでは「:online」を追加するだけです。それだけです。
変更を見ると、以前はQwQ 42Bでしたが、:onlineを追加すると、ウェブ検索ができるようになります。プロンプトを「最近のビットコインカンファレンスについてウェブを検索してください」のように変更すると、ウェブ検索を実行するのに1.5秒ほどかかり、回答を提供してくれます。
最近のホワイトハウスデジタル資産サミットについて言及しています。その通り、それは3月7日、つまり昨日のことを指しています。このモデルは明らかに昨日起きたことについては知らないはずです。一定の知識カットオフがあるからです。Open Routerを使えば、どんなモデルにもウェブ検索を提供できます。非常に簡単です。
明らかにPerplexity Proほど強力ではありませんが、ほとんどの場合は十分に仕事をこなします。現在、トークンストリーミングとウェブ検索を持っているため、これは非常に強力なスタートです。ほとんどの人はPythonでAIエージェントを構築したことがなく、すでにトークンストリーミングを実装し、最新のデータを指先で利用できるようにしました。
残っているのはプロバイダーを選択することです。今はかなり遅くなっています。最速のプロバイダーを使用していることを確認したいので、QwQに戻り、プロバイダーを見て、スループットで並べ替えることができます。最速はGroです。ターミナルを停止し、コードをコピーします。vectlaに戻り、コードを貼り付けます。「Open Router APIを使用する際に特定のプロバイダーを選択する方法を調べるためにウェブを検索してください」と言います。
extra_bodyが必要なので、コピーして貼り付けます。「Groをプロバイダーとして使用し、フォールバックとしてfireworksを使用するようにmainを更新してください」と言います。fireworksも非常に高速です。
更新する必要があるファイルにタグを付けるようにします。「APIコールにextra_bodyパラメータが必要で、そこでプロバイダーを設定できます」と表示されています。これらのうちの1つがダウンになっても、Open Routerは自動的に他のプロバイダーにAPIリクエストをルーティングします。
最速のプロバイダーは毎秒461トークン、2番目は毎秒129トークンで、どちらも素晴らしい速度です。だからこそ手動で定義する必要があります。毎秒31トークンのような遅いものもありますが、毎秒461トークンを使用できるのに、なぜ毎秒31トークンを使用するのでしょうか。だからこそ、どのプロバイダーを使用するか注意し、特定のプロバイダーリストを定義したextra_bodyパラメータを使用する必要があるのです。
スクリプトを実行すると、トークンストリーミング、ウェブ検索、このモデルに可能な最高のAPIプロバイダーのリストが定義されています。もし一つがダウンしていても、問題なく別のものに切り替わります。信じられないほどの速さですね！
最初には若干の遅延がありますが、それはウェブ検索を実行しているからです。スループットだけでなくレイテンシーも重要です。fireworksは最初のトークンでGroよりも少し遅いかもしれませんが、Nebus（注：原文ではGroの言い間違い可能性あり）は両方で非常に速いようです。Groが最も速いのは明らかです。彼らは専用のLPUという文字通り専用ハードウェアを持っています。
このモデルは驚異的で、人々がこれに注目していないのが不思議です。DeepSeek o1と同等のパフォーマンスを発揮しながら、DeepSeek o1より20倍小さいのです。ぜひ私の言った通りにして、このモデルをローカルにダウンロードしてください。いつ必要になるかわかりません。
また、ローカルで実行すると、あなたのデータはどこにも行きません。誰もあなたのクエリを収集していません。あなたのコンピュータから出ていきません。これがローカルでモデルを実行する追加の利点で、完全にプライベートです。個人的または機密の質問をしたい場合は、ローカルでコンピュータ上で行ってください。ChatGPTや基本的にMicrosoftであるOpenAIにすべてのデータを送らないでください。
この世界には2種類の人がいます。見るだけの人と行動する人です。見るだけの人はこれを見て「すごい、素晴らしい」と言うだけです。私の動画を見てくれる皆さんに感謝していますが、行動する人のカテゴリーに入ってください。ただ見るだけの人ではなく、行動する人になってください。深呼吸して「OK、20分時間を取ってこれを実現しよう」と言いましょう。
Davidが示したすべてのステップに従い、Amaを通じてローカルにインストールし、おそらくCursorで最初のAIエージェントを構築してみましょう。この動画ですべてをお見せしました。未来を考えてみてください。3ヶ月後、6ヶ月後の自分を想像してみてください。現在のモデルだけを見ないでください。3ヶ月後には、このモデルの5倍、10倍強力で、おそらく7億パラメータ程度のモデルが出てくるでしょう。これは信じられないことです。
AIの分野では未来を見据える必要があります。「このモデルがここにあって、すごいですね」と盲目的に見るだけではありません。このリリースが次の3ヶ月に及ぼす影響について考えてください。これの20倍小さいモデルが出てきます。文字通り15億パラメータのモデルがあなたの電話で実行されるでしょう。
3ヶ月後に、OpenAI o1と同レベルの01レベルのモデルがあなたの電話で実行されるという動画を作る予定ですが、それでも何もしない人々がいるでしょう。もちろん、あなたたちはこの動画を見ているので、AIの改善の加速の影響を理解し、今AIに参入しなければ、AIエージェントの構築を始めないと、取り残されることを理解しているでしょう。
時間を無駄にすることが嫌いで、超生産的でありたい方は、vla.aiにアクセスして登録してください。無限思考エージェントはあなたの心を吹き飛ばすでしょう。これは他にはない完全に自律型のエージェントです。このAIエージェントは常にあなたのタスクについて考え、作業し、あなたの代わりにウェブ検索を行い、あらゆる方法で時間を節約しようとします。あなたのゴールに近づけようとします。そのゴールはユーザーコンテキストで定義され、ここでアクセスできます。
他の生産性アプリにはこれに近いものはありません。AIの最先端にいたい方、常にあなたの仕事をするのを手伝い、あらゆる方法で時間を節約するAIエージェントを持ちたい方、GPT-4.5やClaude 3.7のような最先端のモデルにアクセスしたい方は、vla.aiにアクセスして登録してください。無料で始めることができるだけでなく、開発者とも話すことができます。右下のDiscordに参加して、他のどのソフトウェアでもできないように開発者と話すことができます。
以上で、ご視聴いただきありがとうございます。素晴らしい生産的な一週間をお過ごしください。さようなら。