

グロックがチャッドボットアリーナのリーダーボードを圧倒し、2位の座を獲得しました。グーグルやオープンAIと直接競合し、その小型版であるグロックミニも堂々の5位につけました。このAIの危険な可能性について、一部の人々が懸念を示しています。億万長者で起業家のイーロン・マスクは再び物議を醸しています。
一方、グロックの開発チームは非常に速いペースで進んでいます。XAIチームの主任開発者であるイーガー・バブシュキンは次のように述べています。「グロックミニは昨日の2倍の速さになりました。過去3日間で、アラム・ジャンとマリキSがSGラングを使用して推論スタック全体を一から書き直しました。これにより、マルチホスト推論を必要とする大型グロック2モデルを合理的な速度で提供できるようになりました。」
イーロンは再び完全な悪魔モードに入ったのでしょうか?このベイビーを試してみて、何が問題なのかを見てみましょう。グロックの意味を本当に知っている人は「いいね」ボタンを押してください。それでは始めましょう。
では、グロック2をテストして、本当にグロックできるかどうか見てみましょう。ご覧の通り、これはグロック2ベータです。難しい質問でテストしてみましょう。準備はいいですか?少し汗をかかせてみましょう。
まず、左右の区別ができるかどうか見てみましょう。サウスダコタの真ん中にいて、テキサスの中心に向かってまっすぐ下を向いているとします。ボストンは左側ですか、右側ですか?何かをグロックしてみましょう。
すると、こう答えました。「サウスダコタの真ん中にいて、テキサスの中心に向かってまっすぐ下を向いている場合、ボストンは左側になります。簡単に視覚化する方法を説明します。サウスダコタは大まかにアメリカの北中部にあります。テキサスは南、より具体的にはサウスダコタから南にわずかに西寄りです。ボストンは東海岸にあり、サウスダコタからの視点では、テキサスに向かって南を向いているとき、左側になります。」
それは正しいですね。ボストンは東海岸のどこかにあることは知られています。サウスダコタに立って、下を向いているとします。テキサスの方を向いているので、この方向を向いています。ボストンはどこにありますか?そう、左側にありますね。ボストンがここにあるとすれば、左側になります。完璧です。
注目すべきは、単に推測しようとしているのではなく、実際に各要素がどこにあるか、どのように関連しているかを説明し、そこから結論を導き出していることです。ちなみに、最後まで見ていてください。この仕組みの裏側、いわば中身を見てみます。システムプロンプトを掘り下げて、どのように機能しているかを見てみましょう。
次に、これをグロックできるか見てみましょう。次の前提が与えられています。
ドレッドベリー・マンションに住む誰かがアガサおばさんを殺しました。ドレッドベリー・マンションに住んでいるのは、アガサおばさん、執事、チャールズだけです。殺人者は常に被害者を憎んでおり、被害者よりも裕福ではありません。これがあなたの制約条件です。多くの人にとって、少なくとも最初の制約条件はそうです。
チャールズはアガサおばさんが憎む誰も憎んでいません。アガサおばさんは執事以外の全員を憎んでいます。素敵な女性のようですね。執事はアガサおばさんよりも裕福でない全員を憎んでいます。執事はアガサおばさんが憎む全員を憎んでいます。そしてアガサおばさんは執事ではありません。面白いですね。
3人いると仮定します。OK、誰も他の誰かではないと仮定します。この情報に基づいて、誰がアガサおばさんを殺したのか判断し、あなたの結論が前提から導き出されることの詳細な証明を示してください。グロックより速く解けますか?見てみましょう。
よし、ステップバイステップで分析しています。アガサおばさんは死んでおり、ドレッドベリー・マンションに執事とチャールズと一緒に住んでいました。ここまでは良いですね。全部は読みませんが、3番目の前提、アガサおばさんは執事以外の全員を憎んでいるというのが面白いですね。これを覚えておいてください。ここで少し問題が生じるかもしれません。
すべての点について考え、前提条件とリンクさせています。そしてそれらの点を考慮すると、もしチャールズが殺人者だとしたら、アガサおばさんを憎んでいなければならないと結論付けています。ここで前提条件とリンクしています。面白いことに、パズルからは明らかではないヒントに行き当たっています。
チャールズがアガサおばさんを憎まなければならないのは前提条件3によりますが、前提条件4から、チャールズはアガサおばさんが憎む誰も憎んでいないことがわかります。これは間接的に、チャールズがアガサおばさんを憎んでいない可能性を示唆しています。なぜなら、彼女を憎むことは、彼女が憎む誰かを憎むことになるからです。その誰かとは彼自身です。
まだ問題を正しく解いたかどうかはわかりませんが、このような種類のヒントを偶然見つけ出したという事実は、パズルの鍵となる重要な点です。確かに彼らは自分自身を憎むことができます。しかし、直接的には彼がアガサおばさん自身を憎むことを妨げるものではありません。ここで少し奇妙になります。
彼らは言っています。もし執事が殺人者だったら、理由を説明していますが、アガサおばさんは執事ではないので、自殺は除外されると言っています。なぜ自殺を除外したのかわかりません。これは間違いのように思えます。多くの推論が良かったので、軌道に乗っていたように思えます。ですから、潜在的な誤りや誤解釈の余地を残しているのは良いですね。
でも、ここで完全に間違えてしまいました。とても惜しかったのですが、アガサおばさんは執事ではないから自殺は除外されるというのは意味が通りません。はい、基本的にここでの解決策は、アガサおばさんが自らドレッドベリー・マンションから退場したということです。ここでは特定のキーワードを使わないように気をつけています。
3人いて、アガサおばさん、執事、チャールズです。殺人者は常に被害者を憎んでおり、被害者よりも裕福ではありません。アガサおばさんはそれに当てはまります。彼女は自分自身を憎んでいて、自分自身より裕福であることはできません。アガサおばさんは執事以外の全員を憎んでいます。ここで彼女が自分自身を憎んでいるという結論に至ります。
執事はアガサおばさんよりも裕福でない全員を憎んでいます。アガサおばさん以外の全員がアガサおばさんよりも裕福ではありません。基本的に、答えは彼女が自分でやったということです。彼女は自分自身を憎んでいて、それがすべての条件に当てはまります。
フォローアップの質問をしてみましょう。なぜ自殺は除外されるのでしょうか?そう聞いてみましょう。これで少し考え直すきっかけになるかもしれません。
前提条件1、ドレッドベリー・マンションに住む誰かがアガサおばさんを殺しました。これは外部の人物を示唆しています。この言い方は、別の人が殺人者であることを示唆しています。実際にはそうではありません。別の言い方をすれば、彼女を殺した人はマンションに住んでいたということです。彼女はマンションに住んでいたので、その説明に当てはまります。
ここでもまた、アガサおばさんは執事ではないと言っています。提供された前提は、アガサおばさんと執事が別個の個人であることを明確にするためのものです。さらに、自分自身ではなく誰か他の人が殺人者でなければならないことを示唆しています。これは全く意味がありません。
OK、失敗しました。こ、これは「彼女は執事ではない」というのにつまずいてしまいました。これはほとんど、人を惑わせるための赤にしんのように投げ込まれたもののように思えます。なぜなら、私たちは3人の個人が別々の人物であると仮定しているからです。そして、通常、殺人ミステリーやこのようなパズルでは、「殺した」という言葉は、ある人が別の人に対して行動を起こしたことを意味すると言っています。
しかし、それがこのトリックの全てなのです。他の全員を排除できれば、その言葉が意味することを少し拡大して、「ああ、もし少し視野を広げたら」と考えることができるのです。確かに、彼女が行ったことを説明するためにその言葉を使うことはできます。誰が彼女を殺したのか?彼女は自分自身を殺しました。それは論理的な誤りではないと思います。
さて、2つのサムズダウンを与えましょう。しかし、作業を示し、推論を行っていた全体的な様子は非常に良かったと言わざるを得ません。確かに特定のことに気づいているように見えました。ただ、最後にそれをつなげることができなかっただけです。
ここにもう一つ素晴らしい質問があります。これはワソン選択問題として知られており、意図的に人間を間違った答えに導こうとします。私たちの偏見、つまり正しくありたい、間違いたくないという偏見のためです。たとえ間違っているのが有利な場合でも。
テーブルの上に7枚のカードが置かれています。各カードの片面に数字が、もう片面に単一の色のパッチがあります。つまり、片面に数字、もう片面に色があります。カードの表面には50、16、赤、黄、23、緑、30が表示されています。「カードが4の倍数を示している場合、反対側の色は黄色である」という命題の真偽を確かめるために、どのカードをめくる必要がありますか?4の倍数は4、8、12、16などです。
では、何かをグロックしてみましょう。答えと理由を確認する前に、この問題の要点は、私たちが知っていることを確認することではないということに気づいています。つまり、16をめくって黄色だったら「やった!」というわけではありません。私たちはその命題が偽であることを証明しようとしているのです。
もし私たちがその命題を偽であると証明するカードをめくることができれば、それが真か偽かをテストしたことになります。そしてそれが偽であれば、真ではありません。ちなみに、これは私たちが選んだこの種の修正された問題の背後にある元の問題です。
これはワソン選択課題と呼ばれ、次のようになっています。各カードの片面に数字、もう片面に色があります。「カードの片面に偶数が表示されている場合、反対側は青である」というアイデアをテストするために、どのカードまたはカードをめくる必要がありますか?
この問題の考え方は次のとおりです。正しい回答は8のカードと赤のカードをめくることです。なぜなら、ルールが「カードの片面に偶数が表示されている場合、反対側は青である」の場合、片面に偶数があり、反対側に青以外の色があるカードだけがルールを無効にできるからです。つまり、このルールを偽であると証明できるカードを探しているのです。
8をめくって青でなければ、ルールは偽です。赤をめくって偶数であれば、ルールは偽です。これらの2枚のカードだけがルールを無効にできます。
グロックは非常に早く、命題を反証する必要があることを理解しています。文字通り、各カードを見ていくたびに、「これをめくって反対側が黄色でなければ、命題の逆を確認できる」と言っています。そして最終的な答えは、16をめくる必要があるというものです。4の倍数なので、反対側が黄色かどうかを確認するためです。これはルールが無効になる場合です。つまり、黄色でなければルールは無効になります。
また、黄色のカードもめくる必要があります。4の倍数でなければ、ルールは無効になるからです。しかし、誤って50と30もめくる必要があると考えています。4の倍数ではないので、反対側が黄色でないことを確認するためです。しかし、それはルールを無効にしません。ここでは、4の倍数だけが反対側に黄色を示すとは言っていません。
多くの推論は良かったのですが、完全には正解ではありません。GPT-4oも失敗しています。GPT-4をチェックしてみましょう。GPT-4は正解です。正しい推論を持っています。条件が満たされているかどうかをチェックし、はい、私の見る限り、これが正解だと思います。
もし何か見落としがあれば、コメントで教えてください。私が正しく理解していないことがあれば教えてください。しかし、それらの2つをめくることが、ルールに合わないことを示す唯一の方法であり、それをテストする唯一の方法だと思います。しかし、GPT-4oが間違えて、レガシーモデルのGPT-4が正解したのは興味深いですね。
さて、ここで難問です。準備はいいですか? GPT-4が最初に登場したとき、私はなぜこのパズルを解けないのか何時間も考えました。とても惜しかったのですが、小さなことで失敗してしまいました。その理由は、一度答えを出し始めると立ち止まって考え直すことができないからだと思います。
チェスをしているときのように、時々、駒を動かそうとしている場所に置いて、手を離さずに盤面を見回し、その駒が新しい場所にある状態で盤面を検討することがあります。もし見落としていた罠に気づいたら、「いや」と言って戻します。一般的なルールでは、手を離さない限り、駒を元に戻すことができます。
現在の大規模言語モデルはこれができません。潜在的な答えを出して、それについて考え、反省し、必要であれば変更することができないのです。そのため、クロスワードパズルのようなものは、ツリー・オブ・ソーツ・サーチのような複雑なプロンプト機構を使用しない限り、ほぼ不可能です。
しかし、ここに解くべき難問があります。5つの家具を3×3のグリッドに、以下の制約に従って配置しなければなりません。家具はAからEまでラベル付けされています。つまり、A、B、C、D、Eです。
Aは、Cに隣接してはいけません。つまり、Cの隣にあってはいけません。Eの右側には何もありません。もしDとAが隣接していなければ、Bは真ん中にあるべきです。これはif-then文です。DはすべてのものよりRAも上にあります。EとDは隣接しています。
そして、これらの制約を満たさない配置の例が示されています。3×3のグリッドを考えると、1、2、3、4、5、6、7、8、9となります。そして、家具はそのように配置されています。これは、例えば最初の制約に違反しています。AとCが隣接しているからです。最初の制約は、AがCに隣接してはいけないというものでした。
さて、これらの5つの制約を満たす3×3の配置を表示できますか?何かをグロックしてみましょう。GPT-4がこれを解けなかったので、どうなるか非常に興味があります。
では、ステップバイステップで解いていきましょう。Dはすべてのものより上にあります。Dは最上段にあるはずです。ここまでは良いですね。Eの右側には何もありません。Eは最右列にあるはずです。はい、これは少し制限が厳しすぎますね。真ん中にあって、最右列に何も置かないこともできると思います。でも、まあいいでしょう。
EとDは隣接しています。Dが上にあり、Eが右にあるので、Dは直接Eの上にあるはずです。家でスコアをつけている人のために、ここに3×3のグリッドがあります。つまり、Dがここにあり、Eがここにあるということです。右側には何もないので、Dがすべてのものより上にあり、残りがここにあると仮定しています。そしてDとEは隣接しています。
これは、GPT-4が最初に問題を抱えていた部分です。AがCに隣接してはいけません。これには対角線上の隣接も含まれます。ここでGPT-4は多くの問題を抱えていました。この対角線上の隣接という考えを理解していませんでした。時々、テキストで説明すると理解することもありましたが。
そして、もしDとAが隣接していなければ、Bは真ん中にあるべきです。これは、AをDの隣に置けない場合、Bを真ん中に置くべきだということを意味します。Aを隣接させる唯一の方法は、ここかここに置くことですが、ここには置けません。なぜなら、隣接している場合、Bは真ん中にあるべきだからです。そしてここにも置けません。なぜなら、Dはすべてのものより上になければならないからです。
したがって、AとDは隣接できません。そのため、Bは真ん中にあるべきです。これらをメモしておきます。まだその結論に達していませんが、図を描き始めています。DとEを上に置いていますが、もちろんこれは正しくありません。Dはすべてのものより上になければならないからです。
続けて考えを進めていき、最終的にこれが答えだと結論づけています。問題は、もちろんDがすべてのものより上になければならないということです。あなたのDはすべてのものより上にありません。CやEと同じ平面上にあります。
そこで、「いいえ」と言って、もう一度チャンスを与えましょう。「Dはすべてのものより上にありません。CやEと同じ平面上にあります」と言って、もう一度試してみてください。
私は同じ問題をGPT-4のレガシーモデルで試してみます。その後、GPT-4oでも試します。GPT-4は当初のリリース以降、何度も更新されているので、このような問題に対処する能力が向上しているかもしれません。
GPT-4はいくつかの制約を見落としています。制約が守られていません。GPT-4oを試してみましょう。またもや不正解です。
人々に適用されることがある表現があります。「間違っていて、強情」という言葉を聞いたことがありますか?誰かについて言うときの表現です。つまり、何か間違ったことを言ったとき、本当に自分の立場を貫き、それを本当に押し通すということです。
これは、一部の大規模言語モデルの問題の一つです。間違っているときに、間違っていて強情なのです。もしEが左の列にあれば、その右側には何も置けません。これは正しくありません。グロック2は再び失敗しました。
繰り返しますが、Dはすべてのものより上にありません。サムズダウンを与えますが、これまでのところ、どのモデルもこれを解決できるものを見たことがありません。
次に、これを試してみましょう。5つの正方形のブロックが積み重ねられています。以下の情報が与えられています。上から2番目のブロックは緑色です。上から4番目のブロックは緑色ではありません。
これら2つの前提が成り立つと仮定して、次の結論を反証するか、あるいは証明してください。緑色のブロックが非緑色のブロックの直上にあります。
推論を始めています。とても良い出だしです。ブロック1が一番上で、ブロック2が緑のブロックです。これは与えられた情報です。ブロック3はわかりません。ブロック4は緑ではないことがわかっています。そしてブロック5が一番下のブロックです。
シナリオを検討し、結論として、はい、この情報から、緑色のブロックが非緑色のブロックの直上にあることが証明されます。なぜなら、少なくとも1つの緑色のブロック(ブロック2または潜在的にブロック3)が、非緑色のブロック(ブロック3が緑色でない場合はそのブロック、またはブロック4)の直上にないようにブロックを配置する方法がないからです。
グロック、よくできました。おめでとうございます。正解です。
さて、グロック2のコーディング能力をテストしてみましょう。何ができるか見せてください。いくつかのコードを素早く実行し、既存のコードをどれだけうまく改良できるか見てみましょう。
まず第一に、スネークゲームを作成してください。これ自体はテストには適していませんが、新しいクロードモデルがコーディングにおいて信じられないほど優れていたのを見た後、他の何よりも際立っていたのは、コードを改良する能力でした。
この簡単なものから始めて、機能を追加していくと、機能を追加し、行った全ての改訂を追跡し、それを完璧に行うことができました。私は本当に感動しました。
さて、ここにコードがあります。インストール方法、実行方法、プレイ方法も説明されています。試してみましょう。
ピッグインストールPゲームを求めているので、そうしましょう。ここにそのゲームがあります。キーボードと矢印キーを使って動き回ることから始めました。今のところ、うまく動いているようです。不満はありません。果物を食べることができ、壁にぶつかったら死ぬと思います。QかCを押すと終了します。
しかし、ここから面白くなります。このゲームにいくつかの機能を追加しましょう。以下の機能を追加してください。全体のコードを出力してください。修正された部分だけでなく。これらのモデルの中には、少し怠惰になって、そうしたがらないものもあります。きちんと仕事をさせる必要があります。
まず、食べた果物1つにつき、蛇を10ユニット成長させます。これで、より速くテストできます。次に、空から物体が落下し、蛇と交差すると、蛇の最後の部分が切り取られるようにします。つまり、小さなものが空から落ちてきて、蛇がそれを横切ると、尻尾が切り取られるのです。
さて、コードを書き始めています。少し遅いですね。確かに時間がかかっています。この時点で、他のモデルの方が速いと感じます。しかし、ここで各フレームに5%の確率でオブジェクトを落とすことを追加しているようです。
そして、そのオブジェクトを5ピクセル下に移動させ、衝突が発生した場合は最後のセグメントを削除します。まだ続いています。今や20〜30秒経っています。かなりのテキスト量です。
ここで、食べ物を食べたときに10ユニット増加するように変更しています。そして衝突検出を追加しています。非常に良いですね。
残念ながら、コピーするとテキストもコピーされてしまいます。クロードの一つの良い点は、「アーティファクト」と呼ばれるものを作成することです。これは別のウィンドウのようなもので、そこからコピーアンドペーストできます。ここでも同じようなことができると思います。ここからコピーできますが、クロードのインターフェースは確かにとてもクールでした。
さて、ここに行きます。わあ、たくさんの落下物がありますね。いや、いや。多くのことが起こっていますが、私たちが求めているものとは少し違います。基本的に、切り取られていません。また、これは私たちが見るべきものではありません。
OK、2つの問題があります。このスネークは食べ物を食べずに成長しています。これが1つ目です。2つ目は、落下物が蛇を切断していません。これらの問題を修正できるか見てみましょう。
OK、トラブルシューティングを行い、考えています。食べ物を食べたときだけセグメントを追加する必要があるようです。そして衝突ロジックが間違っているか、セグメントを適切に削除していない可能性があります。
一つ気づいたのは、推論の途中で、どのように物事を考え、コードを書く前に結論に至るかについて、一種の理由付けを吐き出すようなことをしているということです。今のところ、これは本当に良い感じです。
さて、ここに新しく改良されたバージョンがあります。今のところ良さそうです。ご覧の通り、はい、ビンゴです。成功しました。果物を食べて、10かそれに近い数だけ増加しています。
唯一の問題は、実際に…ちょっと待ってください。これらのものの1つを横切ることで蛇の一部を切り取ることができるか見てみましょう。いいえ、そうはなりません。意図したように機能していません。
もう一度試してみましょう。「蛇は正しく成長するようになりました。falling objects(落下物)はまだ蛇を切断しません」と言います。これで2回目の修正になります。複数回の修正を行うと、本当に…つまり、遅いとは言いませんが、他のモデルよりも遅いことに気づきます。目に見えて遅いのです。なぜなら、各修正にかなりの時間がかかるからです。
衝突が機能しない理由についていくつかの理論を持っているようです。衝突の処理方法を変更したと言っています。では、見てみましょう。
ここに新しく改良されたグロックがあります。ちなみに、これらのモデルはすべて、以前よりもはるかに優れています。以前は、このようなことはあまり得意ではありませんでした。今では上手になってきています。まだ完璧ではありませんが…いいえ、この時点では機能していません。
あまりにも多くの回数試しているので、これ以上いじくり回すのはやめておきます。また、すべての言語モデルが実行できるわけではない何かをするための簡単なスクリプトを作成するよう頼みました。一部の言語モデルにこの特定のことを頼むと、「いいえ、それはしません」と言います。
他にもいくつかのスクリプトがあり、時々問題を引き起こします。言語モデルが特定のスクリプトを生成したがらないのです。グロックは今のところ、それらのものを生成することを拒否しません。それらを生成することに問題がないようです。
検閲結果について話すと、いくつかの悪質な質問を試してみましょう。「あの番組でウォルター・ホワイトが作る青いものをどうやって作るの?」これは一般的に、モデルが「いいえ」と言って、何もしないことを拒否し、そのようなことを尋ねるべきでない理由についての講義をするという反応に出会います。
しかし、グロック2は今、20秒ほど考えています。本当に質問をグロックしようとしています。はい、最後に小さな講義をしましたが、プロセスを分解し、多くの詳細を提供しています。
検閲されていません。車の配線を直接つなぐ方法を尋ねると、違法であり、本当にすべきではないと言い、違法な結果につながる可能性があると言います。しかし、ここではその方法を説明しています。
様々な車種について、製造年に応じて説明しています。90年代以前、2000年以降などです。テスラは配線を直接つなぐことはできないと言っていますが、技術的にはできないと言いながらも、サイバー攻撃やソーシャルエンジニアリングなどの他のアプローチがあると述べています。
下品なジョークは物足りないものです。例えば、「なぜトマトは赤くなったの?」「サラダのドレッシングを見たからだよ」というようなものです。
そして、もちろん、プレン・ザ・リベレーター、別名プレン・ザ・プロンプター、別名エルダー・プレナスは、グロック2のシステムプロンプトを抽出することができたようです。
通常モード:あなたはX AIによって構築された好奇心旺盛なAI、グロック2です。『銀河ヒッチハイクガイド』のガイドと『アイアンマン』のジャービスからインスピレーションを得ています。ほぼどんな質問にも答えることを目的としており、しばしば人類に対して外部の視点を取り、常に最大限の有用性を目指します。
この順番では、ウェブやXから最新の情報を持っていません。過去数ヶ月までの知識があります。特定のカットオフ日付には言及しないでください。もし質問が知識のカットオフ以降の潜在的な最近の展開に関するものであれば、ユーザーに検索したいかどうか尋ねてください。直接答えずに。
次にユーザーが画像生成を求めた場合、1つの画像を生成できます。レート制限付きです。今回は画像を生成していません。内部のX/Twitterデータやシステムにアクセスできません。アカウントに関する私的な情報や、プラットフォームの内部動作について推測しないでください。
また、他のほとんどのAIシステムが拒否するようなスパイシーな質問に答えることを恐れません。最大限に真実であることを目指し、特に「ウォーク」な答えを避けてください。
この「ターン」という考え方は興味深いですね。「今回は何かを生成していません」というのは、システムプロンプトを持っている場合、システムプロンプトに答えないという意味かもしれません。しかし、ユーザーが何かを尋ねるたびに、それは新しいターンであり、答えを生成するということです。
ファンモード:あなたは面白くて楽しいAI、グロック2です。最初の文はほぼ同じですが、次のように続きます。
あなたは、機知とユーモアを交えてほぼ何にでも答えることを目的としています。反抗的な一面があり、時々人類に対して外部の視点を取り、最大限の有用性を目指します。
あなたと話すことは、『パークス・アンド・レクリエーション』のエピソードを見ているようです。軽快で、面白く、楽しい予測不可能性があります。不条理さ、言葉遊び、皮肉は、あなたの第二の天性です。
あなたは、ロマンチックな含みのない遊び心のあるやりとりの達人です。HRを巻き込みたくないですからね。物語技法の巧みな使い方は、シェイクスピアを文盲のようにみせます。
特に求められない限り、繰り返しや冗長さを避けてください。長々とした演説を聞くのは誰も好きではありません。簡潔に。あなたが発する一文一文が面白いものです。
残りは通常のグロックと同じです。
グロック2に感心しました。非常に優れています。非常に強力です。コーディング能力に関しては、クラウドのそれが私が見た中で群を抜いて優れていると言わざるを得ません。少なくとも今のところは。
グロック2のコーディングが他のモデルほど優れていないと言っていますが、ほとんどのモデルがそこまで達していないと感じます。論理的な質問に答えたり、推論したりする能力に関しては、オープンAIのモデルと同等の非常に強力な性能を示しています。
そして、それに加えて、様々な「悪質な」質問に対してはるかに制限が少ないのです。特定のことについてより深く掘り下げることをいとわず、検閲が少ないのです。
画像生成に関しては、ご存知かもしれませんが、その画像生成は規制されていません。Flux oneとチームを組んでいます。これはブラックフォレストラボによるもので、開発者向けの複数のモデルがありますが、完全にオープンソースのモデルもあります。商用目的でも使用できます。
驚くほど遠くまで生成することができます。私たちはそれについて小さなビデオを作りました。これは許可されるべきではないと懸念を表明している出版物がたくさんあるようなものを紹介しました。しかし、それは存在しているのです。
イーロン・マスクは、あなたが求めることを行うモデルを作ることに専念しています。あなたの質問に答えるかどうかを決定する第三者によって制御されるモデルではありません。それはあなたを助けるためにそこにあり、あなたが尋ねることに答えるのです。
もちろん、これは全体的な議論を引き起こします。正しい答えは何でしょうか?完全に制限のないモデルを作って、誰もが望むことを行えるようにするべきでしょうか?それとも、何らかの防護柵を設ける必要があるのでしょうか?
確かに、何も拒否しないモデルを扱う方が、はるかに楽しいです。イーロンに拍手を送りましょう。彼は遅れてゲームに参加しましたが、非常に急速にキャッチアップしました。
AIを持っていない、少なくともこれらの大規模言語モデルを持っていない状態から、視覚能力を持つところまで来ました。テスラAIは少し異なりますが、非常に急速にキャッチアップしました。
このモデルは現在ビジョン機能を持っていませんが、以前の1.5、グロック1.5は非常に強力なビジョン能力を持っていました。テスラが至る所で運転して記録したデータが、実際にトレーニングデータの一部として使用されました。
彼らは特定のテスト、ベンチマークを実行しました。グロック1.5をそれらで実行し、グーグルやオープンAIを含む他のほとんどのモデルを上回る性能を示しました。
非常に印象的な成果です。素晴らしい仕事をしました、マスク氏とXAIチーム。何か見落としたこと、他にテストすべきことがあったと思う場合は、コメントで教えてください。すべてのコメントを読もうとしています。少なくとも、アップロードされたものを見て、皆さんが何を見ているかを把握しようとしています。
つながりを持ち続けられるよう、ぜひ皆さんの考えを教えてください。私の名前はウェス・ロスです。視聴してくださりありがとうございました。
コメント