
3,172 文字

ここ数ヶ月間、特にOpenAI社のo1やo3、DeepSeek R1のような推論モデルのリリースにより、教育がこれから来るAIの波に適応する必要があり、しかもそれを非常に迅速に行う必要があることが、私にとってますます明確になってきました。特に、教育者がどのように学生の能力を評価できるのかについて考えています。
私の意見では、この時点で完全に取り除く必要がある分野の一つが宿題という概念です。特に教科書の後ろや章末から抜き出しただけの宿題の場合はそうです。数学や理科の授業で教科書の問題があって、その問題を学生に出すとしても、もはやそれらの問題は安全ではないと考えています。
私が学生だった頃と比べると、これらの課題は長く骨の折れるもので、問題にどう取り組み始めるかを理解するだけでも、学生たちがホワイトボードの前で何時間も費やす必要がありました。しかし、これらの推論モデルを利用できる現在の学生が払う必要のある努力のレベルは、大幅に減少しています。
そのため、教育者は学生の評価方法のモデル全体を変更することを考え始める必要があると思います。宿題を完全に廃止し、主にプロジェクトや試験に焦点を当てる、あるいは持ち込み禁止の試験や口頭試験にするなどの方法が考えられます。しかし、教科書のような問題で、学生がChatGPTに入力して solid な回答や少なくとも取り組み始めるための確かな出発点を得られないものは、もはほとんど残っていないと思います。
私がこれを知っている理由は、ここ数ヶ月間、これらのAIモデルにさまざまな質問を与えて試してきたからです。そして今日の午後、私はノーベル物理学賞受賞者である故スティーヴン・ワインバーグの「講義:天体物理学」という本を調べてみました。この本は以前私の動画でも取り上げたことがありますが、巻末に12個の問題があります。著作権の関係でここでは紹介できませんが、12個の問題があり、この本は大学院初年度の学生や学部の上級生、あるいは私のように知識を復習する必要のある研究者向けに書かれています。
私はこの本のすべての問題を解いたわけではありませんが、12問中3、4問は解いています。私が解いた問題だけでなく、この本の巻末にあるすべての問題についてAIモデルが何ができるかを見て、教科書にある安全なテスト問題集はもはや存在しないと確信しました。この本のように、オンラインで公開されている既知の解答や解説マニュアルがないと思われる本でさえも、これらのAIモデルを出し抜くには十分ではないと考えています。
今日の午後、私はOpenAI o1 ProとともにO3 mini high、DeepSeek R1、そしていくつかの質問については(全部ではありませんが)Gemini 2.o proの実験モデルにも試してみました。
これらの質問のすべてを詳しく説明するつもりはありません。なぜなら、それが重要なポイントではないからです。重要なのは、本の巻末の問題を取り出し、LaTeXに変換してo1 ProやO3 mini high、DeepSeek R1に入力できる形式にするのに、午後の時間をすべて使う必要もなかったということです。私が問題にどう取り組み始めるかを考える前に、彼らはすでに問題を解いていたか、少なくとも最終的な答えを出していました。
先ほど言ったように、私はこの本のすべての問題を解いたわけではないので、すべての答えを正確に検証することはできませんが、私が解いた問題については、彼らは複数の問題を正しく解いたと言えます。ただし、正しく解けなかった問題も1問ありました。つまり、彼らは完璧ではありませんが、それが私の言いたいポイントではありません。
私が言いたいのは、このような難しい問題を解こうとするのに必要な努力の量が大幅に減少したということです。たとえ導出が完全に正しくなくても、これらの問題をどのように解くかについての足がかりを与えてくれます。これは究極的には良いことだと思います。
ただし、先に進む前に指摘しておきたいのは、私は学生がこれを行って宿題をカンニングすることを推奨しているわけではないということです。私が言いたいのは、教育者の皆さんに、学生が本当に宿題を意図された方法で行わないことに専念した場合に可能なことを見てほしいということです。そして、もはや誰の時間も宿題を出すのに使うのは良い使い方ではないかもしれません。
特にO3 mini highやR1のようなモデルがある場合、例えばこの問題について、これはO3 mini highの答えですが、DeepSeek R1も同じ答えまたは同じ形式の答えを出していると思います。つまり、これらの質問を異なるモデルに入力して、異なる視点を得ることができます。ここに示したのは2つだけですが、o1 Proの答えも見ることができ、そこから必要なものを取り出して進めることができます。
オンラインに既知の解答がない問題でさえ、AIモデルによって分析され、解決できることが明確になりました。たとえ完全に正しい答えを出せていなくても、学生がこれらの問題を解くために払わなければならない努力のレベルが大幅に下がっているため、もはや教科書の問題を出題することは誰の利益にもならないかもしれません。
私はここですべての問題を個別に評価するつもりはありません。ただ、この本から問題を取り出し、3つの異なる推論モデルに入力し、私が解いた問題を見て、実際に正しく解けていることを確認するのが、いかに簡単だったかということに驚きました。
特にSTEM科目の教育者で、歴史的に教科書やMastering Physics、WebAssign、その他のオンラインポータルから問題を出して宿題を課してきた方々には、それを再考することを強くお勧めします。学生はAIにアクセスでき、教科書のどんな問題にも答えられる可能性があることを考慮して、授業の方法を再構築することを考えてみてください。
それは教授にとってより多くの自由時間を意味するかもしれません。少なくとも宿題に関しては採点する作業が減り、学生は利用可能なすべてのリソースを使って教材を学ぶことにより多くの時間を費やすことができるでしょう。
これは短い動画で、AIの正解をすべて見せることが目的ではありませんでした。むしろ、私が実証したように、学生がこれらのツールを使用した場合、問題を解くのがいかに簡単になるかを示すことが目的でした。
繰り返しますが、私は学生がこれを行うことを推奨しているわけではありません。これは私が大学生だった頃、みんながCheggを使っていた時期を思い出させます。特定の教科書の問題を調べると答えが出てくるCheggは素晴らしいと言われていました。これはステロイドを打ったCheggのようなものです。考えられるどんな問題に対するCheggです。
私の意見では、特に物理科学、つまり物理学、化学、数学、工学の分野で、大学レベル以下で学生に出したい問題で安全なものはほとんどありません。さらに英語や歴史でも、エッセイを書きたい場合など、どうやってこれを止めることができるでしょうか。
多くの人々が試みようとしていることは分かっています。アカデミアには、課題でのAIの使用を制限しようとあらゆる努力をする人が大勢いることを知っています。しかし、それは負け戦だと思います。むなしく沈む船とともに行くのではなく、教材や授業の教え方を適応させれば、おそらく皆がより良い状況になると思います。
これが、まだその分野にいて、学生に最高の学習成果を与えたいと考えている方々へのアドバイスです。視聴ありがとうございました。また次回お会いしましょう。
コメント