2023年2月19日の記事でChatGPTで素数について判定させました。今回は、GPT-4で同じ判定をさせてみました。その結果について紹介します。
前回の結果について
2023年2月19日の結果は以下でした。
- かなり大きな数(9999991)まで素数か合成数か正しく判定できた。
- 一方、検索すれば結果が分かると思われる素数(73939133)は正しく判断できなかった。
- 素数を判定するプログラムは生成できた。しかも性能がよいプログラムを生成した。
2023年3月14日に GPT-4 が発表されました。GPT-4 を使うことができる Chat GPT Plus は有償でしたので、有償版にアップグレードしました。以下の実験は、3月16日に行いました。なお、4月1日時点では、GPT-4 は3時間で25メッセージに制限されています。
素数を判定させてみた
例1 73939133
前回、判定に失敗した 73939133 を判定させました。この数は、最大の右切り捨て可能素数です。検索すれば、最初にでてきます。
「Model:」もGPT-4と表示されています。
検索結果を利用しているのか、言語モデルの能力が上がったかは分かりませんが、正しい回答を返すようになりました。
例2 999987
999987 = 3 × 257 × 1297 について聞いた結果です。
前回は正しく3で割れきれることを判断しましたが、今回は正しく判断できませんでした。一方、まったく同じ問い合わせを繰り返すと、2回目に正しい判断を回答してきました。
例3 9999997
9999997 = 7 × 1428571 について聞いた結果です。
前回も正しく判断できていませんでした(素数と回答)。今回は、訂正をすると正しい回答を返してきました。
最後に
ChatGPT は、大規模言語モデルの成果と説明されています。素数の定義や計算を理解して判断しているわけではないですが、かなり大きな数まで正しく素数か合成数かを正しく判断できています。
最初に間違った回答を返してきても、繰り返すことによって、もしくは誘導することによって、正しい回答を返していました。言語モデルの延長で数学的な問いにどの程度まで正しく回答できるのは興味があるため、定期的に試してみるつもりです。
なお、この記事の冒頭の絵は、Dall-E で ”A picture that imagines AI” の指示で生成した絵のひとつです。ChatGPT を有償版に移行したら、DALL-E も制限なく使えるようになったようです。
生成系AIから目を離せない状況が続きそうです。