どうも。ひっくです。
前回記事を作成した際、ChatGPTを触ってみた感想を書きました。
執筆当時、私は性能の向上にはまだ時間がかかると思っていました。
ところが2023年3月14日(米国時間)にOpenAIからGPT-4が発表され、
その後のSNS上での使用例などを見ると、認識を改めざるを得ないと考えるようになりました。
エンジニアだけでなく、今後多くの職業で生成系AIの活用が必須になると思います。
というわけで、今回もChatGPTについて取り上げます。
GPT-4とGPT-3.5の違い
GPT3.5との大きな違いは以下の3点になるかと思われます。
性能が向上し、専門的な問題も回答できるようになった
-
アメリカの司法試験で上位10%の成績を取得(GPT-3.5では下位10%)
長い文章の入出力が可能になった
-
最大32000トークン=日本語換算約30000文字(GPT-3.5では4096トークン=日本語換算約3700文字)
画像入力が可能になった
-
現時点では研究中のため一部のみ公開。今後公開見込みだが、精度は高そう
利用用途
言語を介する作業全般において、様々な応用が可能です。
新事業創出のためのブレーンストーミングや、要件定義から評価まで手助けとなるでしょう。
プロトタイプの作成でも大いに力を発揮します。現在提供されていませんが、画像入力機能が提供されたら
画面イメージから画面そのものを生成することも容易になることが想像できます。
また、分からないことがあると調査のためWeb検索することが多いですが、
今後はChatGPTにまず聞いてみることが多くなると思われます。
ファクトチェックが大切であることに変わりはありませんが、
プロンプト(※)に「回答の根拠となったURLがあれば教えて」と含めれば、自分で検索しなおす手間も短くすることができます。
※プロンプト: ユーザーからChatGPTに与えられる入力テキストのこと
GPT-4を利用したい場合
現時点では有料版の「ChatGPT Plus」か「API経由」での利用が可能です。
無料で試してみたい場合は、BingAIに「GPT-4」が採用されているのでそちらを利用しましょう。
プロンプトエンジニアリングについて
ChatGPTからユーザーが期待する回答を得るためには、プロンプトが重要です。
そのため、プロンプトエンジニアリング(Prompt Engineering)が注目されています。
Prompt Engineering Guide(※) の日本語版に一度目を通しておくことをお勧めします。
※AI研究の海外コミュニティDAIR.AIによって作成されたサイト
トークン数の限界について知る
「GPT-4とGPT-3.5の違い」でも触れましたが、一度に入出力が可能なトークン数には限界があります。
ChatGPTと会話をしていると、少し前に話した内容を忘れているように感じることがあるかと思います。
これは、ユーザーとChatGPT間の過去のやり取りをトークン数の限界範囲までで再送信しているためです。
トークン数は、OpenAIが提供している以下サイトを利用することで計測可能です。
自分が書いた内容が何トークンになるか知りたい方は利用してみてください。
https://platform.openai.com/tokenizer
変数を定義して利用する
トークン数限界を超える会話が行われている場合でも、ある特定の情報は覚えておいて欲しい場合に
変数を定義して情報を覚えてもらう、という方法があります。
以下に変数を定義しない場合と、定義した場合の会話例を用意しました。
- 変数を定義しない場合
~ 長いやりとり~
- 変数を定義した場合
~ 長いやりとり~
変数を定義した場合、与えた情報を回答してくれていることが確認できます。
まとめ
まだまだ取り上げたい内容はありますが、今回はここまでにします。
今回取り上げた内容もほんの一部でしかないほど、生成系AIを取り巻く環境は相当なスピードで
進んでいます。特にGPT-4が発表された2023年3月14日以降は、ますます進化が加速していると感じます。
私自身もChatGPTと会話をする中で、技術的な内容について深く掘り下げられるかどうかは、
自分が持つ技術的な知識量に大きく左右されることを痛感しています。
ChatGPTからの回答に知らない内容が含まれていた場合は、ファクトチェックを行った上で、
正しい情報であれば積極的に吸収するようにしています。
生成系AIに関する最新情報を取得・理解し、同時に自分自身の能力向上を目指していくことが、今後も重要でしょう。
今回はこのへんで。ではまた!