【ChatGPT】GPT-4Vの新機能と使い方5選
はじめに
- GPT-4Vは2023年9月に発表されたChatGPTの最新モデル
- 文字に加え画像入力が可能になったマルチモーダルAI
- ChatGPT Plusに加入していれば利用できる
- 画像を読み取ってさまざまなことができる
- 日常生活からビジネスまで幅広く活用できる
GPT-4Vとは
2023年9月25日、OpenAI社はCHAT GPT-4Vを発表しました。GPT-4Vの「V」はVisualのVであることからもわかるように、画像入力が可能になったのが新しい点です。さらには音声出力も可能なマルチモーダルAIの登場に、世界中の注目が集まっています。今回のアップデートによりAIの活用の幅が大きく広がると予想されています。
ChatGPTの基本的な機能や使い方についてはこちらの記事ChatGPT(チャットGPT)とは?初心者向けの使い方を紹介でくわしく説明していますのでぜひ参考にしてみてください。
GPT-4Vの始め方・料金
GPT-4Vを使うには、前提としてChatGPTの有料プランである、ChatGPT Plusに登録していることが必要となります。ChatGPT Plusの料金は月々3,000円(2023年10月現在)です。サブスクリプション方式となっているので解約するまで料金が発生することに注意しましょう。解約はいつでもできます。
ChatGPT Plusの登録の仕方や解約の仕方などはこちらの記事ChatGPT Plusとは?有料版と無料版の違いを解説でくわしく説明していますので参考にしてください。
GPT-4Vの使い方例5選
画像入力が可能になったことによってどのようなことができるのか、実例を挙げて紹介します。GPT-4Vの画像認識能力はいかほどなのでしょうか。
1.画像の内容を読み取る
有名な日本のアニメの1シーンを入力して、その内容を読み取ってもらいます。
ズバリ正解です。監督の名前や映画のテーマまで解説してくれました。GPT-4Vにとってこの程度ならお手の物といったところでしょうか。
画像出典:スタジオジブリ
2.画像に写っている場所を読み取る
位置情報についてはどこまで認識できるでしょうか。箱根・大涌谷の風景写真を入力してその内容を読み取ってもらいます。
似たような風景は日本各地にあるためか、そのものズバリの正解とはなりませんでしたが、候補として挙げた地名のトップにあるのは評価できます。二次元の画像から硫黄の堆積まで認識できています。また地熱活動エリアについての説明も的確でわかりやすいですね。
3.写真の撮り方についてアドバイスする
GPT-4Vにプロのフォトグラファーになりきってもらい、撮影した写真についてアドバイスをお願いしました。
ルール・オブ・サーズとは日本語では三分割法と言って、写真撮影の基本テクニックです。GPT-4Vが説明しているように仏像を中心に寄せるのではなく、少し左に寄せたほうが三分割法に即しているようにも思われますが、きちんと理論に沿ってアドバイスをしているのがわかります。最後に応援のコメントをしてくれているのもプロフォトグラファーらしくていいですね。
4.食べ物の画像からカロリーを算出する
お蕎麦屋さんでの食事の写真からカロリーを計算してもらいました。
小鉢の中身は野菜の煮物だったのですがGPT-4Vはそこまで認識できたようです。質量までは正確にはわからないためカロリーも推量となりましたが、おおまかには計算できています。忙しい時なども写真を1枚撮っておけば、見落としがちな薬味までGPT-4Vがチェックしてくれます。ダイエットなど、食事管理の一助となりそうです。
5.図表が何を表しているか読み取る
マーケティングのフレームワークの一例についての図表をノーヒントで入力し、何を説明しているものなのかを読み取ってもらいました。
SWOT分析、正解です。画像の中の文字情報をきちんと読み取っていますね。GPT-4Vは勉強のアシスタントとしても有能かと思われます。
マーケティングから就職活動まで使えるSWOT分析についてはこちらの記事【テンプレート付き】SWOT分析とは?わかりやすく解説でくわしく説明していますのでぜひ参考にしてみてください。
その他の使い方
- 読み取った画像をもとにHTMLやCSSなどのサンプルコードを生成する
- 画像内の言語を翻訳する
- 冷蔵庫の中身を見てオススメレシピを提案する
- 株式などのチャートを分析する
- 絵を上手に描くアドバイスをする
ChatGPTからうまく回答を引き出すには質問・指示(プロンプト)の工夫が必要です。適切なプロンプトの作成方法についてはこちらの記事ChatGPTのプロンプトとは?作成のコツやテンプレートも紹介でくわしく説明していますのでぜひ参考にしてみてください。
まとめ
ChatGPTの最新アップデートであるChat GPT-4Vでは画像入力ができるようになり、会話型AIの可能性が飛躍的に高まりました。日常生活に、ビジネスにと広範囲での活用が可能です。進化のスピードにも目を見張るものがあります。無限の可能性を秘めるAIの今後が楽しみです。