MENU

無料なのにChatGPT4より優れた画像認識力に驚き!Gemini Pro初体験!

Gemini ProとChatGPT4比較アイキャッチ
  • URLをコピーしました!

※アフィリエイト広告を利用しています

こんにちは。日本のNFTをみんなで盛り上げて応援したい!AIにも興味深々のWeb3じいじのko_sanです。

2023年の12月6日からGoogleのBardがアップグレードされてGeminiというAIが使える様になったんだって。Chat GPT4と比べてどうなのか教えて。

そんな疑問にお答えします。実際初めて使ってみたら、無料なのに画像認識力がChatGPTより優れていたので驚きました!

この記事ではGeminiのセットアップの仕方と、実際ChatGPTと同じプロンプトで出てきた結果の違いについて紹介します。

目次

◾️Gemini(ジェミニ)とは

Gemini(ジェミニ)は、グーグルが開発した新しいAIモデルです。
従来のバードとの違いは、テキストや画像、音声など、さまざまなデータを学習することで、より自然で正確な文章を生成し、より複雑な処理をできるようになっています。

複数の異なるデータを同時に処理できるマルチモーダルという特徴があり、以下のことができることがChatGPTとの違いです。

・画像から物体や人物を認識し、その情報をもとに文章を生成することができる
・音声から言葉を認識し、その内容を要約することができる
・テキストと画像を同時に処理することで、より正確な翻訳を行うことができる

2023年12月6日にBardがアップデートされたもので、ウルトラ(2024年にリリース予定)、プロ、ナノ(モバイル上)の3つのモデルがあります。

次に設定の仕方を解説します。

◾️Gemini(ジェミニ)Proの設定の仕方

以下の手順で設定できて、無料で使うことができます。

①GoogleChrome画面で右上の自分のアカウントをクリック>Googleアカウントを管理をクリック
②左メニューの個人情報をクリック>下にスクロールして言語をクリック
③言語を現状の日本語から、言語を追加して英語(United States)にする
④Bardの画面でGemini Pro
使ってみる

それぞれ画像で解説します。

①GoogleChrome画面で右上の自分のアカウントをクリック>Googleアカウントを管理をクリック

Google Chromeの画面を開き、右上の自分のアカウントのアイコンをクリックして、Googleアカウント管理を選びクリックします。

GoogleでGeminiを使う設定方法

②左メニューの個人情報をクリック>下にスクロールして言語をクリック

左にあるメニューから「個人情報」をクリックし、下にスクロールして「言語」をクリックします。

Google ChromeでGeminiを使う設定方法

③言語を現状の日本語から、言語を追加して英語(United States)にする

現状は日本語になっているので、鉛筆アイコンの言語を追加を押して、英語(United States)にします。

Google ChromeでGeminiを使う設定方法

④Bardの画面でGemin Proを使ってみる

ここまでくれば、後はこちらのBardの画面で使える状態になっています。

Google ChromeでGeminiを使う設定方法

試しに「日本語のプロンプトを理解しますか?」と質問したところ、以下の様に使えるという回答でした。

Google ChromeでGeminiを使う設定方法

◾️Gemini Proの画像認識がどの程度なのか、同じプロンプトでChatGPT4と比較してみた例

次に画像認識がどの程度なのか、ChatGPT4と比較する意味で、最近旅先で撮影した写真をアップロードして、同じプロンプトで、何の写真で、どこの場所で撮影したものかを聞いてみました。

こちらが、Gemini Pro:

Gemini ProとChatGPT4の比較

答えはこちら:

画像は、海王丸パークにある海王丸の停泊場を示しています。海王丸パークは、富山県射水市にある公園です。海王丸は、明治時代に建造された帆船で、現在は博物館船として保存されています。
画像は、海王丸が停泊している海岸を写しています。海岸は砂浜で、海王丸の周りにはいくつかの船が停泊しています。背景には、新湊大橋が見え、海王丸パークの象徴的な景色です。

Gemini Proの回答

「周りにはいくつかの船」というのはちょっと違いますが、他は場所もきちんと回答されています。

一方で、同じ画像をChatGPT4に画像をアップして、同じ質問をした結果がこちら:

Gemini ProとChatGPT4の比較

写真には、青い空と雪をかぶった山々を背景に、大きな帆船が停泊している様子が写されています。その右側には、現代的な橋が見え、これは海上に建設されたもののようです。写真は、海辺の地域で撮影されたと考えられ、橋と船のスタイルから、おそらく日本のどこかの場所でしょう。しかし、具体的な場所は特定できません。この船が観光用か訓練用の帆船である可能性があり、橋は近代的な建築を示しており、近くの都市へのアクセスを提供しているかもしれません。海と山が近接している日本の地理的特徴を反映している場所であると推測されます

ChatGPT4の回答

画像の内容は答えているものの、場所は「日本のどこか」までで正確に特定できてませんでした。この結果から、Gemini Proの画像認識力のすごさがわかります。

◾️まとめ

2023年12月4月にGoogleの生成AI Bardがアップデートされて、Gemini Proが使えるようになりました。そのセットアップの仕方と、ChatGPT4との画像認識の違いについて実際に試してみた結果を紹介しました。

無料なのに、有料版のChatGPT4よりも優れた画像認識力を示したのには驚きました。もう少し使ってみてカスタマイズ性など比較をしてみたくなりました。

参考になれば嬉しいです。

Gemini ProとChatGPT4比較アイキャッチ

この記事が気に入ったら
いいねしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次