AI使いサトシのAI教科書

まだAIを触ったことのない超初心者のための教科書です

次世代検索エンジンBing搭載GPT-4「マルチモーダルAI」

GPT-4とは?

GPT-4は、OpenAIが開発した最新の大規模言語モデルです。

GPT-4は、テキストだけでなく、画像や動画などのマルチモーダルな入力に対応し、高度なNLPタスクを実行できます。

GPT-4の凄い点は、以下のようなものがあります。

1・GPT-4は、25,000語を超える長いテキストを処理できるため、長い形式のコンテンツの作成や拡張された会話などが可能です。

2・GPT-4は、曲の作曲や脚本の執筆など、創造的な執筆タスクを生成できるだけでなく、ユーザーの執筆スタイルを学習してフィードバックすることもできます。

3・GPT-4は、画像に対してキャプションや分類を生成することができるだけでなく、テキストやキャプションにマッチする画像を自動生成することもできます。

4・GPT-4は、外資IT企業の難解なサービス説明文を分かりやすく要約したり 、画像に対する質問に回答したり することができます。

以上のように、GPT-4は多様かつ高度な言語処理能力を持ち、様々なビジネス用途に応用されています。

 

GPT-4は以前のGPT-3.5の500倍のパワーを持つと言われているんだ
とくにマルチモーダルは注目すべき点だよ

マルチモーダルは何がスゴイの?

GPT-4の一番注目される点はマルチモーダルです。
では、そのマルチモーダルとは何でしょうか?

マルチモーダルとは、Multi(複数)とModal(様式)を組み合わせたコンピューター用語です。マルチモーダルAIとは、様々な種類の情報(映像、音声、テキストなど)を入力として利用して高度な判断を行うAIのことを指します。
テキストだけのGPT-3.5とは違いGPT-4では画像や動画、音声など様々な情報を処理することができます。

マルチモーダルAIは、人間が五感を使い分けながら高度な判断を行っているのと同様に、複数の情報を統合的に処理することで、従来のAIでは対応できなかったタスク処理が可能になる技術です。

例えば、防犯カメラでは、動画データと音声データを利用することで、迷惑行為や危険行動をより正確に認識することができます。また、フリマアプリでは、出品された商品の写真や説明文、タグなどの複数の情報を利用して、偽物や不適切な出品を検出することができます。

テキストだけでやり取りしていたAIが画像や動画、音声まで様々な情報を
自由に扱うようになり、一層人間に近づいてきたと言えます。

マルチモーダルは例えば、以下のような事例があります。

フリマアプリでは、出品された商品の写真や説明文、タグなどの複数の情報を利用して、偽物や不適切な出品を検出することができます。

防犯カメラでは、動画データと音声データを利用することで、迷惑行為や危険行動をより正確に認識することができます。

オフィス内では、人間とモノとの複雑なインタラクションを理解することで、COVID-19対策に役立つ行動監視を行うことができます。

以上のように、マルチモーダルAIは、複数種類の情報を統合的に処理することで、従来のAIでは対応できなかったタスク処理が可能になる技術です。

次世代検索エンジンBingにGPT-4搭載!

Bingに搭載しているAIは、OpenAIが開発した次世代の大規模言語モデルであるGPT-4を利用しています。GPT-4は、ChatGPTやGPT-3.5よりも強力で、検索専用にカスタマイズされています。

Microsoftは、OpenAIとのパートナーシップを通じてGPT-4を独占的に利用する権利を得ており、その一環としてチャットボット形式の検索エンジン「新しいBing」にGPT-4を搭載しています。

新しいBingは、プレビュー版として一部のユーザーに公開されており、ウェイトリスト登録することで体験することができます。

BingのAIは、検索エンジンとブラウザとチャットをひとつにまとめた統合的な体験を提供します。この体験では、以下のことができます。

①より優れた検索

Bingは、シンプルな検索に対してより関連性の高い結果を表示し、必要に応じてサイドバーでより包括的な回答を提供します。

②完全な回答

Bingは、ウェブ上の情報を検証し、ユーザーが探している答えを見つけてまとめてくれます。

例えば、「ケーキの卵の代用品」や「Ikea Klippan のラブシートがHonda Odyssey のトランクに入るか」などの質問に対して詳しく教えてくれます。

③ 新しいチャット体験

Bingは、より複雑な検索やタスクに対して新たな対話型チャットを提供します。チャットでは、詳細情報や解説やアイデアを繰り返し尋ねることで検索を絞り込んだり、コンテンツを生成したりすることができます。

例えば、「ロンドンから出発するヨーロッパ旅行の計画」や「エレクトロニックミュージックフェスティバルへの参加方法」などの質問に対して答えてくれます。

④ クリエイティブな触発

Bingはあなたに代わってコンテンツを生成してくれます。メールの下書きや旅行の行程表や採用面接の準備やトリビアナイト用のクイズ作成など、さまざまな場面で活用できます。

以上がBingに搭載しているAI GPT-4の特徴です。
では、そんなマルチモーダルAIですが、検索をどのように変えるのでしょうか?
少し深掘りしてみます。

マルチモーダルAIは、検索の体験を大幅に変える可能性があります。

従来の検索エンジンは、キーワードに基づいてテキスト情報を検索することが主流でしたが、マルチモーダルAIは、テキスト以外の複数の情報源を統合して、より詳細な検索結果を提供できるようになります。

たとえば、マルチモーダルAIは、テキスト、画像、音声、動画などの異なる形式のデータを統合し、より正確で包括的な検索結果を提供することができます。これにより、ユーザーはより迅速に、より簡単に、より正確に情報を見つけることができます。

さらに、マルチモーダルAIは、自然言語処理NLP)や音声認識、画像認識などの高度な技術を活用することができます。これにより、ユーザーは、より自然な言葉で検索クエリを入力したり、音声や画像を使用したりすることができます。

また、マルチモーダルAIは、ユーザーの検索履歴や行動を分析し、より個人化された検索結果を提供することができます。

総じて、マルチモーダルAIは、より正確で迅速な検索を実現し、ユーザーの検索体験を向上させることができます。

 

マルチモーダルAIのGPT-4を搭載するということは
AI搭載と言う以上に大きなインパクトがあるんだ

Bingの新しい使い方

新しいBingでは、以下のような新しい使い方が可能です。

①ビジュアル検索

Google Lensを使ってカメラで撮影した画像やアルバムから画像を選択してビジュアル検索することができます。

また、ビジュアル検索した結果からさらにテキストで質問することもできます。

例えば、「同じ柄の靴下」や「修理方法」などです。

②モード選択

新しいBingでは、「独創性」「バランス」「厳密」の3種類のモードから回答スタイルを選択することができます。

例えば、「独創性」モードでは、詩や物語など創造的な回答が得られる可能性が高くなります。

③Things to know

シンプルな検索クエリに対して、「Things to know」というセクションで目的の情報に辿り着くための基本的な探索ポイントを示します。

例えば、「acrylic painting」という検索クエリに対して、「アクリルペイントの始め方は?」「家のペイントでどのように使えるか?」などです。

④Refine/Broaden

トピックをズームインまたはズームアウトする候補を示します。

例えば、「acrylic painting」という検索クエリに対して、絞り込み候補では「アクリルペイント・セット」や「アクリルペインティング・オンラインコース」など、拡大候補では「有名なペインター」「ペインティング・スタイル」などです。

他の検索エンジンには無い特別な機能

マルチモーダルAIGPT-4を搭載する検索エンジンでは
他の検索エンジンではできない機能があります。
主な機能をご紹介します。

ビジュアルサーチ

画像をアップロードすることで、その画像に関連する情報や類似画像を検索できます。

ビデオサーチ

動画を検索する際に、サムネイルにマウスオーバーするとプレビューが再生されます。

リワードプログラム

Bingで検索したり、Microsoft製品を購入したりすることでポイントが貯まり、ギフトカードや寄付などに交換できます。

AIを搭載した新しいBing

チャットボット形式の検索エンジンで、GPT-4をベースとしたAIエンジンが稼働しています。ビジュアル検索やコンテンツ生成などの新しい使い方が可能です。

 

今までの検索エンジンとは全く違うものなんだ

 

BingをChromeで使う方法

BingはMicrosoftのサービスです。
Edgeからのみ利用できる物でしたが、GoogleChrome拡張機能
Bing Chat for All Browser」によって
Edge以外のブラウザからも利用できるようになりました。

ブラウザの拡張機能としてインストールするだけで
簡単にBingを利用することができるようになります。

Bing Chat for All Browsersの利用方法について

Bing Chat for All Browsersは、Microsoftが提供する拡張機能で、Google ChromeFirefoxなどのブラウザからBingのAIチャットボットを使えるようにするものです。

BingのAIチャットボットは、GPT-4をベースとしたAIエンジンが稼働しており、検索や情報提供だけでなく、詩や物語やコードなども生成できます。

Bing Chat for All Browsersの利用方法

1・ Chrome Web Storeから「Bing Chat for All Browsers」をインストールします。

2・Bingで検索したいキーワードを入力します。

3・検索結果ページにチャットボックスが表示されるので、AIと会話しながら検索できます。

4・チャットボックスの右上にあるアイコンをクリックすると、拡張機能のオプションを変更できます。例えば、言語やテーマなどを選択できます。

5・チャットボックスの左上にある×ボタンをクリックすると、チャットボックスを閉じることができます。

6・拡張機能のアイコンをクリックしてオフにすると、チャットAIは使えなくなります。

BingとChatGPTをそれぞれ利用目的に応じて使い分けるのが効率的なんだ

Bingは未来をどう変えるのか聞いてみた

GPT-4を搭載して劇的な進化を見せている検索エンジンBingですが、
これから私たちの未来をどう変えていくのでしょうか?
Bingに直接聞いてみました。

Bingがこれからの未来に変えていくことは、多くのことがありますが、私は以下の3つを挙げたいと思います。

人工知能の活用

Bingは人工知能の技術を検索やサービスに積極的に取り入れています。

例えば、BingのAIチャットはGPT-4と呼ばれるAIエンジンが稼働しており、検索や情報提供だけでなく詩や物語やコードなども生成できます。

また、Bingは画像や動画の検索にも人工知能を使っており、画像に関連する情報や類似画像を検索したり、動画のプレビューを再生したりできます。

Bingは人工知能の技術をさらに発展させて、ユーザーにより便利で豊かな体験を提供していきます。

ソーシャルメディアの連携

Bingはソーシャルメディアとも密接に連携しています。

例えば、BingはFacebookTwitterなどのソーシャルメディアからリアルタイムな情報を取得して検索結果に表示したり、ユーザーがソーシャルメディアでシェアした内容を分析して関心事や嗜好を把握したりします。

また、Bingは自身もソーシャルメディアとして機能しており、ユーザー同士が意見交換や質問回答などを行えるコミュニティスペースを提供しています。

Bingはソーシャルメディアともっと深く協力して、ユーザーにより信頼できる情報やコミュニケーションの場を提供していきます。

環境保護への貢献

Bingは環境保護への貢献も重視しています。

例えば、Bingはカーボンニュートラルな運営を目指しており、自社のエネルギー消費量や排出量を減らす努力を行っています。

また、Bingはリワードプログラムという仕組みでユーザーにポイントを付与し、そのポイントを寄付先団体へ交換することができます。

寄付先団体には環境保護団体も含まれており、ユーザーも環境保護活動に参加することができます。

Bingは環境保護への貢献をさらに強化して、地球に優しいサービスを提供していきます。

以上が私が考える未来へ変えていくことです。