米国Googleは、高性能なAI(人工知能)モデル「Gemini(ジェミニ)」を12月6日(現地時間)に発表し、7日に日本語訳を公開した。テキスト、画像、音声、動画、プログラミングコードなどさまざまな種類の情報をシームレスに理解して組み合わせるマルチモーダルなAIとしてゼロから構築し、テキスト、画像、音声など同時に認識して理解できる。
最初のバージョンのGemini 1.0は、「Gemini Ultra」「Gemini Pro」「Gemini Nano」の3つのサイズに最適化し、データセンターからモバイルデバイスまであらゆる場所で効率的に動作する。Ultraは非常に複雑なタスクに対応する高性能の最大モデル。Proは幅広いタスクに対応する最良モデル。Nanoはデバイス上のタスクに最も効率的なモデル。
Ultraは自然な画像の理解から数学的推論、音声や動画の理解まで32の業界ベンチマークのうち30で既存AIの最高水準の結果を上回る。数学、物理学、歴史、法律、医学、倫理など57科目を組み合わせてテストする「MMLU(大規模マルチタスク言語理解)」で90.00%をスコアし、人間の専門家を上回るパフォーマンスを示した初のAIモデルになった。
GeminiはGoogleの各製品を通じて提供され、会話型AIサービス「Bard(バード)」では理解と要約、推論、ブレインストーミング、文章編集、計画の立案などBardでできることが大幅に向上する。170以上の国と地域で英語で利用でき、今後数カ月以内にさまざまなマルチモーダルデータに拡大して、新しい場所や言語のサポートを追加する。
スマートフォンの「Google Pixel」に導入し、「Google Pixel 8 Pro」はネットワーク接続がなくてもNanoを実行できる初のAI内蔵スマホに。レコーダーアプリの要約やメッセージングの「WhatsApp」と仮想キーボード「Gboard」でスマートリプライ(返信)できる。日本語対応は未定。「Google検索」「広告」「Chrome」にも導入される。
※このコンテンツはWebサイト「Web担当者Forum - 企業Webサイトとマーケティングの実践情報サイト - SEO・アクセス解析・SNS・UX・CMSなど」で公開されている記事のフィードに含まれているものです。
オリジナル記事:Googleが高性能AIモデル「Gemini」発表、マルチモーダルで高度な推論性能を備える
Copyright (C) IMPRESS CORPORATION, an Impress Group company. All rights reserved.