「AI最新ニュースまとめ」Googleのビデオ技術からOpenAIの最新動向まで

今週のブログでは、Google Researchの革新的なビデオAI技術や、セレブリティのディープフェイク問題、政治分野でのAI利用、OpenAIの最新アップデートなど、AI分野の興味深い話題を取り上げます。これらのトピックを通じて、AI技術がどのように進化し、私たちの世界に新たな影響をもたらしているかを探ります。

Sara Nanase

January 31, 2024

Google Researchの最新技術：動画生成AI「Lumiere」
Adobeとスタンフォード大学のコラボレーション：「ActAnywhere」
AI ディープフェイクの話題：偽バイデンからの電話「投票するな」
AIで変わる広告戦略：Gemini が創り出す新たな検索キャンペーン
OpenAIのChat GPTの最新アップデート
Chromeに3つの新ジェネレーティブAI機能追加

Google Researchの最新技術：動画生成AI「Lumiere」

Lumiereは、Google Researchが開発した新しいビデオ生成AI技術です。この技術は、Space-Time U-Netアーキテクチャにあり、動画の空間的および時間的特徴を同時に捉えられます。これにより、動画全体のフレームを一枚の画像のように扱って、一度に生成することが可能になります。Lumiereは、テキストや画像を入力として利用し、非常にリアルな動画を生成することができるため、ビデオ制作における新たな可能性を提供しています。

Space-Time U-Net アーキテクチャ：Lumiereは、動画生成のアプローチを一新する独自のアーキテクチャを使用しています。従来のモデルがキーフレームをつなぎ合わせて動画を作る方法と異なり、Lumiereは「時空間U-Netアーキテクチャ」を採用し、モデルの一つのパスを通して動画の全時間的な連続性を一度に生成します。これは、空間と時間の両方を同時に処理する設計で、複数のフレームを組み合わせるのではなく、一つのスムーズなプロセスで全体の動画を生成する方式です。
テキストから動画への変換：Lumiereは、テキストから動画への変換することが出来ます。
イメージから動画への変換：Lumiereは、静止画像をスムーズに動画に変換する機能を持っています。
Stylized Generation（スタイル化生成）：単一の参照画像を使用して、Lumiereは目標とするスタイルの動画を生成することができます。これにより、ユーザーはユニークなスタイルとテーマの動画を作成することが可能になります。つまり、リファレンスとして提供された画像を参照してtext-to-imageモデルを発展させて好きな動画を作ることができます。例えば、輝くキノコの写真を参照として提供し、踊るクマの写真をテキストとして提供すると、動くクマの動画が実現されます。

Video Stylization（ビデオスタイリゼーション）：Lumiereを使用すると、既製のテキストベースの画像編集方法を一貫したビデオ編集に使用できます。
Cinemagraphs：Lumiereモデルは、ユーザーが指定した特定の領域内の画像のコンテンツをアニメーション化することができます。例えば、草原の蝶の写真を提供し、蝶だけをマスキングすれば、蝶が羽ばたく動画を作ることができます。

Video Inpainting：Lumiereは、既存のビデオの任意のマスクされた領域をテキストプロンプトに基づいてアニメーション化することができます。

しかし、まだ、Lumiereは論文段階であり、実際に使用することはできないが、公開が期待されている。

Adobeとスタンフォード大学のコラボレーション：「ActAnywhere」

「ActAnywhere」は映画やビジュアルエフェクトで、前景の動きに合わせた背景を生成する新しいモデルです。前景の動きや外見、アーティストの意図に合った背景を作ることができます。大規模なビデオ拡散モデルを使い、前景のセグメントと望ましいシーンの画像を入力して、リアルな前景・背景の相互作用のあるビデオを生成。人とシーンの相互作用ビデオを使って学習し、高いパフォーマンスを実現できます。

例えば、水上を泳いでいるアヒルの動画から、アヒルだけを抽出してたき火の写真と合成すると、たき火の近くを散歩しているアヒルの動画を作ることができます。

AI ディープフェイクの話題：偽バイデンからの電話「投票するな」

最近、米国の大統領選挙において、ジョー・バイデン大統領のように聞こえるディープフェイクのオーディオファイルが問題になっています。このオーディオは、AIを利用してバイデン大統領の声を真似ており、新ハンプシャー州の予備選挙で投票しないよう呼びかける内容でした。この事例は、AI技術の悪用が選挙に与える影響を示しており、警戒が必要であると指摘されています。

AIで変わる広告戦略：Gemini が創り出す新たな検索キャンペーン

「Gemini AI for Google Ads」はGoogle Adsの最新のAIモデルで、広告キャンペーンの作成を効率化し、広告の効果を高めることが可能です。このモデルは会話型のインターフェースを通じて、広告の内容やキーワードを生成し、最適化された検索キャンペーンを提供します。また、広告の「強度（Ad strength）」を測定することにより、広告の関連性、品質、多様性を評価し、改善します。さらに、視覚的な検索に対応するために、キャンペーンに合った画像を提案する機能も備えています。これにより、広告主は少ない労力でより質の高い検索キャンペーンを構築できるようになります。

ジェミニによる進化: Google Adsのジェミニは、会話型の体験を通じて検索キャンペーンの質を向上させます。ユーザーのウェブサイトURLから適切な広告内容を生成し、キャンペーンの効果を高めます。
効果の観測: 一部の広告主によるテストでは、ジェミニを使用することで「優れた」または「非常に優れた」広告強度のキャンペーンが容易に作成できることが確認されました。
視覚的な検索への対応: ジェミニは、キャンペーンに合わせた画像提案も行うため、視覚的な広告においても有効です。

Gemini AIの詳細な特徴、その異なるモデル、及びその周囲で起こっている論争や批判についてさらに深く掘り下げたいですか？さらなる理解と詳細情報については、以下の詳細記事をご覧ください。

OpenAIのChat GPTの最新アップデート

OpenAIが最近、更新を行いました。具体的には、GPT-3.5 Turboの価格引下げ、GPT-4 Turboのバージョンアップデートなどが挙げられます。これらのアップデートにより、AIモデルのパフォーマンスが向上し、さらに多くのユーザーがAI技術を利用しやすくなることが期待されています。また、テキストモデレーションモデルの改良も行われ、より効果的なコンテンツ管理が可能になるとされています。OpenAIは、これらの進化するAI技術を責任を持って開発し、適用していくことに力を入れているとのことです。

Chat GPTは前世代よりもはるかに進化した機能を提供し、私たちの日常生活と仕事の方法に大きな変革をもたらしています。サム・アルトマン氏の最近のインタビューから推測すると、Chat GPT-5は以前のモデルの限界を超え、多様なマルチモーダル機能と強化された推論能力を備えるとされています。GPT-5はGPT-4を基にしたAIモデルの発展を続ける見込みで、AGI（汎用人工知能）の可能性も提起されています。この記事では、サム・アルトマン氏のインタビューから、Chat GPT-5が私たちの生活にもたらす変化と影響、また、その可能性の活用方法について予測したいと思います。さらに深い理解を得るには、こちらの詳細記事をご覧ください。

Chromeに3つの新ジェネレーティブAI機能追加

これらの実験的なAI機能を活用して、タブの整理やカスタムテーマの作成、ウェブ上での文章作成のサポートを受けましょう。

Tabをスマートに整理：Chromeの「タブオーガナイザー（Tab Organizer）」機能は、開いているタブに基づいて自動的にタブグループを提案し作成します。これは、Chromeで旅行計画や調査、ショッピングなど複数のタスクを同時に行う際に便利です。この機能を使用するには、タブを右クリックして「類似のタブを整理」を選択するか、タブの左にあるドロップダウン矢印をクリックします。Chromeは新しいグループの名前や絵文字も提案してくれるので、次に必要な時に簡単に見つけることができます。
AIで独自のテーマを作成：ブラウザのカスタマイズがさらに進みました。選んだテーマ、気分、ビジュアルスタイル、色に基づいて、簡単にカスタムテーマを生成できます。始めるには、「Chromeのカスタマイズ」サイドパネルにアクセスし、「テーマ変更」をクリックしてから「AIで作成」を選びます。例えば、「オーロラ」というテーマで「アニメーション」スタイルの「穏やか」な気分を見たい場合、それらのオプションを選択してChromeがどんなものを作り出すかを見てみましょう。より多くのインスピレーションを得るために、Chromeチームのお気に入りテーマ作成のコレクションをチェックしてください。
ウェブ上で文章作成のサポート：Chromeは、ウェブ上でより自信を持って文章を書くための実験的なAI機能を導入します。例えば、レストランのレビューをしっかり書いたり、アパートの賃貸に関する正式な問い合わせを行う際に役立ちます。使い方は簡単で、Chromeで訪れた任意のサイトのテキストボックスまたはフィールドを右クリックし、「書くのを手伝って」と選択します。いくつかの言葉を入力すると、AIが文章作成プロセスを開始します。

AIの今後の展開、そしてAI技術の未来についての私たちの見解を、もっと深く知りたい方は、ぜひニュースレターにご登録ください。最新の情報と分析を定期的にお届けします。

AI最新ニュースの知見を見逃していませんか？

毎週発行される他のAI最新ニュースも、ぜひご覧ください！

イーロン・マスクの「ニューラリンク」とは、人体実験の成功？

‍

よくある質問

Q1: Google Researchの「Lumiere」とは何ですか？

A1: LumiereはGoogle Researchによって開発された新しいビデオ生成AI技術です。Space-Time U-Netアーキテクチャを使用し、動画の空間的および時間的特徴を同時に捉えて、テキストや画像からリアルな動画を生成します。

Q2: Adobeとスタンフォード大学の「ActAnywhere」とは何ですか？

A2: ActAnywhereは映画やビジュアルエフェクトで前景の動きに合わせた背景を生成する新しいモデルです。大規模なビデオ拡散モデルを使い、リアルな前景・背景の相互作用のあるビデオを生成します。

Q3: AIディープフェイクとは何ですか？

A3: AIディープフェイクは、AI技術を使って作られた偽のビデオやオーディオです。例えば、ジョー・バイデン大統領の声を真似たディープフェイクオーディオが、米国大統領選挙において問題になりました。

Q4: Gemini AI for Google Adsとは何ですか？

A4: Gemini AI for Google Adsは、広告キャンペーンの作成を効率化し、広告の効果を高めるGoogle Adsの最新AIモデルです。会話型のインターフェースを通じて広告内容を生成し、視覚的な検索に対応します。

Q5: OpenAIのChat GPTの最新アップデートにはどのようなものがありますか？

A5: OpenAIはGPT-3.5 Turboの価格引下げとGPT-4 Turboのバージョンアップデートを行いました。また、テキストモデレーションモデルの改良も行っています。

Q6: Chromeの新しいAI機能にはどのようなものがありますか？

A6: Chromeには、タブの自動整理、カスタムテーマの生成、ウェブ上での文章作成支援などの新しいAI機能が追加されています。

‍

Google Researchの最新技術：動画生成AI「Lumiere」
Adobeとスタンフォード大学のコラボレーション：「ActAnywhere」
AI ディープフェイクの話題：偽バイデンからの電話「投票するな」
AIで変わる広告戦略：Gemini が創り出す新たな検索キャンペーン
OpenAIのChat GPTの最新アップデート
Chromeに3つの新ジェネレーティブAI機能追加

‍