「最新AIニュースまとめ」動画アップスケーリングからAIスマートグラスの未来まで_2024年4月4週目

毎週お届けしております。AIニュースレターの時間が再び訪れました。今週も、AI技術の進展に関する興味深いニュースが世界各地から届いています。テクノロジーの最前線で起こっている動きを、分かりやすくまとめてお伝えします。

Tanaka Haruki
April 28, 2024

最大8倍まで動画をアップスケーリングする、アドビの生成型AI「VideoGigaGAN」

最近、アドビが新しいAI技術を利用した動画拡大機能を発表しました。この機能の名前は「VideoGigaGAN」で、従来の動画拡大技術と異なり、最大8倍まで動画を拡大でき、動画が壊れたり、揺れたりしないことが大きな特徴です。

動画をアップスケーリング

「VideoGigaGAN」の仕組み

VideoGigaGANは、一般的な動画スーパーレゾリューション(VSR)技術とは異なる方法で動作します。従来の技術では、動画を拡大する過程で画質が劣化したり、動画が乱れたりする問題がしばしば発生していました。これを「GAN(General Adversarial Networks)」技術と呼びますが、VideoGigaGANはここから一歩進んでいます。

VideoGigaGANの仕組み

この技術は「temporal attention」という機能を通じて、動画が時間が経つにつれて徐々に壊れる問題を減らします。また、「feature propagation」技術を利用して、動画で欠けたディテールを自然に補います。さらに、「anti-aliasing」技術で動画の階段状の現象を減らし、「HF shuttle」技術は映像の高周波ディテールをより良く伝えます。

「VideoGigaGAN」の活用方法

「VideoGigaGAN」は、まだ開発の初期段階にありますが、アドビの「Premiere Pro」や「After Effects」などの編集ソフトウェアに組み込まれることで、低解像度の映像をはるかに鮮明にすることができます。現在、VideoGigaGANは短い動画の処理に限られており、フレームレートも12fpsと比較的低い水準です。しかし、アドビだけでなく、NVIDIA、マイクロソフト、ブラックマジックデザインなど、多くの企業がAIベースの動画拡大技術の開発に注力しています。

出典:VideoGigaGAN

OpenAI、子どもの安全に対する方針発表

OpenAI、Amazon、Anthropic、Civitai、Google、Meta、Metaphysic、Microsoft、Mistral AI、Stability AIなどのAI業界リーダーは、AI技術の開発、展開、維持の各段階で子供の安全を守るための積極的な方針を発表しました。この計画は、子供を性的虐待から守ることに専念する非営利団体である「Thorn」と、技術と社会の複雑な問題に取り組む「All Tech Is Human」が主導しています。この取り組みは、AIが子供たちに与えるリスクを軽減することを目指しています。

具体的な活動内容は以下の通りです。

具体的な活動内容は以下の通りです。

  1. 開発段階:子供の安全を考慮したAIモデルの設計とトレーニングを行い、性的虐待や性的搾取の画像を検出し、削除します。確認された問題のある内容は関連機関に報告されます。
  2. 展開段階:トレーニング済みのAIモデルを公開し、子供の安全を最優先に考慮した状態で配布します。悪用されるリスクに対しては、予防策を講じます。
  3. 維持段階:AIモデルとプラットフォームの安全を維持し、新たに現れるリスクに対応するための継続的な取り組みを行います。これには、研究への投資や将来の技術ソリューションの開発も含まれます。

このように、AIの安全な使用と責任ある管理を深く重視し、Thorn、All Tech is Human、そして広範な技術コミュニティと協力して、子供を守るための「Safety by Design」原則を守り続けています。

出典:OpenAI Blog

IOC、パリオリンピックにAI活用計画発表

最近、国際オリンピック委員会(IOC)は、スポーツの世界において人工知能(AI)を積極的に活用する新計画を発表しました。

具体的な活用方法

  1. 才能の発掘:AIは、データを分析して未来のスター選手を見つけ出す手助けをします。
  2. トレーニングの個別化:選手一人ひとりに合わせたトレーニング方法を提案し、より効率的な準備を可能にします。
  3. 審判の公正性向上:試合の公平を保つため、AIが審判の判断をサポートします。

IOCのトーマス・バッハ会長は、「AIの導入には責任ある行動が求められる」と述べ、オリンピックのリーダーとしてAI技術を適切に活用する必要がある」と強調しました。さらに、AIは、スポーツをより公平にし、各選手に最適なトレーニングを提供する大きな可能性があると述べました。

また、IOCは、AIを活用し、オンラインでのいじめから選手を保護し、視聴者にとってより良いテレビ観戦体験を提供するための技術も導入する計画です。特に、パリオリンピックに向けて、AI技術を用いて選手や観客の安全を確保するためのビデオ監視システムが導入されることになりました。

このビデオ監視システムは、捨てられた荷物や群衆の急増などの潜在的なセキュリティリスクを識別するためのAIベースのカメラが含まれています。これにより、イベントの安全性が向上し、より多くの人々が安心してオリンピックを楽しむことができます。

人工知能がスポーツにもたらす変化は、単に試合のルールや結果を変えるだけではありません。それは、アスリート一人一人の潜在能力を最大限に引き出し、健康を守り、公正な競技を実現するための道具としても機能します。このように、IOCはAIの力を倫理的に、かつ効果的に利用する方法を模索しています。

出典:IOC

マイクロソフトが最も小さいAIモデル「Phi-3」を発表

マイクロソフトは最近、新しいAIモデル「Phi-3 Mini」を発表しました。このモデルは、38億のパラメーターを持ちながらも小型で、より大きなAIモデルに匹敵する機能を有しています。Phi-3 Miniは小規模なデータセットで訓練されており、性能も前モデルより向上しているとされます。

この小型モデルは、スマートフォンやラップトップなどのパーソナルデバイスでの使用に適しており、コストの削減にも貢献します。また、マイクロソフトは70億パラメータの「Phi-3-small」や140億パラメータの「Phi-3-medium」モデルも公開される予定であります。

大規模言語モデルと小規模言語モデル比較

開発者たちは、子どもが絵本から学ぶように、シンプルな言葉と構造で大きなテーマを扱うカリキュラムに基づいてPhi-3を訓練しました。これにより、モデルのプログラミングや推論能力が向上しました。

特に、小型モデルは特定の用途で企業のカスタムアプリケーションに優れた結果をもたらすことが多く、計算能力の使用が少ないため、コストを抑えることができます。

AIモデル「Phi-3」使い方

  1. Azure AI:マイクロソフトのAzure AIモデルカタログ
  2. Hugging Face:機械学習モデルのプラットフォーム
  3. Ollama:ローカルマシンでモデルを実行するための軽量フレームワーク
  4. NVIDIA NIM:標準APIインターフェースを備えたマイクロサービス

マイクロソフトのこの取り組みにより、AIの可能性が広がり、より多くの人々が日常生活や仕事で手軽に利用できるようになることが期待されます。これは、私たちの生活をより便利で効率的なものに変える可能性を秘めています。

出典:Theverge

「Ray-Ban Meta」AI スマートグラス、第二のスマートフォンとなり得るか?

Ray-BanとMetaが共同で開発した最新のスマートグラスが市場に登場し、従来のサングラスの形状を保ちながら、さまざまな先進機能を提供します。このスマートグラスは、ビデオ撮影や写真撮影機能だけでなく、スマートフォンを代替する複数のマルチメディア機能を備え、ユーザーに新しい体験を提供します。

スマートグラスには内蔵されたカメラと5つのマイクがあり、人工知能がユーザーの視覚と聴覚を代行する役割を果たします。例えば、散歩中に見つけた花の名前を知りたい場合は、グラスに質問すれば答えてくれます。また、このデバイスはさまざまな言語で書かれた看板を読むことができるため、旅行中に特に便利です。ユーザーが「メタ、これを見て何の意味か教えて」と言えば、グラスが即座に応答を提供します。

さらに、このグラスはキッチンでの料理を容易にするアシスタントの役割も果たします。キッチンカウンターに置かれた食材を見てAIに料理法をリクエストすると、関連するレシピを提案してくれます。このようなリアルタイム翻訳とレシピ提供機能は、観光客だけでなく日常生活でも大きな助けとなります。

Ray-Ban Metaスマートグラスは、技術とファッションを融合した革新的な製品で、日常のさまざまなシーンでユーザーに便利を提供し、新しい可能性を開いています。

OpenAIの「Sora」が作成した40年後のTEDトークの姿は?

OpenAIが開発中の新しいツール「Sora」は、テキストから動画を生成する技術です。「Sora」は今年の下半期に一般公開される予定で、その機能を少しでも体験できるデモ映像がすでに公開されています。この動画は、40年後のTEDトーク講演がどのように進化するかについてのヒントを提供します。

現在、Soraを使用して何かを作成できるのは、OpenAIが認定した少数のアーティストとクリエイターだけですが、今年後半には変わる予定です。OpenAIは、SoraをChatGPTやAdobe Premiere Proなどのサードパーティツールに統合する予定です。

このTEDトークの動画は、ロサンゼルスを拠点とする監督のポール・トリロによってSoraで作成されました。TEDのロゴを除いて、すべての動きや個々のショットはAIによって生成されました。トリロは、「過去に行った技術をこの新しいツールで探求するのは本当に楽しい。多くの新しいアイデアを解き放つ」と述べています。

OpenAIとモデルナ社のパートナーシップ

モデルナはmRNAプラットフォームを活用し、ウイルス性疾患の予防からがん治療に至るまで幅広い新薬開発に取り組んでいます。CEOのステファン・バンセルは、OpenAIとのパートナーシップを通じたAIの広範な利用が、同社のビジネスプロセスの変革に不可欠であると述べています。すでに、従業員は750以上のカスタムGPTを作成し、臨床試験の投薬量決定や規制当局への回答作成などに活用しています。現在、市場に出ている製品はコロナウイルスワクチンのみで、売上は前年比で減少していますが、モデルナはAIを駆使して今後5年間で15個の新製品を迅速に市場投入する計画を推進しています。

「スピード退職」現象と離職予測AIの活用

日本の新社会人の間で、「スピード退職」という現象が広がっており、多くが「配属・上司ガチャ」という期待と現実のギャップに直面しています。これは、希望した配属先や上司が選べず、職場の不一致を感じるため、早期退職を決意するケースが見られます。退職理由には、業務内容の誤解や職場環境の不適合が含まれます。これに対応するため、東京都市大学の白鳥成彦教授とスタートアップが共同で開発した「離職予測AI」を用いて、高リスク社員の特定とサポートが進められています。このAIにより、企業は退職を予防し、社員に適したサポートを提供できるようになり、職場環境の改善につながると期待されています。

日本におけるクラウドとAI拡張:オラクル、マイクロソフト、グーグルの大規模投資プラン

オラクルは、クラウドコンピューティングとAIの需要増加に応じて、今後10年間で80億ドルを投資し、日本全国にOCIを拡大する計画です。この投資には、ローカルオペレーションの強化と日本のエンジニアリングチームへのサポートが含まれています。また、マイクロソフトは日本のクラウドとAIインフラを強化するために29億ドルを投じると発表し、グーグルは日米間のデジタル接続を改善するために10億ドルを投資しました。さらに、OpenAIは東京にアジア初のオフィスを設立し、日本語に特化したGPT-4をリリースしています。楽天も日本語に最適化された大規模言語モデルを公開し、サカナAIは異なるモデルを統合する技術を用いた日本語モデルを開発しました。これらの動きは、日本がAIとクラウド技術の重要なハブとしての地位を強化していることを示しています。

AI最新ニュースまとめ
  1. 「最新AIニュースまとめ」写真が動画に!?マイクロソフト×Meta×Adobeなど画期的テクノロジー続々_2024年4月3週目
  2. 「最新AIニュースまとめ」最新のAI業界動向:Google、OpenAI、Metaからの大注目アップデート_2024年4月2週目
  3. 「最新AIニュースまとめ」週刊AIニュースダイジェスト: OpenAIの東京進出からAppleの最新技術まで_2024年4月1週目
  4. 「AI最新ニュースまとめ」:「チャットGPT」から「Claude 3」へ、OpenAI新機能、声から感情を読み取るAIなど
  5. 「AI最新ニュースまとめ」イーロン・マスクのGrokからNVIDIAの最新技術まで
  6. 「AI最新ニュースまとめ」AI業界に新たな風『Figure 01』『GPT-4 Turbo』『Devin』『Grok』
  7. 「AI最新ニュースまとめ」GPT-4とGeminiを超えたClaude 3の登場、ChatGPTの新機能、AIによる3D・動画生成
  8. 「AI最新ニュースまとめ」写真が話し始める時代へ。AlibabaのEMO AIが開く新しい映像の世界
  9. 「AI最新ニュースまとめ」AIの進化をチェック: Stable Diffusion 3とGoogleの最新動向
  10. 「AI最新ニュースまとめ」AI技術の最前線:GoogleのGemini 1.5とOpenAIのSora、そしてMetaのV-JEPA
  11. 「AI最新ニュースまとめ」イーロン・マスクの「ニューラリンク」とは、人体実験の成功?
  12. 「AI最新ニュースまとめ」Googleのビデオ技術からOpenAIの最新動向まで

よくある質問

Q1: 「VideoGigaGAN」とは何ですか?

A1: 「VideoGigaGAN」はアドビによって開発された新しい生成型AI技術です。この技術は、動画を最大8倍までクリアにアップスケーリングすることが可能で、従来の動画拡大技術と比較して画質の劣化を抑えることができます。特に、映像制作ソフトウェア「Premiere Pro」や「After Effects」に組み込まれる予定です。

Q2: OpenAIの子どもの安全に関する新しい方針とは何ですか?

A2: OpenAIを含むAI業界のリーダーたちは、AIの開発と運用の各段階で子供の安全を確保するための積極的な方針を発表しました。これには、開発段階での安全なAIモデル設計、展開段階での悪用防止策の講じ、そして維持段階でのリスク管理が含まれます。この取り組みは、子供たちを性的虐待などの危険から保護することを目的としています。

Q3: IOCがパリオリンピックで計画しているAIの利用方法は?

A3: IOC(国際オリンピック委員会)は、2024年パリオリンピックでAIを多方面に活用する計画を発表しました。この計画には、才能発掘、トレーニングの個別化、審判の公正性向上などが含まれます。また、オンラインいじめ防止や視聴体験の向上を目的としたAI技術の導入も予定されています。

Q4: マイクロソフトの「Phi-3」AIモデルについて教えてください。

A4: マイクロソフトが最近発表した「Phi-3」は、非常に小さいサイズのAIモデルで、38億のパラメーターを持ちながら効率的な性能を発揮します。このモデルは、特に小規模なデータセットでのトレーニングに適しており、パーソナルデバイスでの使用に最適です。これにより、AI技術の普及とアクセスがさらに進むことが期待されます。

Q5: 「Ray-Ban Meta」AIスマートグラスの特徴は何ですか?

A5: 「Ray-Ban Meta」は、MetaとRay-Banが共同で開発したAI機能を搭載したスマートグラスです。このデバイスは、ビデオ撮影、写真撮影のほか、リアルタイム翻訳やレシピ提案など、多様なマルチメディア機能を提供します。また、これらの機能はユーザーの日常生活や旅行を便利にし、新しいインタラクティブ体験をもたらします。

Q6: OpenAIとモデルナ社のパートナーシップの主な目的は何ですか?

A6: モデルナ社とOpenAIのパートナーシップの主な目的は、AI技術を活用して製薬プロセスを革新し、新薬の開発を加速することです。特に、mRNAプラットフォームを用いたワクチンや治療薬の開発で、AIが臨床試験のデータ分析や投薬量の決定、規制当局への迅速な回答提出を支援しています。この協力により、効率的かつ効果的な新薬開発が可能になります。

Q7: 「スピード退職」現象とは何ですか、そしてどのようにAIがこれを防ぐのですか?

A7: 「スピード退職」とは、新社会人が入社後短期間で退職する現象を指します。この背景には、希望と現実のギャップや職場環境の不一致があります。これに対処するために、東京都市大学の白鳥成彦教授と一部スタートアップが開発した離職予測AIを利用しています。このAIは、高リスク社員を早期に特定し、個別のサポートや適切な職場環境の提供を通じて退職を防ぎます。これにより、企業は人材流出を抑制し、組織全体の安定性を高めることが期待されます。

Q8: 日本におけるクラウドとAIの拡張計画について教えてください。

A8: 日本のテクノロジー企業と外国企業は、日本におけるクラウドコンピューティングとAI技術のインフラを拡大するために大規模な投資を行っています。オラクルは今後10年間で80億ドル、マイクロソフトは29億ドル、グーグルは10億ドルを投資する予定です。これらの投資は、データセンターの拡張や新技術の研究開発、地域社会への支援などを含みます。また、OpenAIは東京にアジア初のオフィスを設立し、日本語に特化したGPT-4をリリースすることで、AI技術の地域適応と普及を図っています。

#OpenAI #モデルナ #医療分野AI #離職予防 #人事向けAI #クラウドコンピューティング #日本のテック投資 #AI拡張 #デジタル日本