- ニュース

写真:Apple/[email protected]
Appleの研究者たちは、ユーザーが自然言語で入力した情報(つまり、単に希望を伝えるだけ)に反応して画像を編集できるオープンソースの人工知能モデル「MGIE」をリリースしました。Appleの新しいAI画像編集ツールにより、iPhoneやMacユーザーは写真の微調整を簡単に行うことができるようになるかもしれません。
MGIE(MMLMガイド付き画像編集の略)は、Photoshop風の微調整、写真全体の最適化、そして部分的な編集が可能です。しかし、出力品質は今のところ限定的です。そして、このAI画像エディタで何が実現されるのかは、Appleだけが知っています。
Appleの新しいMGIE AIモデルに、画像をどのように編集したいかを伝えるだけです
MGIEは、Appleとカリフォルニア大学サンタバーバラ校の研究者による共同研究から生まれたと、VentureBeatが火曜日に報じた。研究者らは論文を執筆し、AI研究のトップカンファレンスである国際学習表現会議(ICR)に採択された。
MGIE は、強力なマルチモーダル大規模言語モデル (MLLM) を使用します。MLLM は、テキストと画像を処理して、命令ベースの画像編集機能を向上させる AI モデルです。
「この論文は、競争力のある推論効率を維持しながら、自動メトリクスと人間による評価を改善するMGIEの有効性を実証している」と出版物は述べている。
MGIE は何ができますか?
簡単な例を挙げましょう。「空をもっと青くする」と入力すると、MGIE はそれを「空の領域の彩度を 20% 上げる」と翻訳して実行します。
VentureBeat では次の機能について説明しています。
MGIEは、編集プロセスを効果的にガイドする簡潔で明確な指示を提供します。これにより、編集の品質が向上するだけでなく、ユーザーエクスペリエンス全体も向上します。
MGIEは、切り抜き、サイズ変更、回転、反転、フィルターの追加など、Photoshopスタイルの一般的な編集機能を備えています。さらに、背景の変更、オブジェクトの追加・削除、画像のブレンドなど、より高度な編集も可能です。
MGIEは、明るさ、コントラスト、シャープネス、カラーバランスなど、写真全体の品質を最適化できます。また、スケッチ、絵画、漫画といった芸術的な効果を適用することも可能です。
MGIEは、顔、目、髪、服装、アクセサリーなど、画像内の特定の領域やオブジェクトを編集できます。また、モデルはこれらの領域やオブジェクトの属性(形状、サイズ、色、テクスチャ、スタイルなど)を変更することもできます。
MGIE を試してもいいですか?
MGIEのオープンソースプロジェクトはGitHubでご覧いただけます。ご自身の画像で試してみたい方は、より直感的なデモをこちらでご覧いただけます。
Appleのエコシステム内で、例えば写真を撮った後にiPhoneでこの機能を使えるようになるのはいつになるのか、誰にも分かりません。しかし、ここでの期待と、Appleが長年ユーザーフレンドリーな機能の提供に注力してきたことを考えると、そう遠くないかもしれません。AppleのCEO、ティム・クック氏は先週、同社のAI革命は今年中に実現すると発言しました。