- ニュース

スクリーンショット:Apple
Apple の AI の専門知識を示す最新の例は、自然言語の指示に基づいて画像をビデオに変換するソフトウェアである Keyframer です。
これは、macOS や iOS の将来のバージョンにバンドルされる可能性のある AI ツールの種類を早期に垣間見ることができるものです。
Keyframer: LLMベースのAIを基盤としたAppleのアニメーションアプリ
ここ数ヶ月、Appleはテクノロジー業界で最もホットな分野と言えるAIへの取り組みが不十分だとして、批判が高まっている。しかし、CEOのティム・クック氏は、AppleがAIに引き続き多大な努力を注ぐことを約束している。その成果であるソフトウェアはまだリリースされていないだけだ。クック氏は先日、「今年後半」に予定されているこの分野に関する発表に「非常に興奮している」と述べた。
しかし、Appleの研究者3人による新たな研究論文「Keyframer:大規模言語モデルを用いたアニメーションデザインの強化」(.pdf)によって、今後の展望が垣間見えました。これは、ティファニー・ツェン、ルイジア・チェン、ジェフリー・ニコルズの3人の共同研究によるものです。
彼らは、このツールについて次のように説明しています。「Keyframerを使えば、ユーザーは自然言語による指示を通して、静的な2D画像からアニメーション化されたイラストを作成できます。」ユーザーは画像を入力し、アニメーション化されたバージョンがどのように見えるかを説明するだけです。
しかし、現在多くのAI画像生成ツールとは異なり、Appleのアニメーションソフトウェアはプロのデザイナー向けに設計されています。「プロンプトと生成された出力の直接編集を組み合わせることで、アニメーションの探求と改良をサポートします。」
ユーザーは、画像と説明を入力してAIの結果を受け入れるだけでなく、Keyframerに組み込まれたツールを使って変更を加えることができます。例えば、異なる色を選択するなどです。これはデザイナーとAIのコラボレーションと言えるでしょう。
AIでアニメーションを簡素化
研究者たちは、自然言語を用いることで、本来であれば複雑なタスクをより簡素化できる可能性を模索している。「説明的な自然言語プロンプトの使用は、デザイン成果物の作成に必要な技術的専門知識を軽減し、初心者にデザインスキルを向上させるための教育機会を提供する可能性を秘めている」と研究者たちは論文の中で述べている。
彼らは独自の大規模言語モデルを開発しておらず、Apple自身が作成したとされるモデルも使用していません。代わりに、OpenAIのChatGPT-4を使用しました。
Appleの研究員たちは、アニメーションとプログラミングの幅広い経験を持つ13人の参加者を対象にKeyframerをテストしました。「参加者は、自然言語による指示をアニメーションに変換するこのシステムの有効性に驚き、喜んでいました」とAppleの研究員は述べています。
Appleの研究者らは最近、ユーザーの自然言語コマンドに基づいて画像を編集するオープンソースのAIモデルも発表した。