The photo on the cover has come to life! How far has AI video generation evolved?

in recent years、AIの進化は目覚ましく、The era has arrived where photos that were previously static images begin to move naturally.。
フェイク動画の問題で何かと話題になっているAI動画生成アプリを使い、I actually tried moving the photo.。

今回はあえてプロンプト(指示文)を一切入力せずアプリ側に完全に生成を任せる形で試してみた

プロンプトなしでもここまでできる

まず驚かされたのは写真集の人物写真の完成度だ
表情の変化や体の動きは比較的自然で「写真がそのまま動画になった」と感じられる仕上がりになった

especially、

  • 顔の向き
  • 視線の動き
  • 呼吸しているかのような微細な変化

などはプロンプトなしとは思えないほど完成度が高い

AI動画生成の技術がすでに「誰でもそれなりの結果を得られる段階」に入っていることを実感した

部族の肖像で露呈したAIの違和感

on the other hand、部族の肖像写真を動かした一部の動画には明確な違和感が生じた

腰部が過度に揺れるなどどこかセクシーさを強調するような部族の肖像としては不自然な動きが自動的にされ結果として意図しない身体表現が強調されているように見受けられた

これらは制作者が意図した表現というよりも動画生成アプリ側の生成傾向による可能性がある多様な人物画像を学習した結果AIが「人の身体の動き」を一般化した表現として適用してしまい文脈や文化的背景を十分に反映できなかったことが一因と考えられる

AIは文化や文脈を理解しているのか

この体験から見えてきたのは現在のAI動画生成が抱える課題だ

AIは

  • 被写体の文化的背景
  • 写真が持つ歴史性や意味
  • 撮影された文脈

を本質的に理解しているわけではない

Therefore、
写真集では「自然」に見えた動きが
部族の肖像では「文脈を壊す動き」として表出してしまった

表現の自由とリスクは表裏一体

写真を動かすAIは表現の可能性を大きく広げる
on the other hand、フェイク動画問題が示すように誤解や偏見を助長するリスクも同時に抱えている

especially、

  • 文化的アイデンティティ
  • 民族的表象
  • 歴史的記録

を扱う場合AIの「自動補完」は慎重に扱う必要があるだろう

AIはどこまで進むのか

AI動画生成は今後さらに進化し
より自然でより人間らしい動きを生み出すようになるはずだ

しかし同時に問われるのは
「技術的にできること」と「やるべきこと」の線引きである

写真が動き出す時代において
私たちはAIを「便利な道具」として使うだけでなく
その表現が何を生み何を壊すのかを意識する必要があるのかもしれない