ChatGPTのOpenAI社が動画生成サービスを今年発表し、つい先日正式サービスが開始された。
デモで公開された動画はかなりのクオリティ。動画生成は「Runway」「Heygen」「Dream Machin」など数多くあり文章生成や画像生成よりも注目を浴びている分野だ。しかしその分、制度が求められており、プロンプト通りの動画がちゃんと出来るのか、食事動画が生成できるのか、人が分裂しないか、指の数がおかしくないのかなど課題はまだまだある。
他社の動画生成AIもバージョンアップを繰り返し制度が上がっているが、ここに来てOpenAI社の「Sora」が10日にリリースした。
プロンプトのみで動画生成する方法にも2つあり、1つのプロンプトで即生成と、一度ストーリーボードを生成し更に細かい指示を出して生成するという方法が選べる。ストーリーボードの場合は、タイムラインごとにプロンプトで指示が可能。
動画は5秒~20秒の映像が生成可能。
また元の画像から動画も生成可能なほか、動画の「リミックス」、「リカット」、シームレスに違和感無く繰り返す「ループ」、2つの異なる動画を滑らかに繋ぐ「ブレンド」、あらかじめ用されたスカイルニ適応する「スタイルプリセット」などの機能が使える。
画像からの生成の場合、人の写真が含まれて居る場合虚偽の動画が生成されないように生成ができないようになっている。まだ生成された動画にはウォーターマークが付与されるため動画生成だということがわかるようになっている。
「Sora」とは別のサービスではあるが、あらかじめChatGPT Plus(20ドル)かChatGPT Pro(200ドル)に加入しておく必要がある。
「Sora」のサイトに行きChatGPTと同じアカウントでログインすれば使用可能だ。
実際にプロンプトを入れて動画を生成してみた。
プロンプトは「渋谷の街で買い物をする若い日本人女性たち。季節は春で桜が咲いている。」というもの。ほかの動画生成AI同様に文字が苦手なようで、何語かわからない文字が確認できる。
https://twitter.com/sol_gonews/status/1867903016013275443?ref_src=twsrc%5Etfw
動画生成時に解像度とアスペクト比などの設定可能で。16:9、9:16(縦長)、1:1(正方形)から選択可能。解像度は480pと720pが選択可能だ。生成する動画の本数も1本~4本まで選べる。
今度は既存の画像から動画を生成。愛犬の写真を次のストーリーボードプロンプトのように生成してみた。
0.00 画像をアップロード
1.26 寝るミニチュアシュナウザー。眠そうにしている。
4.12 ソファにそのまま寝る。
このストーリーボードのおかげで細かい微調整が可能になり、既存の動画生成よりも更にシーン毎の生成が可能になるようだ。
https://twitter.com/sol_gonews/status/1867904268507947238?ref_src=twsrc%5Etfw
リリースしたばかりで、既存の動画生成AIに比べても格段に凄いというわけではないが、これから期待したい動画生成サービスなのは間違い無い。
https://twitter.com/sol_gonews/status/1867908095529406808?ref_src=twsrc%5Etfw