▶︎動画でも話してるので、文章読むのが面倒な方はこちらをみてもらえればと思います。
今回はFaceFusionを使ってLipSyncの動画を生成する方法について解説します。
今回紹介する方法については決して悪用しないでくださいね。
これを読めば誰でも簡単にクオリティーの高いAI美女が作れるようになっているので興味がある人は、下のバナーをクリックして購入してみてね🎶
目次
FaceFusionを使ってLipSyncの動画を生成する方法について
FaceFusionのソースコードは公開されています。
公開されているコードへのリンクは下記に貼っておきますので、そちらをご確認ください。
この解説では、このソースコードをGoogleコラボで動作させていきます。
もしもGoogleコラボというキーワードが分からない場合は、以下にリンクを貼っておきますので、そちらをご確認ください。
Google Colabのサイトにアクセス
ここからの流れは下記に詳細リンクを貼っておきますので、そちらからご参照ください。
これで、Google Colabでコードを実行するための準備が整いました。
Google Colabでコードを実行
下記に貼ってあるテキストをコピーします。
!wget https://archive.creativaier.com/comfyui/scripts/setup_script001
!mv setup_script001 setup_script.sh
!chmod +x setup_script.sh
!./setup_script.sh
!rm -rf setup_script.sh
%cd /content/source_code
!python install.py --torch cuda-12.1 --onnxruntime cuda-12.1 --skip-venv
!wget https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64.deb
!dpkg -i cloudflared-linux-amd64.deb
import subprocess
import threading
import time
import socket
def iframe_thread(port):
while True:
time.sleep(0.5)
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
result = sock.connect_ex(('127.0.0.1', port))
if result == 0:
break
sock.close()
p = subprocess.Popen(["cloudflared", "tunnel", "--url", f"http://127.0.0.1:{port}"], stdout=subprocess.PIPE, stderr=subprocess.PIPE)
for line in p.stderr:
l = line.decode()
if "trycloudflare.com " in l:
print("This is the URL to access:", l[l.find("http"):], end='')
# スレッドの開始
threading.Thread(target=iframe_thread, daemon=True, args=(7860,)).start()
# コードの実行
%cd /content/source_code
!python run.py --execution-providers cuda
テキストをコピーしたらGoogleコラボの画面に戻り、テキストボックスにコピーしたテキストを貼り付け、再生ボタンを押します。
これで貼り付けたテキストの内容が実行されます。
この処理には5分以上かかると思います。
しばらく待っているとこのようなリンクが表示されます。
このリンクをクリックします。
FaceFusionの操作設定
そうするとFaceFusionの操作画面が表示されます。
この画面が表示されたらまず左側のフレームプロセスを設定します。
具体的にはlip_syncerにチェックを入れます。
次にフェーススワッパーのチェックを外します。
これでフレームプロセスの設定は完了です。
音声ファイルをアップロード
具体的にはこの部分に音声ファイルをドラッグ&ドロップします。
アップロードした音声を再生します。
たっぷりとしたチョコレートケーキを食べてとても幸せだという音声をアップロードしておきました。
次に動画ファイルをアップロードします。
具体的にはこの部分に動画ファイルをドラッグアンドドロップします。
アップロードした動画を再生します。
今回は違いを分かりやすくしたかったので5秒間の静止画が映っている動画になっています。
音声ファイルと動画ファイルをアップロードしたらスタートボタンをクリックします。
これでLipSyncの処理が開始されます。
処理が完了するまでしばらく待ちます。
生成された動画を再生
たっぷりとしたチョコレートケーキを食べてとても幸せだという期待した通りの音声に合わせた口の動きになっています。
生成された動画をダウンロードするには右上のボタンをクリックします。
これでパソコンに生成した動画ファイルがダウンロードされます。
今回の解説は以上です。
是非お試しください。