Beranda » Blog » Google sedang mengerjakan soundtrack dan dialog AI generatif untuk video

Google sedang mengerjakan soundtrack dan dialog AI generatif untuk video

Diposting pada 19 Juni 2024 oleh admin / Dilihat: 0 kali

Jadi, AI sekarang bisa melakukan pembuatan film.

Model Google DeepMind dapat menghasilkan audio untuk video AI dan rekaman yang ada. Kredit: Furtseff / iStock / Getty Images Plus

Semua orang tahu bahwa suara adalah komponen penting dalam sebagian besar film dan video. Lagipula, meski filmnya bisu, masih ada musik pengiring yang memberi tahu penonton bagaimana perasaannya.

Hukum alam ini tetap sama untuk kumpulan video AI generatif baru, yang muncul dalam diam. Itulah sebabnya Google mengembangkan teknologi “video-ke-audio” (V2A) yang “memungkinkan pembuatan audiovisual tersinkronisasi”. Pada hari Senin, laboratorium AI Google, DeepMind, membagikan kemajuan dalam menghasilkan audio tersebut termasuk soundtrack dan dialog yang secara otomatis cocok dengan video yang dihasilkan AI.

Google telah bekerja keras mengembangkan teknologi AI generatif multimodal untuk bersaing dengan para pesaingnya. OpenAI memiliki generator video AI Sora (belum dirilis ke publik) dan GPT-4o, yang menciptakan respons suara AI. Perusahaan seperti Meta dan Suno telah mengeksplorasi audio dan musik yang dihasilkan AI, namun memasangkan audio dengan video relatif baru. ElevenLabs memiliki alat serupa yang mencocokkan perintah audio dengan teks, tetapi DeepMind mengatakan V2A berbeda karena tidak memerlukan perintah teks.

Kecepatan Cahaya yang Dapat Dihancurkan

V2A dapat dipasangkan dengan alat video AI seperti Google Veo atau rekaman arsip dan film bisu yang ada. Ini dapat digunakan untuk soundtrack, efek suara, dan bahkan dialog. Ia bekerja dengan menggunakan model difusi yang dilatih dengan masukan visual, perintah bahasa alami, dan anotasi video untuk secara bertahap menyaring derau acak menjadi audio yang sesuai dengan nada dan konteks video.

Google DeepMind mengatakan V2A dapat “memahami piksel mentah” oleh karena itu Anda sebenarnya tidak memerlukan perintah teks untuk menghasilkan audio, tetapi ini membantu akurasi. Model juga dapat diminta untuk membuat nada audio terdengar positif atau negatif. Bersamaan dengan pengumuman tersebut, DeepMind merilis beberapa video demo, termasuk video lorong yang gelap dan menyeramkan diiringi musik horor, seorang koboi yang sendirian saat matahari terbenam mencetak lagu harmonika yang lembut, dan sosok animasi yang berbicara tentang makan malamnya.

V2A akan menyertakan watermarking SynthID Google sebagai tindakan pengamanan terhadap penyalahgunaan, dan postingan blog Deepmind mengatakan fitur tersebut sedang menjalani pengujian sebelum dirilis ke publik.

Cecily adalah reporter teknologi di Mashable yang meliput AI, Apple, dan tren teknologi baru. Sebelum mendapatkan gelar masternya di Columbia Journalism School, dia menghabiskan beberapa tahun bekerja dengan perusahaan rintisan dan bisnis berdampak sosial untuk Unreasonable Group dan B Lab. Sebelumnya, ia ikut mendirikan bisnis konsultasi startup untuk pusat wirausaha baru di Amerika Selatan, Eropa, dan Asia. Anda dapat menemukannya di Twitter di @cecily_mauran.

Buletin ini mungkin berisi iklan, penawaran, atau tautan afiliasi. Berlangganan buletin menunjukkan persetujuan Anda terhadap Ketentuan Penggunaan dan Kebijakan Privasi kami. Anda dapat berhenti berlangganan buletin kapan saja.

Bagikan ke

Google sedang mengerjakan soundtrack dan dialog AI generatif untuk video

Saat ini belum tersedia komentar.

Silahkan tulis komentar Anda

Alamat email Anda tidak akan kami publikasikan. Kolom bertanda bintang (*) wajib diisi.

*

*

Google sedang mengerjakan soundtrack dan dialog AI generatif untuk video

Chat via Whatsapp

Ada yang ditanyakan?
Klik untuk chat dengan customer support kami

Iffah
● online
Iffah
● online
Halo, perkenalkan saya Iffah
baru saja
Ada yang bisa saya bantu?
baru saja

Produk yang sangat tepat, pilihan bagus..!

Berhasil ditambahkan ke keranjang belanja
Lanjut Belanja
Checkout
Produk Quick Order

Pemesanan dapat langsung menghubungi kontak dibawah: