Teknologi AI baru Google DeepMind akan menghasilkan soundtrack untuk video
Laboratorium kecerdasan buatan DeepMind Google sedang mengerjakan teknologi baru yang dapat menghasilkan soundtrack, bahkan dialog, untuk disertakan dengan video. Lab tersebut telah membagikan kemajuannya pada proyek teknologi video-to-audio (V2A), yang dapat dipasangkan dengan Google Veo dan alat pembuatan video lainnya seperti Sora OpenAI. Dalam postingan blognya, tim DeepMind menjelaskan bahwa sistem dapat memahami piksel mentah dan menggabungkan informasi tersebut dengan perintah teks untuk menciptakan efek suara untuk apa yang terjadi di layar. Untuk diketahui, alat tersebut juga dapat digunakan untuk membuat soundtrack untuk cuplikan tradisional, seperti film bisu dan video lain tanpa suara.
Para peneliti DeepMind melatih teknologi tersebut pada video, audio, dan anotasi yang dihasilkan AI yang berisi deskripsi rinci tentang suara dan transkrip dialog. Mereka mengatakan bahwa dengan melakukan hal tersebut, teknologi belajar mengasosiasikan suara tertentu dengan pemandangan visual. Sebagai TechCrunch.dll Catatan, tim DeepMind bukanlah yang pertama merilis alat AI yang dapat menghasilkan efek suara — ElevenLabs juga merilisnya baru-baru ini — dan ini bukan yang terakhir. “Penelitian kami menonjol dibandingkan solusi video-ke-audio yang ada karena dapat memahami piksel mentah dan menambahkan perintah teks bersifat opsional,” tulis tim tersebut.
Meskipun perintah teks bersifat opsional, namun dapat digunakan untuk membentuk dan menyempurnakan produk akhir agar seakurat dan serealistis mungkin. Anda dapat memasukkan perintah positif untuk mengarahkan keluaran agar menghasilkan suara yang Anda inginkan, misalnya, atau perintah negatif untuk menjauhkannya dari suara yang tidak Anda inginkan. Pada contoh di bawah, tim menggunakan prompt: “Sinematik, thriller, film horor, musik, ketegangan, suasana, langkah kaki di atas beton.
Para peneliti mengakui bahwa mereka masih berusaha mengatasi keterbatasan yang ada pada teknologi V2A, seperti penurunan kualitas audio keluaran yang dapat terjadi jika ada distorsi pada video sumber. Mereka juga masih berupaya meningkatkan sinkronisasi bibir untuk menghasilkan dialog. Selain itu, mereka berjanji untuk menerapkan teknologi tersebut melalui “penilaian dan pengujian keamanan yang ketat” sebelum meluncurkannya ke dunia.
Artikel ini berisi link afiliasi; jika Anda mengeklik tautan tersebut dan melakukan pembelian, kami dapat memperoleh komisi.
Teknologi AI baru Google DeepMind akan menghasilkan soundtrack untuk video
Judul : Sejarah Tidung Kalimantan Utara Penulis : Ajat Rukajat Halaman : xii, 201 hlm, Uk: 14×20 cm ISBN : 978-623-02-3565-8 Cetakan : Oktober 2021 Sinopsis : Perkembangan dan pengembangan ilmu pengetahuan di masyarakat mengharuskan adanya penelitian. Tanpa sebuah penelitian, ilmu pengetahuan tidak akan hidup dan akan diragukan kebenarannya. Sehingga sebuah penelitian akan menjadi tolok… selengkapnya
Rp 88.000Judul : Teknik Penyusunan Laporan Keuangan Berbasis Software Akuntansi Penulis : Irwan Adimas Ganda Saputra, S.Pd., M.A. Bayu Rama Laksono, S.E., M.Ak. Prof. Dr. Hariyati, Ak., M.Si., CA., CMA. Halaman : vi, 72 halaman Uk: 17.5×25 cm ISBN: 978-623-02-5963-0 Tahun : 2023 Buku Teknik Penyusunan Laporan Keuangan Berbasis Software Akuntansi Versi terbaru dari software akuntansi… selengkapnya
*Harga MulaiRp 122.000
Judul : Desain dan Perencanaan Pembelajaran Penulis : Dr. H. Rudi Ahmad Suryadi, M.Ag. Drs. H. Aguslani Mushlih, M.Ag. Halaman : xiv, 200 hlm Uk: 17.5×25 cm ISBN: 978-623-209-803-9 Tahun : 2019 Buku Desain dan Perencanaan Pembelajaran – Mutu pembelajaran salah satunya ditunjang oleh kompetensi guru. Guru menjadi personal penting dalam interaksi pembelajaran untuk mewujudkan tujuan… selengkapnya
Rp 115.000Judul : From Research To Technopreneur Strategi Membangun Usaha Berbasis Teknologi & Inovasi Dengan 0 Rupiah Penulis : Nova Suparmanto Halaman : xvi, 206 hlm Uk: 14×20 cm ISBN : 978-623-209-791-9 Tahun : 2019 Dalam dunia bisnis saat ini sebuah teknologi memberikan kontribusi yang sangat besar. Dengan munculnya inovasi dalam teknologi telah membuka kesempatan dan… selengkapnya
*Harga MulaiRp 86.000
Judul : Sejarah Tidung Kalimantan Utara Penulis : dr. Syahriza Pahlevi Halaman : xiv, 267 hlm Uk: 14×20 cm ISBN : 978-623-02-3565-8 Tahun : 2020 Kalimantan Utara menjadi sorotan bangsa asing kala itu. Suku Tidung menjadi pelaku perdagangan tradisional. Sebelumnya terkenal buas karena perburuan budak di Filipina dan aktif dalam membajak kapal. Tidung dipandang bar-bar… selengkapnya
Rp 119.000Judul : Biologi Kuskus Penulis : Prof. Dr. drh. Rini Widayanti, M.P. Rony Marsyal Kunda, M.Sc Halaman : x, 59 hlm Uk: 15.5×23 cm ISBN: 978-623-02-5953-1 Tahun : 2023 Julukan Wallacea sebagai sepenggal surga di Bumi, sangat tepat. Kawasan ini menyimpan kekayaan keanekaragaman hayati, bentang alam, dan budaya tradisional luar biasa dan terus menunjukkan pesona… selengkapnya
*Harga MulaiRp 86.000
Judul : Perspektif Perdagangan Beras Antarpulau di Indonesia Penulis : Dr. Ir. Hj. Majdah Muhyiddin Zain, M.Si. Halaman : viii, 188 hlm Uk: 15.5×23 cm ISBN: 978-623-02-5942-5 Tahun : 2023 Perdagangan beras berfungsi untuk menjaga stok beras yang cukup bagi pemenuhan kebutuhan domestik suatu wilayah atau negara. Penyuplai beras utama di Indonesia di antaranya Provinsi… selengkapnya
Rp 156.000Judul : Pencemaran Lingkungan Penulis : Prof. Dr. Ir. Odi Roni Pinontoan, M.S. Halaman : viii, 80 hlm Uk: 15.5×23 cm ISBN: 978-623-02-7363-6 Tahun : 2023 Pencemaran lingkungan (environmental pollution) adalah terkontaminasinya komponen fisik dan biologis dari sistem bumi dan atmosfer sehingga mengganggu keseimbangan ekosistem lingkungan. Kontaminasi tersebut bisa berasal dari kegiatan manusia ataupun proses… selengkapnya
Rp 103.000Judul : Pembelajaran Bahasa Inggris Terpadu untuk Tingkat Menengah Penulis : Edy Suseno Halaman : viii, 246 hlm Uk: 14×20 cm ISBN : 978-623-02-5927-2 Tahun : 2023 Buku ini membahas tentang pembelajaran bahasa Inggris untuk mengembangkan keterampilan berbicara, mendengar, menulis, dan membaca. Adapun materi yang dihadirkan dalam bentuk pembahasan tata bahasa, diskusi, menceritakan kembali, pembahasan… selengkapnya
Rp 136.000Judul : Kata Kerja Bahasa Inggris Mengenali Bentuk Visualnya Penulis : Yune Andryani Pinem Halaman : xii, 126 hlm Uk: 15.5×23 cm ISBN : 978-623-02-5088-0 Tahun : 2022 Menyusun kalimat dalam bahasa Inggris dilakukan menyesuaikan tata bahasanya. Dengan susunan kalimat yang benar, pesan pada kalimat dapat diterima dengan baik. Struktur kalimat bahasa Inggris menggunakan verb… selengkapnya
Rp 128.000
Saat ini belum tersedia komentar.