D-ID, perusahaan di balik Deep Nostalgia, memungkinkan Anda membuat video yang dihasilkan AI dari satu gambar
Perusahaan AI Israel D-ID, yang menyediakan teknologi untuk proyek-proyek seperti Deep Nostalgia, meluncurkan platform baru di mana pengguna dapat mengunggah satu gambar dan teks untuk menghasilkan video. Dengan situs baru bernama Creative Reality Studio ini, perusahaan menargetkan sektor-sektor seperti pelatihan dan pendidikan perusahaan, komunikasi internal dan eksternal dari perusahaan, pemasaran produk, dan penjualan.
Platform ini cukup mudah digunakan: Pengguna dapat mengunggah gambar penyaji atau memilih salah satu dari penyaji yang telah dibuat sebelumnya untuk memulai proses pembuatan video. Pengguna berbayar dapat mengakses presenter premium yang lebih "ekspresif" karena mereka memiliki ekspresi wajah dan gerakan tangan yang lebih baik daripada yang default. Setelah itu, pengguna dapat mengetik teks dari skrip atau cukup mengunggah klip audio pidato seseorang. Pengguna kemudian dapat memilih bahasa (platform ini mendukung 119 bahasa), suara dan gaya seperti ceria, sedih, bersemangat, dan ramah.
Algoritme berbasis AI perusahaan akan menghasilkan video berdasarkan parameter ini. Pengguna kemudian dapat mendistribusikan video di mana saja. Perusahaan mengklaim bahwa algoritme hanya membutuhkan setengah dari waktu durasi video untuk menghasilkan klip, tetapi dalam pengujian kami, butuh beberapa menit untuk menghasilkan video satu menit. Ini bisa berubah tergantung pada jenis penyaji dan bahasa yang Anda pilih.
"Pandemi COVID-19 telah mempercepat kebutuhan akan konten digital di seluruh dunia. Masalah besar bagi organisasi adalah pembuatan konten pendidikan. Membaca dokumen dan melalui presentasi bisa jadi kering dan membosankan. Plus, mereka harus menghabiskan ribuan dolar untuk menyewa aktor dan membuat video pendidikan. Jadi kami menggunakan AI kami untuk membuat presenter dan tutor untuk menghidupkan kembali manusia dan membuat konten lebih menarik dan efektif," kata Gil Perry, CEO D-ID kepada TechCrunch dalam sebuah wawancara.
Perry menunjukkan banyak kasus penggunaan untuk teknologi ini— mulai dari pesan multibahasa dari CEO hingga karyawan hingga keinginan yang dipersonalisasi untuk pengguna organisasi.
D-ID meluncurkan studio untuk pengujian pada pertengahan Agustus untuk mengatasi bug sebelum peluncuran publik. Dan sementara fokus utamanya adalah untuk melayani perusahaan dari semua ukuran, perusahaan melihat banyak minat dari pencipta di platform.
Pembuatan video deepfake yang menyinggung adalah risiko. Itu sebabnya perusahaan Israel telah menempatkan pagar pembatas seperti penyaringan kata-kata umpatan dan komentar rasis, serta pengenalan gambar untuk menghindari penggunaan wajah orang-orang terkenal. Ini menggunakan API moderasi teks Microsoft Azure untuk menyingkirkan komentar seksual dan bahasa yang menyinggung dalam skrip video. D-ID mengatakan istilah penggunaan platform melarang pengguna membuat video politik. Jika terjadi pelanggaran terhadap salah satu aturan ini, perusahaan dapat menangguhkan akun pelanggar dan menghapus video mereka dari perpustakaan.
D-ID mengumpulkan $25 juta dalam pendanaan Seri B-nya yang dipimpin oleh Macquarie Capital pada bulan Maret — dengan total $47 juta dikumpulkan hingga saat ini. Sampai sekarang, perusahaan telah mengandalkan orang lain yang menggunakan API-nya untuk membuat konten — Deep Nostalgia adalah contoh utama dari itu — dengan klien seperti Modelez, Warner Bros., dan aplikasi video pendek josh yang berbasis di India. Sekarang, perusahaan memperluas produk penghasil uangnya dengan meluncurkan plug-in PowerPoint bersama dengan platform layanan mandiri ini. Plug-in menambahkan penyaji interaktif ke dek, sehingga pengguna tidak hanya perlu membaca slide. Mereka dapat memilih antara avatar, suara, dan bahasa yang berbeda — seperti platform layanan mandiri. Tetapi tidak ada ketentuan untuk memiliki presenter khusus saat ini.
Saat peluncuran, pengguna akan dapat mendaftar secara gratis untuk akun uji coba 14 hari dan membuat hingga lima menit video 720p yang dihasilkan AI. Setelah itu, mereka dapat membayar $49 per bulan untuk mendapatkan akses ke 15 menit video yang dihasilkan AI full HD, plugin PowerPoint, dan dukungan email.
Pengguna juga dapat mengunggah klip audio mereka sendiri untuk kloning suara. Plus, perusahaan sedang mengerjakan alat untuk memungkinkan pengguna mengunggah rekaman mereka sendiri untuk melatih AI agar lebih ekspresif sehingga dapat meniru orang dalam video dengan lebih baik. Semua fitur ini akan terbatas pada tingkat perusahaan perusahaan.
Sementara perusahaan menghadapi persaingan dari orang-orang seperti Rephrase.ai dan Soul Machines di area video yang dihasilkan AI, ia mengklaim hampir tidak ada perusahaan yang mengklaim menghasilkan video berkualitas tinggi dari satu gambar.
Perry mengatakan, D-ID tidak bertujuan untuk membatasi diri pada video pelatihan, komunikasi, dan pemasaran perusahaan. Ini juga memiliki ambisi untuk memfasilitasi terjemahan panggilan video waktu nyata dan presenter kloning — yang membuat avatar muncul di video alih-alih Anda saat Anda mendikte audio.
Perusahaan juga sedang mempertimbangkan untuk menjadi pemain kunci dalam pengembangan web3/metaverse. "Mengingat bahwa kami memiliki keahlian dalam menghasilkan video dari satu gambar. Kami sedang memikirkan cara untuk membuat avatar digital untuk metaverse," kata Perry.
Posting Komentar untuk "D-ID, perusahaan di balik Deep Nostalgia, memungkinkan Anda membuat video yang dihasilkan AI dari satu gambar"