Peluncuran Model Video V1 oleh Midjourney: Mengubah Gambar Diam Menjadi Animasi

Midjourney telah meluncurkan model generasi video pertamanya, V1, sebuah alat berbasis web yang memungkinkan pengguna untuk mengubah gambar diam menjadi klip video berdurasi lima detik. Peluncuran model baru ini menandai kemajuan yang signifikan menuju visi lebih luas perusahaan untuk menciptakan simulasi dunia terbuka secara real-time. Visi ini memerlukan integrasi antara gambar, video, dan model 3D untuk menciptakan lingkungan yang dinamis dan interaktif.
Model V1 berfungsi dengan memungkinkan pengguna untuk menghidupkan gambar melalui dua opsi: pengaturan animasi otomatis yang menghasilkan prompt gerakan untuk gerakan dasar, dan fitur animasi manual di mana pengguna dapat mendeskripsikan tindakan spesifik dan gerakan kamera. Sistem ini dirancang untuk bekerja dengan gambar yang dihasilkan oleh Midjourney serta gambar yang diunggah dari sumber eksternal, menyediakan fleksibilitas dalam pembuatan video.
Model ini juga memperkenalkan alur kerja unik untuk menganimasi gambar. Pengguna dapat menyeret gambar ke dalam bilah prompt dan menandainya sebagai bingkai awal, kemudian menerapkan prompt gerakan untuk menganimasinya. V1 mencakup dua pengaturan untuk gerakan: gerakan rendah, yang cocok untuk adegan ambien dengan gerakan lambat atau minimal, dan gerakan tinggi, yang lebih baik untuk adegan cepat dengan gerakan kamera dan subjek yang aktif. Namun, gerakan tinggi terkadang dapat menyebabkan glitch atau kesalahan yang tidak diinginkan.
Ketika dibandingkan dengan alat generasi video AI lainnya yang saat ini ada di pasar, V1 menawarkan pendekatan yang berbeda. Berbeda dengan platform yang lebih mapan seperti Runway atau DeepBrain, yang fokus pada aset video yang sangat halus, siap pakai dengan fitur pengeditan kompleks dan integrasi audio, V1 mengutamakan animasi gambar statis dalam estetika tertentu yang sejalan dengan model gambar populer Midjourney. Sementara pesaing seperti Veo 3 dikenal dengan pembuatan video real-time dengan integrasi audio penuh dan tangkapan gerakan berkualitas tinggi, V1 tetap pada output video yang lebih sederhana dengan kemampuan gerakan terbatas, berfokus terutama pada transformasi gambar menjadi video.
Peluncuran Model Video V1 oleh Midjourney telah memicu kegembiraan di kalangan komunitas kreatif, dengan pengguna memuji konsistensi visual yang menakjubkan dan daya tarik artistik, sering kali membandingkannya dengan pesaingnya secara positif.
Seorang seniman AI, Koldo Huici, berkomentar di X: “Membuat animasi biasanya memakan waktu 3 jam di After Effects. Sekarang dengan Midjourney, saya melakukannya dalam 3 menit! Saya akan memberitahu Anda betapa mudahnya.”
Sementara itu, pakar Gen AI Everett World menyatakan: “Sungguh luar biasa memiliki model video baru, terutama karena dibuat oleh Midjourney - ini membuka kemungkinan baru yang tak terduga. Beberapa generasi terlihat sangat alami (anime terlihat hebat!). Meskipun hanya 480p, saya pikir kita menyaksikan perkembangan menarik di ruang video AI, dan saya sangat senang kita bisa bersenang-senang dengan model ini!”
Midjourney berencana untuk terus mengembangkan kemampuan videonya, dengan tujuan menjadikan simulasi dunia terbuka secara real-time menjadi kenyataan dalam waktu dekat. Untuk saat ini, model V1 hanya tersedia untuk penggunaan web, dan perusahaan memantau penggunaan secara cermat untuk memastikan bahwa mereka dapat meningkatkan infrastruktur mereka untuk memenuhi permintaan.
Peluncuran ini terjadi di tengah tantangan hukum yang terus berlangsung bagi perusahaan, termasuk gugatan terbaru dari Disney dan Universal terkait dugaan pelanggaran hak cipta. Meskipun tantangan ini, Midjourney tetap fokus pada pengembangan teknologinya, dengan V1 dianggap sebagai langkah signifikan menuju pencapaian visi perusahaan untuk lingkungan digital yang imersif dan interaktif.