in AI

Bagaimana OpenAI Sora Membuka Era Baru Video Generatif?

by Inovasee 20 Februari 2024, 4:12 pm 1.1k Views

OpenAI, sebuah organisasi penelitian kecerdasan buatan (AI) yang terkenal dengan model-model generatifnya seperti GPT-3 dan DALL-E, baru-baru ini memperkenalkan Sora, sebuah model yang mampu menciptakan video realistis dan imajinatif dari instruksi teks. Model ini merupakan salah satu terobosan terbesar dalam bidang video generatif, karena dapat menghasilkan video hingga satu menit dengan kualitas visual yang tinggi dan sesuai dengan permintaan pengguna.

Sora adalah model difusi bersyarat teks yang dilatih secara bersama-sama pada data video dan gambar dengan durasi, resolusi, dan rasio aspek yang bervariasi. Model ini memanfaatkan arsitektur transformer yang beroperasi pada patch ruang-waktu dari kode laten video dan gambar. Model ini juga menggunakan jaringan kompresi video untuk mengurangi dimensi data visual dan memudahkan proses generasi.

OpenAI mengklaim bahwa Sora adalah model generalis dari data visual, yang artinya dapat menghasilkan video dan gambar dari berbagai kategori, seperti alam, binatang, manusia, seni, dan lain-lain. Model ini juga dapat menangkap nuansa gaya, suasana hati, dan cahaya dari instruksi teks yang diberikan. Selain itu, model ini juga dapat menciptakan adegan yang tidak ada dalam dunia nyata, seperti mamut berbulu raksasa atau monster bulu yang mengagumi lilin.

Sora merupakan langkah penting menuju tujuan OpenAI untuk mengajarkan AI untuk memahami dan mensimulasikan dunia fisik dalam gerak, dengan harapan dapat melatih model-model yang membantu manusia menyelesaikan masalah yang membutuhkan interaksi dunia nyata. Model ini juga dapat menjadi alat kreatif yang berguna untuk berbagai bidang, seperti hiburan, pendidikan, desain, dan lain-lain.

Namun, Sora juga memiliki keterbatasan dan tantangan yang perlu diatasi. Salah satunya adalah masalah etika dan tanggung jawab dalam menggunakan model generatif untuk menciptakan konten palsu atau menyesatkan. OpenAI menyadari hal ini dan berkomitmen untuk melakukan penelitian tentang keamanan dan keadilan AI. Selain itu, Sora juga masih membutuhkan perbaikan dalam hal kualitas visual, koherensi temporal, dan keberagaman hasil.

OpenAI belum merilis detail teknis atau kode Sora secara publik, tetapi telah membagikan beberapa contoh video yang dihasilkan oleh model ini di situs webnya . OpenAI juga telah menerbitkan laporan teknis yang menjelaskan metode dan evaluasi kualitatif Sora . Model ini diharapkan dapat membuka era baru video generatif dan membawa manfaat bagi masyarakat.

: Sora – OpenAI
: Video generation models as world simulators – OpenAI