OpenAI baru-baru ini memperkenalkan GPT-4o ("o" untuk "omni"), model bahasa generatif multimodal terbarunya yang menjanjikan kemajuan signifikan dalam interaksi pengguna-AI. GPT-4o menawarkan berbagai fitur canggih yang meningkatkan kemampuan generasi teks, suara, dan gambar.
Salah satu keunggulan utama GPT-4o adalah respons audio yang sangat cepat, yang dapat memberikan tanggapan hanya dalam 232 milidetik. Model ini juga menunjukkan peningkatan yang nyata dalam kecepatan respons teks untuk perintah non-bahasa Inggris, dengan dukungan untuk lebih dari 50 bahasa. Selain itu, pengguna dapat melakukan interupsi selama percakapan untuk mengajukan pertanyaan tambahan atau memberikan klarifikasi.
GPT-4o juga dilengkapi dengan asisten suara yang lebih mumpuni dan terdengar lebih alami yang merespons secara real-time dan dapat mengamati lingkungan pengguna melalui kamera perangkat. Pengguna dapat menyesuaikan nada suara asisten, dari ceria hingga suara robot. Model ini juga menyediakan terjemahan real-time dalam lebih dari 50 bahasa dan dapat berfungsi sebagai asisten aksesibilitas bagi pengguna dengan gangguan penglihatan.
OpenAI mendemonstrasikan berbagai kemampuan GPT-4o dalam siaran langsungnya. Pengguna dapat melihat fitur-fitur baru di saluran YouTube OpenAI. GPT-4o akan tersedia untuk pengguna gratis ChatGPT, sementara pelanggan ChatGPT Plus akan menerima batas pesan lima kali lebih tinggi. Fitur teks dan gambar GPT-4o saat ini sudah tersedia di aplikasi ChatGPT dan web. Mode suara baru akan tersedia sebagai mode alfa untuk ChatGPT Plus dalam beberapa minggu mendatang.
Selain GPT-4o, OpenAI juga mengumumkan aplikasi desktop ChatGPT untuk macOS, dengan versi Windows yang dijadwalkan rilis akhir tahun ini. Mereka juga meluncurkan ChatGPT Store, yang menampung jutaan bot obrolan khusus yang dapat diakses pengguna secara gratis.
GIPHY App Key not set. Please check settings