Gemma adalah singkatan dari Google Exploratory Models for Multitask AI, dan nama ini mencerminkan kata Latin untuk "batu permata". Gemma adalah keluarga model bahasa besar (LLM) terbuka baru dari Google, yang didasarkan pada penelitian dan teknologi yang sama dengan Gemini, LLM paling canggih dari Google .
Gemma hadir dalam dua ukuran: 2B dan 7B parameter, masing-masing dengan versi dasar (pretrained) dan instruksi-tuned. Semua varian dapat dijalankan pada berbagai jenis perangkat konsumen, bahkan tanpa kuantisasi, dan memiliki panjang konteks 8K token .
Model-model Gemma memiliki kinerja yang sangat baik, dengan skor yang sebanding dengan model-model terbaik dalam kategori 7B, seperti Mistral 7B. Gemma 7B adalah model yang sangat kuat, dengan skor 63,75 di LLM Leaderboard. Gemma 2B adalah model yang menarik untuk ukurannya, tetapi tidak mencetak skor setinggi model-model terbaik dengan ukuran yang serupa, seperti Phi 2.
Format permintaan
Model dasar tidak memiliki format permintaan. Seperti model dasar lainnya, mereka dapat digunakan untuk melanjutkan urutan masukan dengan kelanjutan yang masuk akal atau untuk inferensi zero-shot/few-shot.
Model instruksi-tuned memiliki format permintaan yang lebih spesifik, yang memungkinkan pengguna untuk memberikan instruksi kepada model tentang apa yang diinginkan. Format permintaan ini terdiri dari tiga bagian:
- Tanda kurung siku yang berisi nama tugas, misalnya [translate], [summarize], [generate], dll.
- Tanda kurung kurawal yang berisi parameter opsional untuk tugas, misalnya {from: en, to: fr}, {max_length: 100}, {style: humorous}, dll.
- Teks masukan yang akan diproses oleh model, misalnya "Hello, world!", "The quick brown fox jumps over the lazy dog.", dll.
Contoh permintaan yang valid adalah:
[translate]{from: en, to: id}Hello, world!
[summarize]{max_length: 50}Gemma is a family of open-weights Large Language Model (LLM) by Google DeepMind, based on Gemini research and technology.
[generate]{style: humorous}What do you call a fish that wears a bowtie?
Contoh-contoh ini akan menghasilkan keluaran sebagai berikut:
Halo, dunia!
Gemma adalah keluarga model bahasa besar terbuka dari Google DeepMind, berdasarkan penelitian dan teknologi Gemini.
Bagaimana Anda menyebut ikan yang memakai dasi kupu-kupu?
Integrasi dengan Hugging Face
Gemma sepenuhnya terintegrasi dengan ekosistem Hugging Face. Anda dapat menemukan empat model terbuka (dua model dasar dan dua model fine-tuned) di Hub. Anda juga dapat menggunakan library Transformers untuk memuat dan menjalankan model-model Gemma dengan mudah.
Selain itu, Anda juga dapat menggunakan Google Cloud untuk menjalankan model-model Gemma di infrastruktur cloud yang andal dan hemat biaya. Anda juga dapat menggunakan Inference Endpoints untuk membuat API inferensi yang dapat diakses secara publik atau privat.
Gemma adalah model bahasa besar yang terbuka dan ringan dari Google, yang menawarkan kemampuan yang luar biasa untuk berbagai tugas bahasa. Dengan Gemma, Anda dapat menjelajahi dunia bahasa dengan lebih mudah dan menyenangkan.
Referensi:
google-deepmind/gemma: Open weights LLM from Google DeepMind. – GitHub
Welcome Gemma – Google’s new open LLM – Hugging Face
GIPHY App Key not set. Please check settings