Ταυτόχρονα, η Google αλλάζει τη στρατηγική της γύρω από την πολιτική αδειοδότησης, εγκαταλείποντας την προηγούμενη «προσαρμοσμένη» άδεια του Gemma και υιοθετώντας την Apache 2.0. Αυτή η απόφαση αποσκοπεί στη μείωση των τριβών που είχαν εκφραστεί από πολλούς developers σχετικά με τους περιοριστικούς όρους της προηγούμενης άδειας.
Νέα Χαρακτηριστικά του Gemma 4
Το Gemma 4 έχει σχεδιαστεί για να λειτουργεί σε τοπικούς υπολογιστές, με δύο μεγαλύτερες παραλλαγές που απευθύνονται σε πιο ισχυρό hardware. Πιο συγκεκριμένα, οι παραλλαγές 26B Mixture of Experts (MoE) και 31B Dense είναι δομημένες να εκτελούνται χωρίς quantization σε bfloat16 format σε Nvidia H100 80GB GPUs. Είναι ενδιαφέρον ότι, με τη χρήση quantization και συντελεστών χαμηλότερης ακρίβειας, ακόμη και τα μεγάλα μοντέλα μπορούν να λειτουργούν σε καταναλωτικές GPUs.
Context Length και Υποστήριξη Γλωσσών
Σε ό,τι αφορά το context length, τα μοντέλα edge φτάνουν τα 128k tokens, ενώ οι παραλλαγές 26B και 31B υποστηρίζουν έως και 256k tokens. Όσον αφορά τις γλώσσες, η λειτουργία υποστηρίζει περισσότερες από 140 γλώσσες. Επίσης, τα cloud μοντέλα Gemini προσφέρουν την εντυπωσιακή δυνατότητα 1 εκατομμυρίου tokens context.
Αλλαγή Πολιτικής Άδειας
Η αλλαγή άδειας αποτελεί κρίσιμο σημείο στην προσέγγιση της Google. Ειδικότερα, η προηγούμενη άδεια του Gemma 3 είχε αυστηρούς περιορισμούς στις επιτρεπόμενες χρήσεις που μπορούσαν να ενημερώνονται μονομερώς από την Google. Η νέα πολιτική Apache 2.0 έχει σχεδιαστεί για να προσφέρει μεγαλύτερη ευελιξία και ελευθερία στους developers, επιτρέποντάς τους μεγαλύτερο έλεγχο στην επεξεργασία δεδομένων και τη διαδικασία ανάπτυξης.
Εφαρμογές και καινοτομίες
Η κυκλοφορία των E2B και E4B μοντέλων συνδέεται με τα σχέδια της Google για τοπική AI στα smartphones. Συγκεκριμένα, τα Pixel τηλέφωνα, καθώς και ορισμένα άλλα κινητά, εκμεταλλεύονται το Gemini Nano για λειτουργίες όπως η ανίχνευση τηλεφωνικών και SMS απατών, η σύνοψη σημειώσεων και οι περιλήψεις κλήσεων, όλα αυτά χωρίς να χρειάζεται να αποστέλλονται δεδομένα στο cloud.
Ένας εκπρόσωπος της Google επιβεβαίωσε ότι το Gemini Nano προέρχεται από τα Gemma και ότι μία επόμενη έκδοση, το Gemini Nano 4, θα είναι διαθέσιμη με παραλλαγές 2B και 4B, βασισμένες στα Gemma 4 E2B και E4B. Οι developers έχουν τη δυνατότητα να ξεκινήσουν την πρωτοτυποποίηση workflows στον AI Core Developer Preview, με το πλεονέκτημα ότι αυτά τα συστήματα θα είναι forward-compatible με το Gemini Nano 4 όταν αυτό κυκλοφορήσει.
Διαθεσιμότητα των Νέων Μοντέλων
Τα νέα μοντέλα είναι διαθέσιμα στο AI Studio (31B και 26B MoE) και στην AI Edge Gallery (E4B και E2B), με τα weights να μπορούν να διατεθούν από έγκυρες πηγές όπως το Hugging Face, Kaggle και Ollama. Η Google προσφέρει επίσης αυτές τις δυνατότητες μέσω του Google Cloud, αν και με χρέωση, ενώ είναι οργανωμένες για τοπική επεξεργασία.
