Τι πρέπει να ξέρετε
- Η Google ανακοίνωσε το Gemini 3.1 Flash Live, μια ενημέρωση για το Gemini Live και το Search Live που φέρνει χαμηλής καθυστέρησης, πιο φυσική φωνητική βοήθεια στο AI.
- Αυτή η έκδοση του AI είναι ελαφριά, πράγμα που σημαίνει ότι η Google έχει επιταχύνει τους χρόνους απόκρισης και της έχει παραχωρήσει ένα μεγαλύτερο παράθυρο περιβάλλοντος για να συνεχίσει τη βοήθειά της.
- Η εταιρεία επισημαίνει αξιοσημείωτες βελτιώσεις σε σχέση με το μοντέλο Gemini 2.5 Flash Native, το οποίο έκανε το ντεμπούτο του για πρώτη φορά τον Δεκέμβριο.
επαναλήψεις της Google για Το Gemini δεν σταματά ποτέ, και αυτή η εβδομάδα δεν διαφέρει, με το λανσάρισμα ενός νέου, ελαφρού μοντέλου με χαμηλή καθυστέρηση.
Η εταιρεία λεπτομερώς τι οι χρήστες μπορούν να περιμένουν από το Gemini 3.1 Flash Live, το “υψηλότερης ποιότητας μοντέλο ήχου και φωνής” μέχρι σήμερα. Η Google δηλώνει ότι αυτή η νέα έκδοση του Gemini αποτελεί μέρος των φιλοδοξιών της για την «ταχύτητα και φυσικό ρυθμό» για τη «φωνή πρώτης τεχνητής νοημοσύνης». Εάν συμβαδίζετε με τους Gemini, μπορείτε πιθανώς να μαντέψετε πού πηγαίνει αυτό (υπόδειξη: Gemini Live). Η ανάρτηση ανακοίνωσης αναφέρει ότι το Gemini 3.1 Flash Lite κατευθύνεται στο Gemini Live και στο Search Live για να σας βοηθήσει με όλα τα ερωτήματα που βασίζονται στη φωνή.
Με αυτήν την προσθήκη, η Google παρέλασε «πιο χρήσιμες και φυσικές απαντήσεις» ως βασικό σημείο. Προσθέτει ότι η έκδοση 3.1 είναι ικανή να παρέχει βοήθεια για καθημερινές ερωτήσεις και πιο σύνθετα θέματα. Δεδομένου ότι το “Flash” βρίσκεται στον τίτλο, το 3.1 Flash Live έχει σχεδιαστεί για να παρέχει απαντήσεις πολύ πιο γρήγορα από ό,τι είχαν βιώσει οι χρήστες πριν. Επιπλέον, «μπορεί να ακολουθεί το νήμα της συνομιλίας σας για διπλάσιο χρόνο».
Το άρθρο συνεχίζεται παρακάτω
Ενώ παραλείπετε τα μαθήματά σας στο Duolingo (ή πρακτικές Google Translate), ο Gemini δεν έχει. Η Google δηλώνει ότι η τεχνητή νοημοσύνη είναι «πολύγλωσση, πράγμα που σημαίνει ότι είναι δυνατές οι απαντήσεις σε πραγματικό χρόνο στη γλώσσα που προτιμάτε.
Το Gemini 3.1 Flash Live φέρεται να έχει αρκετά υψηλή βαθμολογία σε δοκιμές αναφοράς, ωφελώντας τους προγραμματιστές και τις επιχειρήσεις. Από τεχνικής πλευράς, η Google υπογραμμίζει τις «βελτιωμένες τονικές» δυνατότητες του AI, καθώς και την ικανότητα αναγνώρισης «ακουστικών αποχρώσεων», όπως το βήμα σας.
Η φωνή σου είναι πρώτη
Οι προγραμματιστές είναι να πάρει λίγο περισσότεροόπως αναφέρει η Google, μπορούν να δημιουργήσουν συνομιλητές που βοηθούν σε πραγματικό χρόνο. Διαθέσιμο μέσω του Gemini API και του AI Studio, οι προγραμματιστές φέρεται να βρίσκουν υψηλότερα ποσοστά ολοκλήρωσης εργασιών σε “θορυβώδη” περιβάλλοντα. Δεν είναι μόνο η ικανότητα της τεχνητής νοημοσύνης να παρέχει καλύτερες απαντήσεις στις ζωντανές συνομιλίες, αλλά και οι βελτιώσεις που διαχωρίζουν την ομιλία ενός ατόμου από τον δυνατό θόρυβο της κίνησης.
Το AI έχει επίσης λάβει αναβαθμίσεις στις ικανότητές του που ακολουθούν τις οδηγίες. Η Google δηλώνει, “Ο αντιπρόσωπός σας θα παραμείνει εντός των επιχειρησιακών προστατευτικών κιγκλιδωμάτων του, ακόμη και όταν οι συνομιλίες παίρνουν απροσδόκητες στροφές.” Αυτό συνδυάζεται με άλλες ενημερώσεις που αναφέρθηκαν προηγουμένως στο Gemini 3.1 Flash Live, όπως οι πολύγλωσσες δυνατότητές του και η χαμηλή καθυστέρηση.
Καθώς η Google ενισχύει τη φωνητική πλευρά του Gemini Live, υπήρξε μια ενημέρωση που το έφερε στον πραγματικό κόσμο για να βλέπω τι κάνεις. Οι χρήστες μπορούν να μοιράζονται την κάμερά τους με τους Gemini, κάτι που ουσιαστικά τους επιτρέπει να κάνουν μια ερώτηση σχετικά με το τι βλέπουν. Επιπλέον, αυτή η αναβάθμιση περιλάμβανε επίσης μια λειτουργία κοινής χρήσης οθόνης, οπότε αν έχετε αναζητήσει κάτι για το οποίο δεν είστε σίγουροι, μπορείτε να ζητήσετε από το Gemini να σας δώσει τις λεπτομέρειες.
Λήψη του Android Central
Μια ενημέρωση όπως αυτή φαίνεται σαν ένα προφανές επόμενο βήμα για την Google. Το κάνει με λίγο διαφορετικό τρόπο από ό,τι θα περίμενα. Σκέφτηκα ότι θα είχε διπλασιάσει περισσότερο τη λειτουργία της κάμερας ή την πτυχή κοινής χρήσης οθόνης. Αλλά η ενίσχυση της πλευράς που βασίζεται στη φωνή δεν είναι και τόσο άσχημη. Μιλάμε για βοήθεια σε πραγματικό χρόνο, επομένως η ικανότητα του Gemini να κατανοεί τον χρήστη, όσο καλύτερα μπορεί, είναι σημαντική. Τίποτα δεν είναι πιο χάλια από το να πρέπει να επαναλάβεις τον εαυτό σου στο α κατά γράμμα ηλεκτρονικός υπολογιστής.
Via: androidcentral.com
