Η Google Research ανέπτυξε το TurboQuant, έναν νέο αλγόριθμο συμπίεσης μνήμης με τεχνητή νοημοσύνη που έχει σχεδιαστεί για να βελτιώνει την αποτελεσματικότητα στα συστήματα τεχνητής νοημοσύνης.
Ο αλγόριθμος επιτρέπει στα μοντέλα τεχνητής νοημοσύνης να επεξεργάζονται περισσότερες πληροφορίες με λιγότερη μνήμη, μειώνοντας πιθανώς το λειτουργικό κόστος για τα συμπεράσματα τεχνητής νοημοσύνης, προκαλώντας συγκρίσεις με τη φανταστική τεχνολογία συμπίεσης που απεικονίζεται στο “Silicon Valley” του HBO.
Η Google Research περιέγραψε το TurboQuant ως μια νέα μέθοδο συρρίκνωσης της μνήμης εργασίας του AI, γνωστής ως κρυφής μνήμης KV, χωρίς να επηρεαστεί η απόδοση. Η εταιρεία είπε ότι αυτή η συμπίεση θα μπορούσε να μειώσει τη μνήμη χρόνου εκτέλεσης τουλάχιστον έξι φορές.
Η μέθοδος συμπίεσης χρησιμοποιεί διανυσματική κβαντοποίηση για να καθαρίσει τα σημεία συμφόρησης της κρυφής μνήμης στην επεξεργασία AI. Αυτό επιτρέπει στα συστήματα AI να διατηρούν την ακρίβεια, ενώ χρησιμοποιούν λιγότερο χώρο.
Βίντεο: Google
Οι ερευνητές σχεδιάζουν να παρουσιάσουν τα ευρήματά τους στο συνέδριο ICLR 2026 τον επόμενο μήνα. Θα αναφέρουν λεπτομερώς δύο μεθόδους που διευκολύνουν αυτήν τη συμπίεση: τη μέθοδο κβαντοποίησης PolarQuant και τη μέθοδο εκπαίδευσης και βελτιστοποίησης QJL.
Ο Διευθύνων Σύμβουλος του Cloudflare, Matthew Prince, συνέκρινε το TurboQuant με τη «στιγμή DeepSeek» της Google, αναφέροντας τα κέρδη απόδοσης από ένα μοντέλο AI που πέτυχε ανταγωνιστικά αποτελέσματα χρησιμοποιώντας λιγότερους πόρους.
Το TurboQuant δεν έχει δει ακόμη ευρεία ανάπτυξη και παραμένει μια εργαστηριακή ανακάλυψη σε αυτό το στάδιο. Στοχεύει στη μνήμη συμπερασμάτων, όχι στη μνήμη εκπαίδευσης, η οποία συνεχίζει να απαιτεί σημαντική RAM.
VIA: DataConomy.com
