Παντελώς άγνωστη στη Δύση μέχρι πριν από μερικές μέρες, η κινεζική DeepSeek έφερε σεισμό στο χώρο της τεχνητής νοημοσύνης, μετά την παρουσίαση ενός chatbot που προσφέρει τις ίδιες επιδόσεις με το ChatGPT αλλά με εντυπωσιακά μικρότερο κόστος.
Ενδεικτική του ενθουσιασμού είναι η αναρρίχηση της DeepSeek στην κορυφή της λίστας με τις δημοφιλέστερες εφαρμογές του Apple App Store, πάνω από το ChatGPΤ στη δεύτερη θέση.
Στο μεταξύ, τα αμερικανικά χρηματιστήρια στέναξαν, με την Nvidia και άλλες εταιρείες να μετρούν διψήφιες απώλειες στις μετοχές τους και να αναρωτιούνται αν οι αστρονομικές επενδύσεις στην ΑΙ είναι ανταγωνιστικές και δικαιολογημένες.
Ακόμα και ο πρόεδρος των ΗΠΑ Ντόναλντ Τραμπ παραδέχτηκε πως η επιτυχία της κινεζικής εταιρείας σημαίνει «καμπανάκι αφύπνισης» για τις αμερικανικές εταιρείες τεχνολογίας, οι οποίες δαπανούν δεκάδες ή εκατοντάδες εκατομμύρια δολάρια για την εκπαίδευση νέων μοντέλων ΑΙ.
Σε τεχνική έκθεση που παρουσίασε τον περασμένο μήνα, η DeepSeek υποστήριξε ότι για την εκπαίδευση του μοντέλου V3 χρειάστηκε εξοπλισμός συνολικού κόστους 6 εκατ. δολαρίων.
Η εταιρεία υποστηρίζει μάλιστα ότι χρησιμοποίησε τα τσιπ H800 της Nvidia, τα οποία προσφέρουν σχετικά χαμηλές επιδόσεις.
Όπως φαίνεται, οι αμερικανικοί περιορισμοί στις εξαγωγές πιο προηγμένων τσιπ στην Κίνα δεν έπιασαν τόπο.
Ποια είναι η DeepSeek
Πρόκειται για νεοσύστατη εταιρεία που ανήκει στην χρηματιστηριακή εταιρεία High-Flyer και φιλοδοξεί να ανταγωνιστεί την OpenAI, τη Meta και τη Google. Μέχρι το 2021, η DeepSeek είχε προλάβει να προμηθευτεί χιλιάδες τσιπ της Nvidia για την ανάπτυξη των μοντέλων της.
Τόσο η High-Flyer όσο και η DeepSeek διευθύνονται από τον 40χρονο Λιάνγκ Γoυενφένγκ.
Στην Κίνα, αναφέρουν οι New York Times, η εταιρεία είναι γνωστή για τη στρατολόγηση νέων και ταλαντούχων ερευνητών από κορυφαία εργαστήρια, στους οποίους προσφέρει παχυλούς μισθούς και την ευκαιρία να εργαστούν σε προγράμματα αιχμής.
Τα τελευταία χρόνια η DeepSeek έχει παρουσιάσει αρκετά μεγάλα γλωσσικά μοντέλα, όμως το πρώτο της chatbot, βασισμένο στο μοντέλο V3, έκανε ντεμπούτο στις 10 Ιανουαρίου.
Οι αγορές εντυπωσιάστηκαν όχι μόνο από τις επιδόσεις του αλλά και από την αποδοτικότητά του, δεδομένου ότι η DeepSeek λέει ότι χρειάστηκε μόλις 2.000 τσιπ χαμηλών επιδόσεων, ενώ οι άλλοι χρειάζονται έως και 16.000.
Τι αλλάζει στην ΑΙ
Από τα τέλη του 2022, όταν παρουσιάστηκε το ChatGPΤ της OpenAI, η ιδέα που κυριαρχούσε ήταν ότι η ανάπτυξη όλο και καλύτερων, όλο και μεγαλύτερων μοντέλων θα απαιτούσε όλο και μεγαλύτερη χρηματοδότηση.
Αυτό θα σήμαινε ότι μόνοι οι γίγαντες της τεχνολογίας –OpenAI, Google, Meta, Anthropic– θα μπορούσαν να αντεπεξέλθουν στις απαιτήσεις, ενώ οι υπόλοιποι απλά θα νοικιάζουν τα μεγάλα μοντέλα τους.
Όμως τα 6 εκατομμύρια δολάρια που λέει η DeepSeek ότι δαπάνησε για το V3 είναι ακριβώς 10 φορές λιγότερα από όσα χρειάστηκε η Meta για να δοκιμάσει το τελευταίο μοντέλο της σειράς Llama.
Επιπλέον, η DeepSeek προσφέρει τα μοντέλα της ως τεχνολογίες ανοιχτού κώδικα, κάτι που σημαίνει ότι κάθε ενδιαφερόμενος μπορεί να τα κατεβάσει, να τα χρησιμοποιήσει και να τα μιμηθεί.
Στην τεχνική έκθεσή της, η κινεζική εταιρεία παρουσιάζει νέες, πιο αποδοτικές τεχνικές για την ανάλυση μεγάλου όγκου δεδομένων, η οποία ανατέθηκε σε μια ομάδα επιμέρους αλγορίθμων που εργάστηκαν από κοινού.
Παρόμοιες τεχνικές είχαν δοκιμαστεί στο παρελθόν και από άλλους, όμως η DeepSeek κατάφερε να βρει τη μέθοδο που ελαχιστοποίησε τις απαιτήσεις σε επεξεργαστική ισχύ.
Επιφυλάξεις
Ορισμένοι αναλυτές δέχονται με δυσπιστία τους ισχυρισμούς της κινεζικής εταιρείας.
O διευθύνων σύμβουλος της Scale AI, Αλεξάντερ Ουάνγκ, δήλωσε την περασμένη εβδομάδα στο CNBC ότι η DeepSeek έχει στη διάθεσή της 50.000 κάρτες H100 της Nvidia, τις οποίες όμως δεν μπορεί να αποκαλύψει επειδή παραβιάζουν την αμερικανική απαγόρευση εξαγωγών.
Ακόμα, αναλυτές της εταιρείες Bernstein εκτιμούν ότι το πραγματικό κόστος για την εκπαίδευση του V3 είναι μεν άγνωστο, πρέπει όμως να υπερβαίνει κατά πολύ τα 6 εκατ. δολάρια που λέει ότι ξόδεψε η DeepSeek.
Τι μπορούν να κάνουν τα μοντέλα της DeepSeek
Η εφαρμογή «AI Assistant» της DeepSeek, δωρεάν διαθέσιμη για συσκευές Apple και Android, λειτουργεί περίπου όπως το ChatGPT: ο χρήστης εισάγει οδηγίες και το σύστημα δίνει γραπτές απαντήσεις.
Σε αντίθεση με το ChatGPT, δυνατότητα φωνητικού ελέγχου δεν υπάρχει.
Εκτός από το μοντέλο V3 στο οποίο βασίζεται το chatbot, η DeepSeek παρουσίασε την περασμένη εβδομάδα το μοντέλο R1, το οποίο διαθέτει «συλλογιστικές ικανότητες» και προσφέρει επιδόσεις συγκρίσιμες με του μοντέλου ο1 της OpenAI.
Αντί να προβλέπουν ποια λέξη είναι στατιστικά αναμενόμενο να ακολουθεί μια άλλη, όπως συμβαίνει με τα μεγάλα γλωσσικά μοντέλα όπως το ChatGPT, τα συλλογιστικά μοντέλα μπορούν να λύνουν δύσκολα προβλήματα χωρίζοντάς τα σε επιμέρους βήματα.
Τα μαθηματικά, ο προγραμματισμός, η χημεία, η κβαντική φυσική είναι μερικά από τα πεδία στα οποία οι ερευνητές πειραματίζονται με συλλογιστικά μοντέλα.
Το R1 είναι ήδη διαθέσιμο για συνδρομητές και κοστίζει 20-50 φορές λιγότερο από ό,τι το o1.
Ακόμα, η DeepSeek υποστηρίζει ότι το μοντέλο της για την παραγωγή συνθετικών εικόνων, με την ονομασία Janus-Pro-7B AI, ξεπερνά σε επιδόσεις τα αντίστοιχα μοντέλα DALL-E 3 της OpenAI και Stable Diffusion της Stability AI.
Έχει πλέον η Κίνα το προβάδισμα στην ΑΙ;
Όχι. Η DeepSeek δεν κατάφερε κάτι νέο, απλώς υποστηρίζει ότι έκανε με πιο οικονομικό τρόπο αυτό που οι άλλοι χρειάζονται δισεκατομμύρια να πετύχουν.
Είναι εξάλλου σίγουρο ότι οι μεγάλες εταιρείες τεχνολογίας που έχουν προμηθευτεί μεγάλο αριθμό τσιπ AI μπορούν να κάνουν περισσότερα πειράματα στον ίδιο χρόνο και να εξυπηρετούν μεγαλύτερο αριθμό πελατών.
Επιπλέον, η διάθεση των μοντέλων της DeepSeek ως τεχνολογιών ανοιχτού κώδικα σημαίνει πως όλοι οι ενδιαφερόμενοι μπορούν να υιοθετήσουν την προσέγγιση της εταιρείας και να πετύχουν εξοικονόμηση πόρων.
Η Κίνα μπορεί να μην έχει το προβάδισμα, έδωσε όμως το παράδειγμα.
VIA: Πηγή Άρθρου
Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ
Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.