Γνωρίστε το Janus-Pro-7B: Το νέο δωρεάν μοντέλο AI - TechFreak.GR
Γνωρίστε το Janus-Pro-7B: Το νέο δωρεάν μοντέλο AI - TechFreak.GR


Η Deepseek έχει αποκαλύψει μια ακόμη σημαντική συμβολή στο τοπίο AI ανοιχτού κώδικα. Αυτή τη φορά, είναι Janus-Pro-7B: μια πολυτροπική δύναμη ικανή τόσο για κατανόηση όσο και για δημιουργία εικόνων. Σύμφωνα με Rowan Cheungτο νέο μοντέλο όχι μόνο εκλείπει το Dall-E 3 της OpenAI και τη σταθερή διάχυση σε σημεία αναφοράς όπως το Geneval και το DPG Bench, αλλά δείχνει επίσης το ίδιο “ελεύθερα διαθέσιμο” πνεύμα που έκανε το προηγούμενο μοντέλο R1 του Deepseek. Οι επενδυτές, εν τω μεταξύ, προσπαθούν να κατανοήσουν την αύξηση των ανακαλύψεων του AI, με το απόθεμα της Nvidia να βυθίζεται πάνω από 17% το μεσημέρι.

Θα μπορούσε ο Janus-Pro-7B να είναι ο επόμενος μεγάλος διαταράκτης σε μια ήδη ταραχώδη αγορά τεχνολογίας;

Τι είναι το Deepseek Janus-Pro-7B;

Κάτω από την κουκούλα, ο Janus-Pro-7B φαίνεται να γεφυρώνει το χάσμα μεταξύ της ισχυρής επεξεργασίας όρασης και της ταχείας παραγωγής κειμένου. Δανείζοντας μια νέα προσέγγιση αποσύνδεσης από τον κωδικοποιητή Siglip-L, το σύστημα μπορεί γρήγορα να αναλύσει μια εικόνα 384 x 384 πριν πηδήσει σε λειτουργία δημιουργικής εξόδου. Ταιριάζει, ή ακόμα και ξεπερνά, πολλά εξειδικευμένα μοντέλα στο χώρο – ένα επίτευγμα ιδιαίτερα εντυπωσιακό δεδομένου ότι παραμένει επίσης εξαιρετικά εύκολο να προσαρμοστεί και να επεκταθεί.

Εικόνα: Deepseek

Οι αναλυτές δείχνουν τη συνεπή φιλοσοφία του Deepseek: διατηρούν την ανοιχτή πηγή, παραμένουν στην ιδιωτική ζωή-πρώτα και υποτιμούν τους αντιπάλους που βασίζονται σε συνδρομές. Ο Janus-Pro-7B φαίνεται να παραδίδει και τα τρία μέτωπα, θέτοντας σημάδια υψηλής απόδοσης διατηρώντας παράλληλα την προσβασιμότητα που επέστησε τους οπαδούς στις δυνατότητες εκτός σύνδεσης του DeepSeeek-R1.

Γνωρίστε το Janus-Pro-7B: Το νέο δωρεάν μοντέλο AI - TechFreak.GR
Εικόνα: Deepseek

Σε καθαρά πραγματικούς όρους, ο Janus-Pro-7B έχει άδεια χρήσης υπό επιτρεπόμενο Πλαίσιο MITμε προστιθέμενες οδηγίες χρήσης από το Deepseek. Το μοντέλο ενσωματώνεται με τα κατάντη έργα μέσω ενός αποθετηρίου GitHub και σύμφωνα με πληροφορίες χρησιμοποιεί μόλις 16 φορές υποβάθμιση στον αγωγό δημιουργίας εικόνων. Οι τρέχοντες δείκτες υποδεικνύουν ότι η άφιξη του Janus-Pro-7B μπορεί να προκαλέσει φρέσκο ​​ανταγωνισμό μεταξύ των προγραμματιστών της AI, αν και μόνο ο χρόνος θα πει πώς αυτή η τελευταία δωρεάν προσφορά θα επηρεάσει τη ζώνη AI.


Πώς να ρυθμίσετε εύκολα το Deepseek-R1 δωρεάν (σε απευθείας σύνδεση και τοπικό);


Πώς λειτουργεί;

Όπως περιγράφεται λεπτομερώς στο ερευνητικό χαρτί Δημοσιεύθηκε από το Deepseek, το μοντέλο χρησιμοποιεί έναν κωδικοποιητή Siglip-Large-Patch16-384, ο οποίος σπάει κάθε εικόνα σε 16 × 16 μπαλώματα σε ανάλυση 384 × 384. Αυτή η προσέγγιση διατηρεί λεπτομερώς λεπτομέρειες, βοηθώντας το σύστημα να ερμηνεύσει με μεγαλύτερη ακρίβεια τις εικόνες. Από την πλευρά της γενιάς, ο Janus-Pro χρησιμοποιεί ένα βιβλίο κωδικών 16.384 μάρκες για να αντιπροσωπεύει εικόνες σε κλίμακα 16x μειωμένο, επιτρέποντας αποτελεσματικές ανακατασκευές που ανταγωνίζονται-αν δεν ξεπεράσουν τα μοντέλα παραδοσιακής διάχυσης στην ποιότητα.

Δύο προσαρμογείς κλειδιού MLP (πολλαπλών επιπέδων perceptron) συνδέουν αυτά τα εξαρτήματα κατανόησης και παραγωγής, διασφαλίζοντας ομαλά τη ροή δεδομένων μεταξύ των δύο εργασιών. Κατά τη διάρκεια της εκπαίδευσης, το μοντέλο βλέπει ένα μείγμα δεδομένων εικόνας και κειμένου, επιτρέποντάς του να μάθει και τα δύο πώς να ερμηνεύει τις οπτικές σκηνές και να παράγει τις δικές του εικόνες. Οι συνεδρίες συνήθως χρειάζονται 7 έως 14 ημέρες σε συστάδες μεγάλης κλίμακας GPU (για εκδόσεις παραμέτρων 1,5b και 7b), με επιδόσεις που δοκιμάζονται σε σημεία αναφοράς όπως το GQA (για οπτική κατανόηση) και το VisualGen (για δημιουργία εικόνων). Το αποτέλεσμα είναι ένα ευέλικτο πλαίσιο που υπερέχει σε πολυτροπικά καθήκοντα, χάρη στην εξειδικευμένη αλλά συνεκτική αρχιτεκτονική του.

Πώς να χρησιμοποιήσετε το Deepseek Janus-Pro-7B;

Η εκκίνηση με το Janus-Pro-7B είναι τόσο απλή όσο η κατεύθυνση του επίσημου αποθετηρίου του GitHub, η κλωνοποίηση ή η λήψη του κώδικα και η εγκατάσταση των απαραίτητων εξαρτήσεων. Το αποθετήριο περιλαμβάνει ένα ολοκληρωμένο readme που σας περπατά μέσω της δημιουργίας ενός περιβάλλοντος Python, τραβώντας τα βάρη μοντέλου και τρέχοντας δείγματα σεναρίων. Ανάλογα με το υλικό σας, μπορείτε να επιλέξετε μεταξύ της λειτουργίας CPU μόνο ή της επιτάχυνσης GPU Horness για ταχύτερη απόδοση. Είτε έτσι είτε αλλιώς, η διαδικασία εγκατάστασης παραμένει απλή, χάρη στις καλά τεκμηριωμένες προϋποθέσεις και τις οδηγίες βήμα προς βήμα.

Μόλις λειτουργήσουν όλα, μπορείτε να τροφοδοτήσετε τις προτροπές για την παραγωγή κειμένου ή να παρέχετε εισόδους εικόνας για τις μοναδικές πολυτροπικές δυνατότητες του μοντέλου. Δείγματα σημειωματάρια στο repo καταδεικνύουν πώς να δημιουργούν δημιουργικές εξόδους, να εφαρμόσουν προηγμένα μετασχηματισμούς εικόνας ή να διερευνήσουν σενάρια “Visual Q & A”. Για πιο προχωρημένους χρήστες, ο αρθρωτός σχεδιασμός του αποθετηρίου σημαίνει ότι μπορείτε να τροποποιήσετε τα υποκείμενα στρώματα, να συνδέσετε τα δικά σας σύνολα δεδομένων ή ακόμα και να στοιβάζετε το μοντέλο παράλληλα με άλλες απελευθερώσεις Deepseek όπως το R1.



VIA: Πηγή Άρθρου


Greek Live Channels Όλα τα Ελληνικά κανάλια: Βρίσκεστε μακριά από το σπίτι ή δεν έχετε πρόσβαση σε τηλεόραση; Το IPTV σας επιτρέπει να παρακολουθείτε όλα τα Ελληνικά κανάλια και άλλο περιεχόμενο από οποιαδήποτε συσκευή συνδεδεμένη στο διαδίκτυο. Αν θες πρόσβαση σε όλα τα Ελληνικά κανάλια Πατήστε Εδώ


Ακολουθήστε το TechFreak.gr στο Google News

Ακολουθήστε το TechFreak.GR στο Google News για να μάθετε πρώτοι όλες τις ειδήσεις τεχνολογίας.


ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ