Η PrismML παρουσιάζει το Bonsai Image 4B, ένα επαναστατικό μοντέλο AI που επιτρέπει στους χρήστες να δημιουργούν εικόνες απευθείας από iPhone και Mac, χωρίς να απαιτείται cloud υποστήριξη, αξιοποιώντας ανοιχτές τεχνολογίες 1-bit και Ternary.
Η PrismML, μια καινοτόμος startup, λανσάρει το Bonsai Image 4B, μια σειρά μοντέλων που σχεδιάστηκαν για να λειτουργούν αυτόνομα σε φορητές συσκευές — από laptops έως smartphones. Σύμφωνα με την εταιρεία, το Bonsai Image 4B είναι το πρώτο μοντέλο δημιουργίας εικόνας στην κατηγορία 4B που μπορεί να τρέξει απευθείας στο iPhone.
Πρακτικές επιπτώσεις για τους χρήστες
Το Bonsai Image 4B παράγει εικόνες με ανάλυση 512×512 pixels σε μόλις 9,4 δευτερόλεπτα στο iPhone 17 Pro Max, ενώ σε Mac M4 Pro οι χρόνοι φτάνουν περίπου τα 6 δευτερόλεπτα. Αντίθετα, το πλήρες FLUX.2 Klein 4B δεν μπορεί καν να χωρέσει στη μνήμη του iPhone 17 Pro Max. Σε σύγκριση με αυτό, η Bonsai έκδοση είναι μέχρι 5,6 φορές πιο γρήγορη σε Mac M4 Pro από το αντίστοιχο full-precision pipeline. Το συνολικό μέγεθος για την εγκατάσταση σε Apple Silicon φτάνει τα 3,42 GB για την 1-bit και 3,88 GB για την Ternary παραλλαγή, συγκριτικά με 15,97 GB του πλήρους μοντέλου.
Αξιοπιστία και benchmarks
Η συμπίεση της εφαρμογής δεν θυσιάζει την ποιότητα των εικόνων που παράγονται. Σε δοκιμές που διεξήχθησαν με τα GenEval, HPSv3 και DPG-Bench, η Ternary παραλλαγή διατηρεί το 95% της απόδοσης του πλήρους FLUX.2 Klein 4B, και η 1-bit έκδοση αγγίζει το 88%. Και οι δύο παραλλαγές ξεπερνούν σημαντικά παλαιότερες λύσεις του ίδιου μεγέθους, όπως το BK-SDM-Small (42%) και το Stable Diffusion 1.5 (51%). Το Bonsai Image 4B κυκλοφορεί με ανοιχτό κώδικα και άδεια Apache 2.0, ενώ είμαστε μάρτυρες της διάθεσής του παράλληλα με την Bonsai Studio για iPhone.
Η σημασία της τοπικής εκτέλεσης
Η χρήση cloud για τη δημιουργία εικόνων συχνά συνοδεύεται από αναμονή, κόστη ανά αίτημα και ανησυχίες σχετικά με την ιδιωτικότητα. Το Bonsai Image 4B ανατρέπει αυτή τη δυναμική: μόλις το μοντέλο χωρέσει στη συσκευή, οι χρήστες μπορούν να πειραματιστούν, να επαναλαμβάνουν και να αναθεωρούν προ prompts χωρίς να διακυβευτεί ο χρόνος ή τα χρήματα για κάθε αίτημα. Τα δεδομένα παραμένουν αποκλειστικά στη συσκευή, αποφεύγοντας την αποστολή σε εξωτερικούς servers.
Η άποψη του TechNoid.gr
Η PrismML έχει καταφέρει να πετύχει αυτό που για πολλούς φάνταζε αδύνατο πριν από έναν χρόνο: τη δημιουργία εικόνων επαγγελματικής ποιότητας χωρίς ανάγκη σύνδεσης στο διαδίκτυο, αποκλειστικά από το smartphone του χρήστη. Για εκείνους που επιδιώκουν να δημιουργήσουν περιεχόμενο χωρίς να εκθέτουν τις αναζητήσεις τους σε τρίτους, αυτό αποτελεί μια αξιοσημείωτη καινοτομία. Εφόσον ο ανοιχτός κώδικας και η άδεια Apache 2.0 προσελκύσουν την προσοχή της προγραμματιστικής κοινότητας, αναμένουμε να δούμε σύντομα ενδιαφέρουσες εφαρμογές που θα προκύψουν από αυτή τη βάση.


