Η Google παρουσίασε μια δοκιμαστική έκδοση του Gemini 2.5 Flash, της νεότερης εκδοχής του αποδοτικού μοντέλου τεχνητής νοημοσύνης της που σχεδιάστηκε για να ισορροπεί μεταξύ απόδοσης, ταχύτητας και κόστους.
Βασισμένο στα θεμέλια του Gemini 2.0 Flash, το νέο μοντέλο 2.5 Flash προσφέρει σημαντική αναβάθμιση στις ικανότητες συλλογιστικής, διατηρώντας παράλληλα τη φήμη του για αποδοτικότητα. Η Google το περιγράφει ως «μια σημαντική αναβάθμιση στις δυνατότητες συλλογιστικής, διατηρώντας την προτεραιότητα στην ταχύτητα και το κόστος».
Το χαρακτηριστικό που ξεχωρίζει στο Gemini 2.5 Flash είναι το υβριδικό σύστημα συλλογιστικής του. Πρόκειται για το «πρώτο πλήρως υβριδικό μοντέλο συλλογιστικής της Google, που επιτρέπει στους προγραμματιστές να ενεργοποιούν ή να απενεργοποιούν τη σκέψη, καθώς και να ορίζουν προϋπολογισμούς σκέψης ώστε να βελτιστοποιούν την ισορροπία μεταξύ ποιότητας, κόστους και καθυστέρησης». Αυτή η καινοτόμος προσέγγιση δίνει στους προγραμματιστές πρωτοφανή έλεγχο στον τρόπο που το μοντέλο επεξεργάζεται σύνθετα καθήκοντα.
Στην πράξη, αυτό σημαίνει πως οι προγραμματιστές μπορούν να ορίσουν έναν «προϋπολογισμό σκέψης» που ελέγχει το πόση συλλογιστική θα εκτελέσει το μοντέλο. Μπορούν να ρυθμίσουν «τον αριθμό των tokens που μπορεί να παράγει το μοντέλο κατά τη σκέψη» από 0 έως 24.576 tokens μέσω ενός slider στο Google AI Studio και το Vertex AI ή μέσω παραμέτρου στο API. Όταν ο προϋπολογισμός σκέψης είναι μηδενικός, το μοντέλο ταιριάζει σε κόστος και καθυστέρηση με το Gemini 2.0 Flash.
Η τιμολόγηση αντικατοπτρίζει αυτή την ευελιξία, με τα tokens εισόδου να κοστίζουν 15 σεντς ανά εκατομμύριο και τα tokens εξόδου 60 σεντς ανά εκατομμύριο χωρίς συλλογιστική. Με ενεργοποιημένες τις δυνατότητες σκέψης, το κόστος αυξάνεται στα $3,50 ανά εκατομμύριο tokens.
Τα αποτελέσματα των δοκιμών είναι εντυπωσιακά. Το Gemini 2.5 Flash «αποδίδει εξαιρετικά σε Hard Prompts στο LMArena, δεύτερο μόνο μετά το 2.5 Pro» και «έχει συγκρίσιμες μετρήσεις με άλλα κορυφαία μοντέλα με ένα κλάσμα του κόστους και του μεγέθους», συνεχίζοντας «να ηγείται ως το μοντέλο με την καλύτερη αναλογία τιμής-απόδοσης».
Η Google περιγράφει το 2.5 Flash ως το «πιο αποδοτικό μοντέλο-εργάτη της, σχεδιασμένο για ταχύτητα και χαμηλό κόστος», σημειώνοντας ότι «έχει βελτιωθεί σε βασικά benchmarks για συλλογιστική, πολυτροπικότητα, κώδικα και μεγάλο context, ενώ γίνεται ακόμη πιο αποδοτικό, χρησιμοποιώντας 20-30% λιγότερα tokens» στις αξιολογήσεις.
Το νέο μοντέλο είναι προς το παρόν διαθέσιμο σε δοκιμαστική έκδοση μέσω πολλαπλών καναλιών. Ξεκινά «στο Google AI Studio (για προγραμματιστές), το Vertex AI (για επιχειρήσεις) και την εφαρμογή Gemini (για όλους)». Σύμφωνα με τις ανακοινώσεις της Google στο I/O 2025, η ανανεωμένη έκδοση θα είναι «γενικά διαθέσιμη στο Google AI Studio για προγραμματιστές και στο Vertex AI για επιχειρήσεις στις αρχές Ιουνίου», με το Gemini 2.5 Pro να ακολουθεί «σύντομα μετά».
Καθώς η Google συνεχίζει να επεκτείνει τις δυνατότητες της τεχνητής νοημοσύνης της, το Gemini 2.5 Flash αντιπροσωπεύει ένα σημαντικό βήμα προς τα εμπρός, καθιστώντας την προηγμένη συλλογιστική πιο προσβάσιμη και οικονομικά αποδοτική τόσο για προγραμματιστές όσο και για χρήστες.