Η Google διεύρυνε σημαντικά το οικοσύστημα τεχνητής νοημοσύνης της με αρκετές σημαντικές κυκλοφορίες, τοποθετώντας τον εαυτό της στην αιχμή της τεχνολογίας γενετικής τεχνητής νοημοσύνης.
Η οικογένεια Gemini 2.5 επεκτάθηκε με τα μοντέλα Flash και Pro, τα οποία είναι πλέον γενικά διαθέσιμα για παραγωγική χρήση. Τα Gemini 2.5 Flash και Pro είναι πλέον σταθερά και γενικά διαθέσιμα, επιτρέποντας στους προγραμματιστές να δημιουργούν εφαρμογές παραγωγής με σιγουριά. Εταιρείες όπως οι Spline, Rooms, Snap και SmartBear χρησιμοποιούν ήδη αυτές τις εκδόσεις σε παραγωγικό περιβάλλον εδώ και αρκετές εβδομάδες. Η ανάπτυξη και η ζήτηση για το Gemini 2.5 Pro ήταν η ταχύτερη από κάθε άλλο μοντέλο της Google μέχρι σήμερα, οδηγώντας την εταιρεία να καταστήσει τη έκδοση 06-05 σταθερή διατηρώντας παράλληλα την ίδια τιμή. Η Google αναμένει ότι το Pro θα διαπρέψει σε σενάρια που απαιτούν τη μέγιστη νοημοσύνη και δυνατότητες, όπως η κωδικοποίηση και οι εργασίες πρακτόρων.
Επιπλέον, η Google παρουσίασε το Gemini 2.5 Flash-Lite σε προεπισκόπηση, το πιο οικονομικό και ταχύτερο μοντέλο 2.5 μέχρι σήμερα. Αυτή η νέα προσθήκη σχεδιάστηκε ως μια οικονομική επιλογή για εργασίες υψηλού όγκου όπως η ταξινόμηση ή η σύνοψη σε μεγάλη κλίμακα, προσφέροντας καλύτερη απόδοση στις περισσότερες αξιολογήσεις και μικρότερο χρόνο μέχρι το πρώτο token, ενώ επιτυγχάνει υψηλότερη ταχύτητα αποκωδικοποίησης tokens ανά δευτερόλεπτο. Το Flash-Lite είναι ένα μοντέλο λογικής που επιτρέπει τον δυναμικό έλεγχο του "προϋπολογισμού σκέψης" μέσω μιας παραμέτρου API. Σε αντίθεση με άλλα μοντέλα της οικογένειας, η σκέψη είναι απενεργοποιημένη εξ ορισμού, καθώς το Flash-Lite είναι βελτιστοποιημένο για κόστος και ταχύτητα. Παρά τη βελτιστοποίηση αυτή, υποστηρίζει όλα τα εγγενή εργαλεία, συμπεριλαμβανομένων των Grounding με Google Search, Εκτέλεση Κώδικα, URL Context και κλήση λειτουργιών.
Στον τομέα της δημιουργίας εικόνων, η Google κυκλοφόρησε το Imagen 4, το οποίο ανακοινώθηκε για πρώτη φορά στο I/O 2025 τον περασμένο μήνα. Η Google το περιγράφει ως το "καλύτερο μοντέλο μετατροπής κειμένου σε εικόνα μέχρι σήμερα", με "σημαντικά βελτιωμένη απόδοση κειμένου" σε σχέση με προηγούμενα μοντέλα. Το νέο μοντέλο προσφέρει εντυπωσιακή καθαρότητα σε λεπτομέρειες όπως περίπλοκα υφάσματα, σταγόνες νερού και τρίχωμα ζώων, και διαπρέπει τόσο σε φωτορεαλιστικά όσο και σε αφηρημένα στυλ. Άλλες βελτιώσεις περιλαμβάνουν υποστήριξη ανάλυσης 2K και καλύτερη ορθογραφία και τυπογραφία. Το Imagen 4 και μια premium έκδοση Imagen 4 Ultra είναι πλέον διαθέσιμα σε χρήστες επί πληρωμή σε προεπισκόπηση μέσω του Gemini API, με περιορισμένη δωρεάν δοκιμή στο Google AI Studio. Το Imagen 4 κοστίζει $0,04 ανά παραγόμενη εικόνα, ενώ η έκδοση Ultra κοστίζει $0,06 ανά εικόνα.
Συμπληρωματικά με αυτές τις κυκλοφορίες, το Gemini CLI αποτελεί έναν ανοιχτού κώδικα πράκτορα τεχνητής νοημοσύνης που φέρνει τη δύναμη του Gemini απευθείας στα τερματικά των προγραμματιστών για κωδικοποίηση, επίλυση προβλημάτων και διαχείριση εργασιών. Οι χρήστες μπορούν να έχουν πρόσβαση στο Gemini 2.5 Pro δωρεάν με έναν προσωπικό λογαριασμό Google ή να χρησιμοποιήσουν κλειδιά Google AI Studio ή Vertex AI για διευρυμένη πρόσβαση. Το Gemini CLI προσφέρει το μεγαλύτερο όριο χρήσης στη βιομηχανία, με 60 αιτήματα μοντέλου ανά λεπτό και 1.000 αιτήματα μοντέλου ανά ημέρα δωρεάν. Παρέχει ισχυρές δυνατότητες τεχνητής νοημοσύνης, από κατανόηση κώδικα και διαχείριση αρχείων έως εκτέλεση εντολών και δυναμική επίλυση προβλημάτων, προσφέροντας μια θεμελιώδη αναβάθμιση στην εμπειρία γραμμής εντολών και επιτρέποντας στους χρήστες να γράφουν κώδικα, να εντοπίζουν σφάλματα και να βελτιστοποιούν τις ροές εργασίας με φυσική γλώσσα.
Συνολικά, αυτές οι κυκλοφορίες ενισχύουν τη θέση της Google στο ανταγωνιστικό τοπίο της τεχνητής νοημοσύνης, παρέχοντας σε προγραμματιστές και χρήστες πιο ισχυρά, αποδοτικά και προσβάσιμα εργαλεία για ένα ευρύ φάσμα εφαρμογών.