Η Google Επεκτείνει το Χαρτοφυλάκιο Τεχνητής Νοημοσύνης με τα Gemini 2.5 και Imagen 4

Η Google ενίσχυσε τις προσφορές της στην τεχνητή νοημοσύνη διαθέτοντας γενικά τα Gemini 2.5 Flash και Pro, ενώ παρουσίασε και το οικονομικό μοντέλο Flash-Lite. Η εταιρεία κυκλοφόρησε επίσης το Imagen 4, το πιο προηγμένο μοντέλο μετατροπής κειμένου σε εικόνα μέχρι σήμερα, με σημαντικά βελτιωμένες δυνατότητες απόδοσης κειμένου. Αυτές οι κυκλοφορίες συμπληρώνονται από το λανσάρισμα του Gemini CLI, ενός εργαλείου ανοιχτού κώδικα που φέρνει την τεχνητή νοημοσύνη απευθείας στα τερματικά των προγραμματιστών για κωδικοποίηση και επίλυση προβλημάτων.

Η Google διεύρυνε σημαντικά το οικοσύστημα τεχνητής νοημοσύνης της με αρκετές σημαντικές κυκλοφορίες, τοποθετώντας τον εαυτό της στην αιχμή της τεχνολογίας γενετικής τεχνητής νοημοσύνης.

Η οικογένεια Gemini 2.5 επεκτάθηκε με τα μοντέλα Flash και Pro, τα οποία είναι πλέον γενικά διαθέσιμα για παραγωγική χρήση. Τα Gemini 2.5 Flash και Pro είναι πλέον σταθερά και γενικά διαθέσιμα, επιτρέποντας στους προγραμματιστές να δημιουργούν εφαρμογές παραγωγής με σιγουριά. Εταιρείες όπως οι Spline, Rooms, Snap και SmartBear χρησιμοποιούν ήδη αυτές τις εκδόσεις σε παραγωγικό περιβάλλον εδώ και αρκετές εβδομάδες. Η ανάπτυξη και η ζήτηση για το Gemini 2.5 Pro ήταν η ταχύτερη από κάθε άλλο μοντέλο της Google μέχρι σήμερα, οδηγώντας την εταιρεία να καταστήσει τη έκδοση 06-05 σταθερή διατηρώντας παράλληλα την ίδια τιμή. Η Google αναμένει ότι το Pro θα διαπρέψει σε σενάρια που απαιτούν τη μέγιστη νοημοσύνη και δυνατότητες, όπως η κωδικοποίηση και οι εργασίες πρακτόρων.

Επιπλέον, η Google παρουσίασε το Gemini 2.5 Flash-Lite σε προεπισκόπηση, το πιο οικονομικό και ταχύτερο μοντέλο 2.5 μέχρι σήμερα. Αυτή η νέα προσθήκη σχεδιάστηκε ως μια οικονομική επιλογή για εργασίες υψηλού όγκου όπως η ταξινόμηση ή η σύνοψη σε μεγάλη κλίμακα, προσφέροντας καλύτερη απόδοση στις περισσότερες αξιολογήσεις και μικρότερο χρόνο μέχρι το πρώτο token, ενώ επιτυγχάνει υψηλότερη ταχύτητα αποκωδικοποίησης tokens ανά δευτερόλεπτο. Το Flash-Lite είναι ένα μοντέλο λογικής που επιτρέπει τον δυναμικό έλεγχο του "προϋπολογισμού σκέψης" μέσω μιας παραμέτρου API. Σε αντίθεση με άλλα μοντέλα της οικογένειας, η σκέψη είναι απενεργοποιημένη εξ ορισμού, καθώς το Flash-Lite είναι βελτιστοποιημένο για κόστος και ταχύτητα. Παρά τη βελτιστοποίηση αυτή, υποστηρίζει όλα τα εγγενή εργαλεία, συμπεριλαμβανομένων των Grounding με Google Search, Εκτέλεση Κώδικα, URL Context και κλήση λειτουργιών.

Στον τομέα της δημιουργίας εικόνων, η Google κυκλοφόρησε το Imagen 4, το οποίο ανακοινώθηκε για πρώτη φορά στο I/O 2025 τον περασμένο μήνα. Η Google το περιγράφει ως το "καλύτερο μοντέλο μετατροπής κειμένου σε εικόνα μέχρι σήμερα", με "σημαντικά βελτιωμένη απόδοση κειμένου" σε σχέση με προηγούμενα μοντέλα. Το νέο μοντέλο προσφέρει εντυπωσιακή καθαρότητα σε λεπτομέρειες όπως περίπλοκα υφάσματα, σταγόνες νερού και τρίχωμα ζώων, και διαπρέπει τόσο σε φωτορεαλιστικά όσο και σε αφηρημένα στυλ. Άλλες βελτιώσεις περιλαμβάνουν υποστήριξη ανάλυσης 2K και καλύτερη ορθογραφία και τυπογραφία. Το Imagen 4 και μια premium έκδοση Imagen 4 Ultra είναι πλέον διαθέσιμα σε χρήστες επί πληρωμή σε προεπισκόπηση μέσω του Gemini API, με περιορισμένη δωρεάν δοκιμή στο Google AI Studio. Το Imagen 4 κοστίζει $0,04 ανά παραγόμενη εικόνα, ενώ η έκδοση Ultra κοστίζει $0,06 ανά εικόνα.

Συμπληρωματικά με αυτές τις κυκλοφορίες, το Gemini CLI αποτελεί έναν ανοιχτού κώδικα πράκτορα τεχνητής νοημοσύνης που φέρνει τη δύναμη του Gemini απευθείας στα τερματικά των προγραμματιστών για κωδικοποίηση, επίλυση προβλημάτων και διαχείριση εργασιών. Οι χρήστες μπορούν να έχουν πρόσβαση στο Gemini 2.5 Pro δωρεάν με έναν προσωπικό λογαριασμό Google ή να χρησιμοποιήσουν κλειδιά Google AI Studio ή Vertex AI για διευρυμένη πρόσβαση. Το Gemini CLI προσφέρει το μεγαλύτερο όριο χρήσης στη βιομηχανία, με 60 αιτήματα μοντέλου ανά λεπτό και 1.000 αιτήματα μοντέλου ανά ημέρα δωρεάν. Παρέχει ισχυρές δυνατότητες τεχνητής νοημοσύνης, από κατανόηση κώδικα και διαχείριση αρχείων έως εκτέλεση εντολών και δυναμική επίλυση προβλημάτων, προσφέροντας μια θεμελιώδη αναβάθμιση στην εμπειρία γραμμής εντολών και επιτρέποντας στους χρήστες να γράφουν κώδικα, να εντοπίζουν σφάλματα και να βελτιστοποιούν τις ροές εργασίας με φυσική γλώσσα.

Συνολικά, αυτές οι κυκλοφορίες ενισχύουν τη θέση της Google στο ανταγωνιστικό τοπίο της τεχνητής νοημοσύνης, παρέχοντας σε προγραμματιστές και χρήστες πιο ισχυρά, αποδοτικά και προσβάσιμα εργαλεία για ένα ευρύ φάσμα εφαρμογών.

Source:

Η Google Επεκτείνει το Χαρτοφυλάκιο Τεχνητής Νοημοσύνης με τα Gemini 2.5 και Imagen 4

Latest News

Η Κβαντική Υπολογιστική Επιτυγχάνει Ιστορική Άνευ Όρων Επιτάχυνση

Η OpenAI Απορρίπτει τα Μη Εξουσιοδοτημένα Tokenized Μερίδια της Robinhood

Η Microsoft Απολύει 9.000 Εργαζόμενους Ενώ Διπλασιάζει τις Επενδύσεις στην Τεχνητή Νοημοσύνη

Η Meta Εκκινεί Φιλόδοξο Εγχείρημα AI με Επένδυση $14 Δισ. και Μαζική Προσέλκυση Ταλέντων από Ανταγωνιστές

Η Google και η Pearson Ενώνουν Δυνάμεις για να Μεταμορφώσουν τη Σχολική Εκπαίδευση με Τεχνητή Νοημοσύνη

Gartner: Το 40% των Έργων Agentic AI Καταδικασμένο να Αποτύχει έως το 2027

Η OpenAI Καθυστερεί το Ανοιχτού Κώδικα Μοντέλο της Εν μέσω Εντεινόμενου Ανταγωνισμού στην Τεχνητή Νοημοσύνη

Η Τεχνητή Νοημοσύνη Οδηγεί σε Ρεκόρ Εξάρθρωσης Απάτης Υγείας Υψους $14,6 Δισ.

Το OpenTools.AI Λανσάρει το Daily AI Digest για Επαγγελματίες του Κλάδου

Τα Drones Τεχνητής Νοημοσύνης της Helsing Μεταμορφώνουν τη Στρατηγική Άμυνας της Ουκρανίας

Η Google Επεκτείνει το Χαρτοφυλάκιο Τεχνητής Νοημοσύνης με τα Gemini 2.5 και Imagen 4

Related Articles

Η OpenAI Καθυστερεί το Ανοιχτού Κώδικα Μοντέλο της Εν μέσω Εντεινόμενου Ανταγωνισμού στην Τεχνητή Νοημοσύνη

Η Meta Εκκινεί Φιλόδοξο Εγχείρημα AI με Επένδυση $14 Δισ. και Μαζική Προσέλκυση Ταλέντων από Ανταγωνιστές

Gartner: Το 40% των Έργων Agentic AI Καταδικασμένο να Αποτύχει έως το 2027

Η Google Παρουσιάζει τη Λειτουργία AI με Διαδραστικό Doodle

Η Google Παρουσιάζει το Gemma 3n: Ισχυρή Πολυτροπική Τεχνητή Νοημοσύνη για Κινητές Συσκευές

Latest News

Η Κβαντική Υπολογιστική Επιτυγχάνει Ιστορική Άνευ Όρων Επιτάχυνση

Η OpenAI Απορρίπτει τα Μη Εξουσιοδοτημένα Tokenized Μερίδια της Robinhood

Η Microsoft Απολύει 9.000 Εργαζόμενους Ενώ Διπλασιάζει τις Επενδύσεις στην Τεχνητή Νοημοσύνη

Η Meta Εκκινεί Φιλόδοξο Εγχείρημα AI με Επένδυση $14 Δισ. και Μαζική Προσέλκυση Ταλέντων από Ανταγωνιστές

Η Google και η Pearson Ενώνουν Δυνάμεις για να Μεταμορφώσουν τη Σχολική Εκπαίδευση με Τεχνητή Νοημοσύνη

Gartner: Το 40% των Έργων Agentic AI Καταδικασμένο να Αποτύχει έως το 2027

Η OpenAI Καθυστερεί το Ανοιχτού Κώδικα Μοντέλο της Εν μέσω Εντεινόμενου Ανταγωνισμού στην Τεχνητή Νοημοσύνη

Η Τεχνητή Νοημοσύνη Οδηγεί σε Ρεκόρ Εξάρθρωσης Απάτης Υγείας Υψους $14,6 Δισ.

Το OpenTools.AI Λανσάρει το Daily AI Digest για Επαγγελματίες του Κλάδου

Τα Drones Τεχνητής Νοημοσύνης της Helsing Μεταμορφώνουν τη Στρατηγική Άμυνας της Ουκρανίας