Η Meta Platforms ανακοίνωσε επίσημα την κυκλοφορία του LLaMA 4, της πιο εξελιγμένης οικογένειας μοντέλων τεχνητής νοημοσύνης μέχρι σήμερα, σηματοδοτώντας ένα σημαντικό άλμα προς τα εμπρός στην τεχνολογία φωνητικά υποστηριζόμενης τεχνητής νοημοσύνης.
Το LLaMA 4, που κυκλοφόρησε τον Απρίλιο του 2025, εισάγει δύο βασικά μοντέλα: το Scout και το Maverick, ενώ ένα τρίτο, ακόμη πιο ισχυρό μοντέλο με την ονομασία Behemoth βρίσκεται υπό ανάπτυξη. Τα μοντέλα αυτά χρησιμοποιούν αρχιτεκτονική mixture-of-experts, επιτρέποντάς τους να επεξεργάζονται και να ενσωματώνουν διάφορους τύπους δεδομένων, όπως κείμενο, εικόνες, ήχο και βίντεο, ενώ υποστηρίζουν και πολλές γλώσσες.
Αυτό που ξεχωρίζει το LLaMA 4 είναι οι προηγμένες φωνητικές του δυνατότητες. Ο επικεφαλής προϊόντων της Meta, Chris Cox, το περιέγραψε ως ένα «omni μοντέλο» που ερμηνεύει και παράγει φωνή εγγενώς, αντί να μετατρέπει απλώς τη φωνή σε κείμενο. Το σύστημα επιτρέπει φυσικές, αβίαστες συνομιλίες, όπου οι χρήστες μπορούν ακόμη και να διακόψουν την τεχνητή νοημοσύνη εν μέσω ομιλίας – παρόμοια με την ανθρώπινη αλληλεπίδραση. Αυτή η τεχνολογία φωνητικής επικοινωνίας πλήρους διπλής κατεύθυνσης επιτρέπει στην τεχνητή νοημοσύνη να παράγει φωνή απευθείας, αντί να διαβάζει απλώς κείμενο δυνατά.
Οι επιχειρηματικές προεκτάσεις είναι σημαντικές. Η Meta στοχεύει σε εφαρμογές εξυπηρέτησης πελατών, όπου το LLaMA 4 μπορεί να διαχειριστεί συνομιλίες με πελάτες, να παρέχει υποστήριξη και να διεκπεραιώνει συναλλαγές. Η εταιρεία ήδη δοκιμάζει πράκτορες τεχνητής νοημοσύνης για επιχειρήσεις που βασίζονται στην τεχνολογία αυτή. Επιπλέον, το Meta AI – ο βοηθός που απευθύνεται σε καταναλωτές και βασίζεται στο LLaMA 4 – έχει προσελκύσει 600 εκατομμύρια μηνιαίους χρήστες παγκοσμίως, παρά το γεγονός ότι δεν είναι διαθέσιμο στην Ευρωπαϊκή Ένωση λόγω κανονιστικών ανησυχιών.
Η επένδυση της Meta στην τεχνητή νοημοσύνη είναι τεράστια, με τον CEO Mark Zuckerberg να ανακοινώνει σχέδια για δαπάνες έως και 65 δισεκατομμυρίων δολαρίων το 2025 για την ενίσχυση των προσφορών της στον τομέα της τεχνητής νοημοσύνης. Αυτή η προσπάθεια έρχεται καθώς η Meta ανταγωνίζεται άλλους τεχνολογικούς κολοσσούς όπως οι OpenAI, Microsoft και Google στη μάχη για την εμπορευματοποίηση της τεχνητής νοημοσύνης.
Η κυκλοφορία του LLaMA 4 αντιπροσωπεύει το όραμα της Meta για το μέλλον της αλληλεπίδρασης με την τεχνητή νοημοσύνη. Καθώς τα γλωσσικά μοντέλα γίνονται πιο διαλογικά, η εταιρεία αναμένει ότι οι χρήστες θα μεταβούν από την πληκτρολόγηση στη φωνητική επικοινωνία με τους βοηθούς τεχνητής νοημοσύνης. Η Meta έχει ήδη λανσάρει μια αυτόνομη εφαρμογή Meta AI σχεδιασμένη γύρω από φωνητικές συνομιλίες, η οποία είναι προς το παρόν διαθέσιμη στις ΗΠΑ, τον Καναδά, την Αυστραλία και τη Νέα Ζηλανδία, με σχέδια για παγκόσμια επέκταση.