Kiinalainen teknologiayhtiö Baidu on tehnyt merkittävän strategiamuutoksen avaamalla ERNIE 4.5 -malliperheensä lähdekoodin Apache 2.0 -lisenssillä. Tämä mahdollistaa kehittäjille ympäri maailmaa tekoälysovellusten rakentamisen ilman korkeita kustannuksia tai toimittajalukkoa.
Laaja julkaisu tuli saataville 30. kesäkuuta 2025 ja sisältää kymmenen erilaista mallivariaatiota. Mallit vaihtelevat kevyistä 0,3 miljardin parametrin tiheistä malleista tehokkaisiin Mixture-of-Experts (MoE) -arkkitehtuureihin, joissa on jopa 47 miljardia aktiivista parametria ja yhteensä 424 miljardia parametria. Baidu on julkaissut myös kehittäjätyökaluja, kuten ERNIEKitin koulutukseen ja hienosäätöön sekä FastDeployn tehokkaaseen käyttöönottoon eri laitealustoilla.
ERNIE 4.5 hyödyntää uutta heterogeenistä MoE-arkkitehtuuria, jossa tekstin ja kuvan asiantuntijat on eroteltu, mutta niiden välillä jaetaan tietoa. Tämä lähestymistapa parantaa multimodaalista ymmärrystä heikentämättä tekstitehtävien suorituskykyä. Baidun vertailujen mukaan ERNIE-4.5-300B-A47B-Base päihittää DeepSeek-V3-671B-A37B-Base -mallin 22:lla 28:sta benchmarkista, osoittaen vahvuuksia ohjeiden seuraamisessa, maailmantiedossa, visuaalisessa ymmärryksessä ja multimodaalisessa päättelyssä.
Alan analyytikot pitävät julkaisua merkittävänä kehityksenä globaalissa tekoälykentässä. "Joka kerta kun suuri laboratorio avaa tehokkaan mallin lähdekoodin, se nostaa koko alan tasoa", toteaa Sean Ren Etelä-Kalifornian yliopistosta. Tämä liike lisää painetta suljetun lähdekoodin tarjoajille, kuten OpenAI ja Anthropic, perustella rajatut rajapintansa ja korkeat hintamallinsa. OpenAI:n toimitusjohtaja Sam Altman on jo tunnustanut muutoksen ja vihjannut avoimen lähdekoodin julkaisusta tulevaisuudessa.
Vaikka ERNIE 4.5 ei tällä hetkellä ohita OpenAI:n, Googlen tai DeepSeekin vakiintuneita malleja kokonaisvaltaisessa suorituskyvyssä, sen avoin lähdekoodi ja kilpailukykyiset ominaisuudet tekevät siitä houkuttelevan vaihtoehdon kehittäjille. Mallit ovat saatavilla useilla alustoilla, kuten GitHubissa, Hugging Facessa ja Baidu AI Studiossa, ja tukevat sekä PaddlePaddle- että PyTorch-painomuotoja.
Baidun strateginen suunnanmuutos seuraa DeepSeekin avoimen lähdekoodin mallien kansainvälistä menestystä aiemmin tänä vuonna, mikä käynnisti niin sanotun "DeepSeek-hetken" tekoälykehityksessä. Tämä avoimen lähdekoodin tekoälyyn suuntautuva trendi muovaa alan maisemaa, demokratisoi kehittyneen tekoälyn saatavuutta ja voi kiihdyttää innovaatiota maailmanlaajuisesti.