menu
close

Kiinalainen tekoälyyritys DeepSeek kaventaa eroa länsimaisiin jättiläisiin

Kiinalainen tekoäly-startup DeepSeek on julkaissut päivitetyn R1-0528-mallinsa, jonka suorituskyky kilpailee OpenAI:n ja Googlen huippumallien kanssa. Malli osoittaa merkittäviä parannuksia matemaattisessa päättelyssä, ohjelmoinnissa ja loogisessa ajattelussa: tarkkuus AIME 2025 -matematiikkatestissä nousi 70 prosentista 87,5 prosenttiin. Kehitys heijastaa Stanfordin yliopiston AI Index 2025 -raportin havaintoja, joiden mukaan johtavien yhdysvaltalaisten ja kiinalaisten tekoälymallien välinen suorituskykyero on kaventunut huomattavasti vuoden aikana.
Kiinalainen tekoälyyritys DeepSeek kaventaa eroa länsimaisiin jättiläisiin

DeepSeek, kiinalainen tekoäly-startup, on vakiinnuttanut asemansa merkittävänä haastajana länsimaisten tekoälytoimijoiden hallinnalle tuoreimmalla R1-0528-mallipäivityksellään, jonka suorituskyky lähestyy alan johtajia OpenAI:ta ja Googlea.

Vaikka DeepSeek kuvaa päivitystä "pieneksi versiopäivitykseksi", se tuo mukanaan huomattavia parannuksia keskeisillä osa-alueilla. Matemaattisessa päättelyssä mallin tarkkuus haastavassa AIME 2025 -testissä nousi 70 prosentista 87,5 prosenttiin, mikä osoittaa kehittyneempiä ongelmanratkaisutaitoja. Tämä edistys perustuu mallin syvempään päättelykykyyn: se hyödyntää nyt noin 23 000 tokenia kyselyä kohden aiemman 12 000 sijaan.

Matematiikan lisäksi R1-0528 on saavuttanut merkittäviä harppauksia ohjelmointiosaamisessa. Codeforces-ohjelmointihaasteessa mallin pistemäärä nousi noin 1930:een aiemmasta 1530:sta – 400 pisteen parannus, joka kuvastaa parempaa koodin generointia ja ongelmanratkaisukykyä. Myös mallin suorituskyky laajoissa koodauskokeissa on parantunut merkittävästi.

Mallin kehitys on linjassa Stanfordin yliopiston AI Index 2025 -raportin kanssa, jossa dokumentoidaan, kuinka yhdysvaltalaisten ja kiinalaisten huippumallien välinen suorituskykyero on kaventunut dramaattisesti. Raportin mukaan johtavien amerikkalaisten ja kiinalaisten mallien välinen ero tärkeimmissä vertailuissa supistui kaksinumeroisista luvuista vuonna 2023 lähes tasoihin vuoden 2025 alkuun mennessä. Chatbot Arena Leaderboardilla ero kaventui 9,26 prosentista tammikuussa 2024 vain 1,70 prosenttiin helmikuussa 2025.

Alan johtajat ovat kiinnittäneet huomiota tähän muutokseen. Nvidian toimitusjohtaja Jensen Huang totesi toukokuussa: "DeepSeek ja [Alibaban] Qwen Kiinasta ovat parhaita vapaasti julkaistuja avoimen lähdekoodin tekoälymalleja. Ne ovat saavuttaneet suosiota Yhdysvalloissa, Euroopassa ja muualla."

DeepSeekin saavutus on erityisen merkittävä, sillä yritys lähti liikkeelle suhteellisen pienenä startupina. Malli on saatavilla sallivalla lisenssillä sekä täysversiona että kevyempänä "tislattuna" versiona, joka toimii vähemmän tehokkaalla laitteistolla – näin kehittynyt tekoälyteknologia on entistä laajemmin kehittäjien ulottuvilla maailmanlaajuisesti.

Source:

Latest News