Giganti umelej inteligencie sa sporia o stratégie riadenia existenčných rizík

Popredné spoločnosti v oblasti umelej inteligencie volia odlišné prístupy k riadeniu existenčných rizík, ktoré predstavujú pokročilé AI systémy. Anthropic presadzuje plánovanie najhorších scenárov, zatiaľ čo OpenAI kladie dôraz na transparentnosť prostredníctvom nového centra Safety Evaluations Hub. Google DeepMind zvolil metodickejší, postupný prístup so svojím komplexným rámcom Frontier Safety Framework. Tieto strategické rozdiely zdôrazňujú napätie medzi rýchlym rozvojom AI a zavádzaním robustných bezpečnostných opatrení.

Odvetvie umelej inteligencie je svedkom výrazného rozdelenia medzi poprednými spoločnosťami v otázke, ako riešiť potenciálne existenčné riziká vyplývajúce zo stále výkonnejších AI systémov.

Anthropic, ktorého hodnota dosahuje 61 miliárd dolárov a je podporovaný Amazonom, sa profiluje ako najopatrnejší hráč a neustále varuje pred tým, že schopnosti AI môžu prekonať bezpečnostné opatrenia. Generálny riaditeľ Dario Amodei je obzvlášť hlasný v potrebe plánovať najhoršie možné scenáre a nedávno vyhlásil, že modely čoskoro „budú lepšie ako my takmer vo všetkom“. Politika zodpovedného škálovania spoločnosti zahŕňa zvýšené fyzické bezpečnostné opatrenia, ako sú kontroly kancelárií na skryté zariadenia, či zriadenie výkonného rizikového výboru na hodnotenie výkonných modelov pred ich nasadením.

OpenAI, ktorého hodnota nedávno dosiahla 300 miliárd dolárov, zvolil odlišný prístup a zdôrazňuje iniciatívy v oblasti transparentnosti. V máji 2025 spoločnosť spustila Safety Evaluations Hub – webovú platformu, ktorá zobrazuje, ako jej modely skórujú v rôznych bezpečnostných testoch na generovanie škodlivého obsahu, obchádzanie obmedzení (tzv. jailbreaks) a halucinácie. OpenAI sľúbil pravidelne aktualizovať tieto metriky pri každom väčšom vydaní modelu. Nedávne úpravy v Preparedness Framework však vyvolali obavy, keďže spoločnosť naznačila, že by mohla „prispôsobiť“ bezpečnostné požiadavky, ak by konkurenti uviedli na trh vysoko rizikové systémy bez podobných ochranných opatrení.

Google DeepMind zvolil pravdepodobne najmetodickejší prístup a v apríli 2025 zverejnil komplexný 145-stranový dokument o bezpečnosti AGI. Rámec Frontier Safety Framework rozdeľuje riziká AI do štyroch oblastí: zneužitie, nesúlad, nehody a štrukturálne riziká. Stratégia DeepMind kladie dôraz na postupný pokrok s dôkladným tréningom, monitorovaním a bezpečnostnými protokolmi. Spoločnosť zriadila AGI Safety Council pod vedením spoluzakladateľa Shanea Legga a spolupracuje s neziskovými organizáciami zameranými na výskum bezpečnosti AI, ako sú Apollo a Redwood Research.

Tieto rozdielne stratégie odrážajú základné napätie v AI odvetví medzi rýchlym rozvojom schopností a zavádzaním robustných bezpečnostných opatrení. Keď sa AI systémy približujú k ľudskej úrovni výkonnosti v rôznych oblastiach, potreba jednotného, naprieč odvetvím platného bezpečnostného konzorcia podporeného transparentnými štandardmi je čoraz zreteľnejšia.

Odborníci varujú, že bez koordinovaných bezpečnostných štandardov by konkurenčný tlak na rýchle nasadenie pokročilých modelov mohol viesť spoločnosti k ústupkom v oblasti bezpečnosti. Ako poznamenal Jack Clark z Anthropic, odvetvie potrebuje silnejšie mechanizmy „na identifikáciu a zmierňovanie rizík, aby sa podporil zodpovedný rozvoj AI“ ešte pred tým, než budú tieto výkonné systémy široko nasadené.

Source:

Giganti umelej inteligencie sa sporia o stratégie riadenia existenčných rizík

Latest News

NVIDIA a Deutsche Telekom spúšťajú prvý priemyselný AI cloud v Európe

Prelom v navigácii podľa vtákov mení autonómny let dronov

OpenAI využíva Google Cloud napriek ostrej rivalite v oblasti AI

OpenAI dosiahol míľnik 10 miliárd dolárov v tržbách uprostred masívnych investícií do AI infraštruktúry

Meta nahrádza tisíce ľudských moderátorov systémami umelej inteligencie

OpenAI o3-mini zrýchľuje a zefektívňuje AI uvažovanie

Meta vsádza na umelú inteligenciu: Investuje 65 miliárd dolárov v roku 2025

Meta vsádza 14,3 miliardy dolárov na Scale AI v zásadnom otrasení AI priemyslu

Apple rozširuje AI funkcie naprieč celým ekosystémom zariadení

Giganti umelej inteligencie sa sporia o stratégie riadenia existenčných rizík

Related Articles

NVIDIA a Deutsche Telekom spúšťajú prvý priemyselný AI cloud v Európe

Meta nahrádza tisíce ľudských moderátorov systémami umelej inteligencie

OpenAI dosiahol míľnik 10 miliárd dolárov v tržbách uprostred masívnych investícií do AI infraštruktúry

Meta vsádza na umelú inteligenciu: Investuje 65 miliárd dolárov v roku 2025

Latest News

NVIDIA a Deutsche Telekom spúšťajú prvý priemyselný AI cloud v Európe

Prelom v navigácii podľa vtákov mení autonómny let dronov

OpenAI využíva Google Cloud napriek ostrej rivalite v oblasti AI

OpenAI dosiahol míľnik 10 miliárd dolárov v tržbách uprostred masívnych investícií do AI infraštruktúry

Meta nahrádza tisíce ľudských moderátorov systémami umelej inteligencie

OpenAI o3-mini zrýchľuje a zefektívňuje AI uvažovanie

Meta vsádza na umelú inteligenciu: Investuje 65 miliárd dolárov v roku 2025

Meta vsádza 14,3 miliardy dolárov na Scale AI v zásadnom otrasení AI priemyslu

Apple rozširuje AI funkcie naprieč celým ekosystémom zariadení