Americká kocovina ze startupu DeepSeek

DeepSeek se objevil na scéně AI jako zářivá kometa a jeho příchod je v AI komunitě široce diskutován. Vzhledem k rozvinutému čínskému AI ekosystému však existence společností jako DeepSeek není překvapením. Čínské firmy totiž nejen napodobují západní technologie, ale přirozeně umí i přijít s vlastními inovacemi.
Navzdory výraznému nástupu DeepSeek mám pocit, že Čína byla více překvapena příchodem ChatGPT od OpenAI před více než dvěma lety, než že by Amerika byla zaskočena modelem DeepSeek. Mnoho západních komentářů o DeepSeek se spíše snaží získat pozornost a „lajky" než poskytovat realistický pohled na situaci. DeepSeek dosahuje vynikajících výsledků v benchmarkových testech, ale tyto výsledky jsou v rámci očekávaného technologického pokroku. Nejvýraznějším úspěchem DeepSeek je optimalizace modelu pro běh na méně výkonném hardwaru.
Chaos, panika a bombastická prohlášení vedla mimo jiné k poklesu akcií společnosti Nvidia, která vyrábí čipy pro AI modely. Šlo však spíše o nervózní korekci než dramatický propad. Celá americká AI komunita upadla na chvíli do jakési kocoviny, ale je tato kocovina oprávněná? Načasování oznámení krátce po nástupu prezidenta Trumpa do úřadu bylo záměrné, protože výsledky modelu byly známé již od listopadu předchozího roku, a protože DeepSeek již splňuje požadavky čínské cenzury. Čína by neoznámila nic, co by nebylo v souladu s místními regulacemi, jejichž splnění vyžaduje určitý čas a komunikaci s úřady. Čína jednoduše chtěla ukázat, že exportní omezení pokročilých čipů do Číny nefungují, ale opak je pravdou.
V Číně platí, že čím menší společnosti (tedy méně viditelné) jsou, tím mají větší svobodu. Zatímco giganti jako Alibaba jsou přísně regulováni státem, menší firmy jako DeepSeek se mohou volně rozvíjet a rychle inovovat. DeepSeek si navíc zajistil kapitál samostatně a nespoléhal se na státní dotace. I když DeepSeek exceluje v optimalizaci, otázkou zůstává, jaké AI čipy a v jakém množství bude moci v budoucnu nakupovat. Restrikce Spojených států na prodej pokročilých AI čipů do Číny začaly až na podzim 2023. I když se předzásobíte, exportní omezení vás nakonec dostihnou. Nebude to okamžitě, protože restrikce se projeví s určitým zpožděním.
Do určité míry můžete držet krok s konkurencí pomocí inovativních přístupů, které maximalizují využití dostupných zdrojů (DeepSeek sám přiznává čtyřnásobný výpočetní handicap oproti americké konkurenci). Nakonec vás však nedostatek nejlepších čipů dostihne. DeepSeek trénoval své modely na méně výkonných čipech Nvidia H800, které původní restrikce obešly. V současnosti může využívat jejich novější verzi Nvidia H20, která je stále dostupná pro export do Číny. Otázkou je, zda Spojené státy neomezí export i této verze.
Restrikce ovlivňují nejen nákup čipů, ale i přístup k výpočetní kapacitě v datových centrech v zahraničí. DeepSeek měl pravděpodobně na začátku přístup k většímu výpočetnímu výkonu, což umožnilo trénování a optimalizaci modelu. Přístup čínských firem k zahraniční výpočetní kapacitě začínají Spojené státy nově omezovat. Čína zatím není schopna vyrábět vlastní čipy, které by konkurovaly Nvidia, a postavit vlastní AI datová centra.
Postupem času se AI modely zlepšují a zlevňují. Stejně jako DeepSeek dokáže maximálně využít průměrný hardware, mohou velké firmy jako OpenAI maximálně využít nejvýkonnější hardware. A to se také stane. V dlouhodobém horizontu rozhodne, kdo má přístup k výkonnějšímu hardwaru. Je důležité si uvědomit, že model můžete natrénovat na omezeném hardwaru, ale pro škálování AI služeb pro celou Čínu potřebujete mnohem více výpočetního výkonu, ke kterému se kvůli restrikcím nedostanete.
Případ DeepSeek ukazuje, že velké jazykové modely (LLM) samy o sobě nepředstavují konkurenční výhodu. Konkurenční výhoda bude u těch, kteří zabudují AI do ekosystému aplikací, jak činí Microsoft u Office365, a začnou AI modely využívat v běžných činnostech, jako je hledání nových léků či materiálů. K tomu je samozřejmě potřeba značný výpočetní výkon.
Jestli zvítězí open source modely jako DeepSeek nebo privátní modely od OpenAI se rozhodne podle toho, zda budou zákazníci ochotni připlatit za výkon, bezpečnost a soukromí privátních modelů.
Ivo Procházka, odborník na digitální transformaci