Chińska firma DeepSeek wstrząsnęła światem technologii swoim modelem AI o nazwie R1. Szczególnie ciekawe jest to, jak uczą swój system – robią to inaczej niż giganci z Doliny Krzemowej.
Kto w ogóle stoi za DeepSeek? Firma wystartowała w 2023 roku. Założył ją Liang Wenfeng, który wcześniej rozkręcił fundusz inwestycyjny High-Flyer. Od początku postawili na różnorodność – do zespołu dołączyli młodzi naukowcy z wielu dziedzin, nie tylko informatycy.
Musieli radzić sobie z przeszkodami. USA zablokowało Chinom dostęp do najlepszych procesorów graficznych, więc DeepSeek poszedł inną drogą. Zamiast kupować topowy sprzęt, skupili się na ulepszaniu swoich programów.
I udało się. Model R1 nauczył się wszystkiego w dwa miesiące, używając 2048 procesorów NVIDIA H800. Koszt? Mniej niż 6 milionów dolarów – to znacznie taniej niż wydatki amerykańskiej konkurencji. Niektórzy wątpią w te liczby, ale firma pokazała dokumentację ze szczegółami technicznymi.
Jak uczą swój system?
Zwykle modele AI uczą się w trzech krokach:
- Poznają podstawy – czytają mnóstwo tekstów i uczą się przewidywać kolejne słowa.
- Dopracowują szczegóły – uczą się lepiej rozumieć pytania.
- Dostają informację zwrotną – poprawiają się na podstawie ocen od ludzi lub innych systemów.
DeepSeek zrezygnował z drugiego kroku i wymyślił własną metodę – GRPO (Group Relative Policy Optimization). To alternatywa dla powszechnie używanego PPO (Proximal Policy Optimization). GRPO działa prościej – nie potrzebuje skomplikowanych funkcji wartościujących ani dodatkowych sieci neuronowych. Dzięki temu cały proces jest tańszy i zużywa mniej zasobów komputera.
Sprytne zarządzanie mocą
DeepSeek wprowadził też nowość w zarządzaniu mocą obliczeniową podczas pracy systemu. Zamiast dokładnie ustawiać parametry po zakończeniu nauki, system dostosowuje się na bieżąco. To jak inteligentne zarządzanie energią w smartfonie – używa tyle mocy, ile naprawdę potrzebuje w danym momencie. Dzięki temu jest bardziej ekonomiczny.
Co to znaczy dla branży AI?
DeepSeek pokazał, że można tworzyć skuteczną sztuczną inteligencję taniej niż dotychczas. Może się okazać, że kluczem do rozwoju AI jest nie tyle kupowanie coraz mocniejszych komputerów, co mądrzejsze pisanie programów.
Amerykańskie firmy od lat inwestują ogromne pieniądze w rozwój AI. Teraz Chińczycy udowodnili, że można osiągnąć podobne wyniki inną drogą. Ciekawe, jak zareagują na to liderzy rynku. Link do aplikacji DeepSeek na iOS – tutaj.
A co wy sądzicie o DeepSeek? Korzystacie z tego narzędzia? Koniecznie dajcie znać w komentarzach.