DeepSeek wprowadził właśnie na rynek nowy system do analizy obrazów. Firma stworzyła trzy modele, różniące się mocą obliczeniową.
Najmniejszy Tiny z 1 miliardem parametrów, średni Small z 2,8 miliardami i największy VL2 z 4,5 miliardami. Co ciekawe, wszystkie bazują na systemie Mixture of Experts, który działa trochę jak grupa specjalistów – każdy zajmuje się tym, w czym jest najlepszy.
Na co dzień system potrafi robić naprawdę przydatne rzeczy. Wyobraźmy sobie, że mamy zdjęcie dokumentu – VL2 nie tylko przeczyta z niego tekst, ale też zrozumie tabele i wykresy. Albo jeśli zrobimy zdjęcie produktów w lodówce, system może zaproponować przepis wykorzystujący te składniki. Potrafi też porównywać różne zdjęcia i znajdować na nich podobne przedmioty.
Cały sekret sprawnego działania tkwi we wspomnianym systemie Mixture of Experts. To trochę jak praca zespołowa – zamiast zmuszać jeden procesor do robienia wszystkiego, zadania są rozdzielane między różne jednostki. Dzięki temu system nie tylko działa szybciej, ale też zużywa mniej energii.
Dobra wiadomość jest taka, że każdy może już wypróbować DeepSeek-VL2 za darmo na platformie Hugging Face. Co prawda nie wiemy jeszcze, kiedy system pojawi się w wersji chatbota, ale można się spodziewać, że nastąpi to już niedługo.
Takie systemy analizy obrazów znajdują coraz więcej zastosowań. W sklepach internetowych mogą pomóc w wyszukiwaniu podobnych produktów, w biurach przyspieszą digitalizację dokumentów, a w przemyśle wspomogą kontrolę jakości. Warto zajrzeć na Hugging Face i samemu przekonać się, jak system radzi sobie w praktyce.