Przyszłość AI należy do modeli multimodalnych, które potrafią analizować różne rodzaje danych – tekst, obraz, dźwięk i wideo. Aby takie modele powstały, potrzebne są ogromne, starannie opisane zbiory danych. Tu kluczową rolę odegrają zdigitalizowane zasoby Archiwów Państwowych.
Dzięki współpracy Narodowego Archiwum Cyfrowego z Cyfronetem, NASK i SpeakLeash zasoby te staną się fundamentem badań nad sztuczną inteligencją w Polsce. W efekcie powstaną narzędzia, które ułatwią obywatelom dostęp do zasobów kultury i historii oraz będą wspierać naukę, biznes, administrację i obywateli.
– Współczesne archiwa stoją dziś na skrzyżowaniu dwóch wielkich wyzwań i wielkich możliwości: zachowania pamięci narodowej w jej materialnych i cyfrowych przejawach oraz uczynienia tej pamięci prawdziwie dostępną i użyteczną dla obywateli, nauki i administracji. Archiwa Państwowe gromadzą w Narodowym Archiwum Cyfrowym setki milionów skanów fotografii, map i dokumentów. To materia niezwykłej wartości historycznej, kulturowej i naukowej. Połączenie tych zasobów z ogromnym doświadczeniem naszych partnerów wzmocni cyfrową suwerenność kulturową Polski i stanie się przykładem odpowiedzialnego wykorzystania zasobów – mówi Naczelny Dyrektor Archiwów Państwowych dr Paweł Pietrzyk.
Inicjatywa nie ogranicza się wyłącznie do aspektów technologicznych. SpeakLeash, wspólnie z Cyfronetem, już dziś prowadzi projekt Obywatel Bielik – pierwszą w Polsce inicjatywę crowdsourcingową, w której każdy może włączyć się w budowanie przyszłości AI. Obywatele przesyłają własne zdjęcia i pomagają je opisywać, współtworząc w ten sposób dane potrzebne do treningu modeli multimodalnych. Te doświadczenia i mechanizmy partycypacyjne zostaną teraz włączone także do działań konsorcjum z udziałem Narodowego Archiwum Cyfrowego i NASK. Oznacza to, że rozwój polskiej sztucznej inteligencji będzie odbywał się nie tylko w laboratoriach badawczych i centrach danych, lecz również przy aktywnym udziale obywateli.
Tak silne partnerstwo – łączące twórców polskich modeli językowych, ogromne archiwum zdigitalizowanych zasobów oraz unikatowe komponenty obywatelskie – to krok, który może nadać polskiej AI zupełnie nową dynamikę i znaczenie na arenie międzynarodowej.