Aktualności

Archiwa Państwowe dołączają do prac nad polskimi modelami sztucznej inteligencji

ACK Cyfronet AGH, Archiwa Państwowe (reprezentowane przez Narodowe Archiwum Cyfrowe), NASK oraz SpeakLeash łączą siły! Ta współpraca może otworzyć nowy rozdział w rozwoju sztucznej inteligencji w Polsce. Zasoby cyfrowe z Archiwów Państwowych, w tym miliony zdjęć, map i dokumentów, zostaną użyte w pracach nad polskimi multimodalnymi modelami sztucznej inteligencji nowej generacji

20 Sierpnia 2025
grafika dekoracyjna

ACK Cyfronet AGH, Archiwa Państwowe (reprezentowane przez Narodowe Archiwum Cyfrowe), NASK oraz SpeakLeash łączą siły! Ta współpraca może otworzyć nowy rozdział w rozwoju sztucznej inteligencji w Polsce. Zasoby cyfrowe z Archiwów Państwowych, w tym miliony zdjęć, map i dokumentów, zostaną użyte w pracach nad polskimi multimodalnymi modelami sztucznej inteligencji nowej generacji

Przyszłość AI należy do modeli multimodalnych, które potrafią analizować różne rodzaje danych – tekst, obraz, dźwięk i wideo. Aby takie modele powstały, potrzebne są ogromne, starannie opisane zbiory danych. Tu kluczową rolę odegrają zdigitalizowane zasoby Archiwów Państwowych.

Dzięki współpracy Narodowego Archiwum Cyfrowego z Cyfronetem, NASK i SpeakLeash zasoby te staną się fundamentem badań nad sztuczną inteligencją w Polsce. W efekcie powstaną narzędzia, które ułatwią obywatelom dostęp do zasobów kultury i historii oraz będą wspierać naukę, biznes, administrację i obywateli.

– Współczesne archiwa stoją dziś na skrzyżowaniu dwóch wielkich wyzwań i wielkich możliwości: zachowania pamięci narodowej w jej materialnych i cyfrowych przejawach oraz uczynienia tej pamięci prawdziwie dostępną i użyteczną dla obywateli, nauki i administracji. Archiwa Państwowe gromadzą w Narodowym Archiwum Cyfrowym setki milionów skanów fotografii, map i dokumentów. To materia niezwykłej wartości historycznej, kulturowej i naukowej. Połączenie tych zasobów z ogromnym doświadczeniem naszych partnerów wzmocni cyfrową suwerenność kulturową Polski i stanie się przykładem odpowiedzialnego wykorzystania zasobów – mówi Naczelny Dyrektor Archiwów Państwowych dr Paweł Pietrzyk.

Inicjatywa nie ogranicza się wyłącznie do aspektów technologicznych. SpeakLeash, wspólnie z Cyfronetem, już dziś prowadzi projekt Obywatel Bielik – pierwszą w Polsce inicjatywę crowdsourcingową, w której każdy może włączyć się w budowanie przyszłości AI. Obywatele przesyłają własne zdjęcia i pomagają je opisywać, współtworząc w ten sposób dane potrzebne do treningu modeli multimodalnych. Te doświadczenia i mechanizmy partycypacyjne zostaną teraz włączone także do działań konsorcjum z udziałem Narodowego Archiwum Cyfrowego i NASK. Oznacza to, że rozwój polskiej sztucznej inteligencji będzie odbywał się nie tylko w laboratoriach badawczych i centrach danych, lecz również przy aktywnym udziale obywateli.

Tak silne partnerstwo – łączące twórców polskich modeli językowych, ogromne archiwum zdigitalizowanych zasobów oraz unikatowe komponenty obywatelskie – to krok, który może nadać polskiej AI zupełnie nową dynamikę i znaczenie na arenie międzynarodowej.