W połowie 2015 r. Archiwa Państwowe w Toruniu i Bydgoszczy zaczęły udostępniać przez internet cyfrowe akta. Szybki dostęp i przeglądanie cyfrowych kopii akt są możliwe dzięki macierzy chmurowej i łączom światłowodowym łączącym siedziby archiwów w Toruniu i Bydgoszczy.

Digitalizacja archiwów państwowych

księgiZe statystyk archiwów państwowych, uwzględniających obszary badawcze i zainteresowania osób korzystających z narodowego zasobu archiwalnego, wynika, że liczba zainteresowanych badaniami genealogicznymi systematycznie rośnie. W 2009 r. liczba skanów w archiwach państwowych wynosiła niespełna 2,4 mln. W latach 2012-2014 zwiększyła się o 42 mln skanów. Na koniec 2014 r. na portalu www.szukajwarchiwach.pl administrowanym przez Narodowe Archiwum Cyfrowe zostało udostępnionych łącznie ponad 15 mln skanów z kilkunastu archiwów państwowych. Digitalizowane są przede wszystkim najczęściej wykorzystywane przez użytkowników dokumenty, takie jak: akta metrykalne, projekty budowlane czy akta miast.

SONY DSC

Pracownia skanowania

W ramach projektu “Źródła genealogiczne mieszkańców województwa kujawsko-pomorskiego” procesowi digitalizacji poddano akta metrykalne, stanu cywilnego i księgi meldunkowe przechowywane w Archiwach Państwowych (AP) w Toruniu i Bydgoszczy oraz ich oddziałach we Włocławku i Inowrocławiu. Głównym celem projektu jest digitalizacja dużej części akt metrykalnych (głównie z końca XIX i początku XX wieku) znajdujących się w zasobach AP w Toruniu i Bydgoszczy i ich oddziałach, oraz udostępnienie ich w internecie w sposób umożliwiający swobodny dostęp każdemu zainteresowanemu genealogią i poszukiwaniami swoich korzeni.

Zakres digitalizacji archiwów kujawskich

  • ponad 40 tys. jednostek archiwalnych
  • 1,8 mln skanów
  • 3,6 mln stron z ksiąg metrykalnych (USC), parafialnych i meldunkowych.
  • 580 mb akt

Chmura i magazynowanie obiektowe

Do składowania danych jest używana platforma pamięci masowej EMC Atmos korzystająca z usług typu cloud computing. Umożliwia ona szybki dostęp do chmury i wydajne zarządzanie dużymi, rozproszonymi zbiorami danych. Co ważne, w środowiskach rozproszonej pamięci masowej są przechowywane segmenty obiektów, a nie całe obiekty. Podobne rozwiązanie jak w archiwach kujawskich, choć oczywiście na znacznie większą skalę wdrożono w Archiwach Watykańskich, gdzie digitalizacji łącznie ma zostać poddanych 82 tys. manuskryptów (każdy liczący średnio 500 stron), co odpowiada ok. 45 PB danych.

Macierze chmurowe Atmos

Wdrożenie nie obyło się bez pewnych trudności – wspomina Bolesław Rassalski, starszy informatyk z AP w Bydgoszczy. Podczas transportu sprzętu do serwerowni powstał poważny problem logistyczny, w wyniku którego konieczne było rozłożenie macierzy. Wejście do serwerowni mieszczącej się w piwnicy budynku znajdującego się w zabytkowej części Torunia prowadziło przez strome, wąskie i kręcone schody. Dlatego też fabrycznie złożona macierz musiała zostać rozmontowana. Stelaż szafy przecięto na dwie połowy, a następnie – już w serwerowni – ponownie rozłożono. To „cięcie” wymagało specjalnej zgody producenta – bez niej sprzęt straciłby gwarancję.

Portal i jego funkcjonalności

portalW portalu www.genealogiawarchiwach.pl udostępnionym w połowie 2015 r. umieszczono łącznie  około 1,5 mln skanów. Umożliwia on przeglądanie i indeksowanie udostępnionych zasobów. W funkcjonalności portalu nie przewidziano możliwości pobierania danych, a tylko ich przeglądanie lub ewentualnie zrobienie zrzutu ekranu lub zapisanie grafiki. Tylko zarejestrowani użytkownicy po zalogowaniu się mają dostęp do zasobów z uprawnieniami pozwalającymi na indeksowanie zgromadzonych zasobów. Pracownie archiwistyczne mogą korzystać z części wewnętrznej portalu, niedostępnej dla internautów.

Kryteriami wyszukiwania są: nazwy miejscowości, nazwiska i rodzaje aktów. System informatyczny pozwala wszystkim zainteresowanym na wzięcie udziału w indeksacji zeskanowanych materiałów, zgodnie z wytycznymi do sporządzania indeksu analitycznego do akt stanu cywilnego.

Więcej o cyfryzacji zasobów Archiwach Państwowych w Toruniu i Bydgoszczy:

  • genezie, kosztach i przebiegu wdrożenia,
  • zastosowanych rozwiązaniach (macierz w chmurze, storage obiektowy, infrastruktura),
  • procesie i zakresie digitalizacji dokumentów,
  • głównych korzyściach z digitalizacji zasobów AP w Toruniu i Bydgoszczy

– w artykule “Kujawskie archiwa cyfrowe opublikowanym w miesięczniku “IT w Administracji” (czerwiec, 2015 r.).

Napisane przez Stefan Kaczmarek