Metadane dotyczą rzeczywistych danych oraz ich lokalizacji. Zarządzanie metadanymi polega na administrowaniu danymi opisującymi inne dane. Wymaga to tworzenia polityk i procesów, które zapewnią możliwie najlepszą integrację, dostęp, współdzielenie, analizę, linkowanie oraz zarządzanie informacjami w całej organizacji.

Metadane są generowane za każdym razem, gdy dane są tworzone, pozyskiwane, dodawane, usuwane lub aktualizowane. Na przykład metadane dokumentu w edytorze Microsoft Word obejmują rozmiar pliku, datę utworzenia dokumentu, imię i nazwisko autora i najnowszy modyfikator, daty wszystkich zmian oraz całkowity czas edycji. Można dodawać kolejne metadane, w tym tytuł, znaczniki i komentarze.

Zarządzanie metadanymi ma na celu ułatwianie osobie lub aplikacji zlokalizowania określonego zasobu danych. Wymaga to zaprojektowania repozytorium metadanych (data lake), zapełnienia go oraz ułatwienia korzystania z informacji znajdujących się w repozytorium.

Korzyści z zarządzania metadanymi:

  • Spójność definicji metadanych, dzięki czemu zróżnicowana terminologia nie powoduje problemów z odzyskiwaniem danych.
  • Większa spójność wielu instancji danych, ponieważ dane mogą być ponownie właściwie wykorzystywane.
  • Zarządzanie i utrzymywanie informacji w całej organizacji, niezależnie od wiedzy konkretnego pracownika.
  • Większa wydajność, prowadząca do szybszego dostarczania produktów i projektów.

Kiedy organizacja tworzy zasady zarządzania metadanymi, ważne jest, aby menedżerowie wspólnie uzgadniali jeden słownik danych i taksonomię. Należy przy tym uwzględniać różnice między poszczególnymi działami oraz wyeliminować lub zastąpić  niestandardowe zastosowania.

W niektórych przypadkach organizacja może korzystać z gotowych repozytoriów metadanych (data lakes), które są dostarczane wraz z zestawem narzędzi.

Napisane przez Stefan Kaczmarek