Ład przeciw chaosowi

Ład zarządzania danymi oraz informacjami daje początek kulturowej zmianie w firmie. Jak robić to dobrze i nie powielać cudzych błędów?

ILUSTRACJA

Georges Seurat, studium do "La Grande Jatte", 1884/1885, National Gallery of Art

Dane to nie informacja. Dane to surowe fakty, które mogą być kształtowane i formowane, by stworzyć informacje. Tak dane, jak i informacja, wymagają odpowiedniego zarządzania. Służy temu stworzenie ładu zarządzania danymi i informacją.

Jego celem jest maksymalizacja wartości biznesowej.

Można wskazać, że ład posiada cztery podstawowe funkcje wspierające biznes:

Organizacyjna - określenie zasad współpracy, jasnej odpowiedzialności za dane i informacje, relacji i decyzyjności.

Regulacyjna – zapewnienie zgodności z regulacjami, standardami czy polityką dyktowaną przez prawo, udziałowców czy samą organizację.

Kulturowa – budowanie zasad współdziałania oraz wspieranie pożądanych zachowań etycznych i społecznych pracowników.

Doradcza – wskazywanie, jakie metody pracy się sprawdzają w organizacji, unikanie ryzyka błędnego podejścia do przetwarzania danych.

Formalne wdrożenie ładu danych i informacji, często opisywanego jako system zarządzania danymi i informacjami EDM (ang. Enterprise Data Management), sprzyja realizacji celów biznesowych. Nie jest to warunek jedyny i konieczny.

Pragmatycy wolą ład

Wiele organizacji nie wdraża formalnych zasad ładu danych i informacji, a mimo to bardzo dobrze radzi sobie na konkurencyjnym rynku. Wynika to często ze specyfiki działalności, a także z istnienia nieformalnego ładu danych i informacji. Pracownicy stosują zasady ładu jako dobre praktyki czy naturalne sposoby pracy - przejawiają w ten sposób pragmatyzm i profesjonalizm w pracy.

Wdrożenie sformalizowanego ładu zarządzania danymi i informacją wydaje się konieczne w każdej firmie która posiada wiele działów samodzielnie (poza IT) przeliczających dane, wyciągających wnioski, tworzących rozbudowane raporty przekrojowe czy też po prostu posiadających z przyczyn historycznych rozbudowane systemy informatyczne czy konsolidowane hurtownie danych. W niektórych sektorach, takich jak bankowość, wdrożenie zasad ładu zarządzania danymi jest potrzebą wynikającą z zaleceń regulatorów.

W małej wielkości firmie koszty systemu zarządzania danymi są niewielkie i bazują wyłącznie na kosztach pracy ludzkiej. W większych firmach, gdzie jest kilku różnych właścicieli danych, a ilość systemów IT idzie w dziesiątki czy nawet setki koszty osobowe są wyższe i dodatkowo dochodzi jeszcze konieczność zapewnienia narzędzi do współdzielenia wiedzy o danych czy automatycznej kontroli jakości danych. Zawsze też trzeba się liczyć z kosztami wdrożenia projektów porządkujących dane w systemach IT i projektami migracyjnymi dane do jednego miejsca źródłowego (tworzenie ujednoliconych i rzetelnych tzw. Data Master).

Ile kosztuje niewdrażanie ładu? Brak ładu kosztuje i przejawia się przez wielokrotne wyliczanie i tworzenie zduplikowanych raportów albo przygotowywanie tych samych danych w różnych jednostkach. Często podejmowane są decyzje biznesowe nie mające poparcia merytorycznego, bo dane były, ale bez odpowiedniej jakości. Firmy angażują się na przykład w nietrafione kampanie marketingowe, tworzą produkty, które nie mają szans na sukces rynkowy albo wielokrotnie poprawiają zestawienia finansowe narażając się na kary i ukrywając błędy przed kontrolerami.

Formalny EDM

Wdrożenie ram organizacyjnych i procesów dotyczących zarządzania informacją jest skomplikowane i zajmuje, w zależności od wielkości organizacji, od kilku miesięcy do kilku lat. System zarządzania danymi i informacjami EDM najczęściej dzieli się na 3 niezależne obszary: ład organizacyjny danych (ang. Data Governance), architektura danych (ang. Data Architecture), jakość danych (ang. Data Quality).

Ład organizacyjny danych określa zależności, struktury organizacyjne, koordynację działań i role osób na bieżąco uczestniczących w procesie zarządzania informacjami od momentu pozyskania do przetworzenia w informację zarządczą.

Obszar architektury danych skupia się na wyborze referencyjnego modelu danych i informacji, na doskonaleniu modelu informacyjnego, aby zapewnić spójność i kompletność informacji zarządczej oraz analitycznej, na dbaniu o użyteczność zebranych danych do podejmowania decyzji biznesowych. Tworzenie architektury danych jest dużym wyzwaniem w organizacjach, szczególnie posiadających bogatą historię integracji i zmian organizacyjnych, np. w bankowości czy ubezpieczeniach.

Jakość danych to zapewnienie dbałości o odpowiedni sposób opisu algorytmów wyliczeniowych i transformacji danych, liczenie wskaźników jakości danych, sformalizowanie zasad zarządzania jakością danych, określanie atrybutów wykorzystywanych do oceny jakości danych, czyszczenie danych, identyfikacja przyczyn błędów w danych, bieżące monitorowanie jakości danych. I wreszcie - tworzenie kultury organizacyjnej w obszarze Data Governance.

Nowa kultura pracy

Wdrożenie systemu zarządzania danymi i informacjami pociąga za sobą zmianę kultury pracy. Widocznym skutkiem wdrożenia EDM jest zmiana w orientacji biznesowej i w traktowaniu poszczególnych kryteriów informacji.

Pracownicy z większą uwagą i bardziej świadomie podchodzą do przetwarzania informacji. Proces zmiany kulturowej można obserwować przez „okulary” pomiaru efektywności wdrożenia EDM. Może do tego służyć pulpit menedżerski zbudowany na bazie odpowiednich kryteriów. Często stosuje się siedem kryteriów zgodnych z metodyką COBIT, które dekomponuje się na miary prezentujące odstępstwa od przyjętej normy albo ilość zdarzeń wpływających na jakość danych (patrz ramka).

Miary efektywności ładu zarządzania danymi i informacją

Miary efektywności ładu zarządzania danymi i informacją

Oprócz COBIT można oczywiście wskazać inne dobre praktyki, np. TOGAF czy ISO27001, które mogą być wybiórczo wykorzystane w trakcie wdrażania EDM. Jednak wszystkie tzw. „dobre praktyki” nie są kluczowe dla sukcesu wdrożenia.

Właściciel danych poszukiwany

W polskich realiach podstawowym problemem przy wdrażaniu systemu EDM jest kwestia odpowiedzialności. Kto w organizacji odpowiada za dany typ danych i kto jest beneficjentem danych? Kto rozumie sens informacji i potrafi interpretować dane?

Te pytania w wielu organizacjach napotykają na mur niezrozumienia. Padają odpowiedzi: przecież to IT zarządza danymi, więc pewnie są właścicielami danych. Tymczasem z definicji, właściciel danych to osoba lub grupa osób w organizacji, która pozyskuje, tworzy i kontroluje merytorycznie zawartość i sens danych. Nie może więc to być IT, które nie uczestniczy w procesach biznesowych i dostarcza jedynie platformę techniczną. IT zna struktury danych, ale nie zna struktur informacji.

Rozwiązaniem problemu jest powołanie kustoszy danych (ang. data steward), którzy nie są właścicielami danych, ale ich odnajdują i uświadamiają im ową odpowiedzialność. Jednocześnie kustosze dbają o właściwy sposób używania danych, mierzą i kontrolują, używają metryk opisujących sposób przetwarzania, wskazują problemy z jakością danych i starają się je rozwiązać. Na styku IT i biznesu tworzą ramy współpracy z architektem danych, administratorami baz danych, osobami odpowiedzialnymi za techniczną stronę procesów ETL (ang. Extract-Transform-Load) czy budującymi hurtownię danych. Jest to zatem funkcja niezwykle ważna, dająca organizacji możliwość wypracowania sensownego podejścia do zarządzania danymi i informacjami.

Cele zrozumiałe

Jakie są główne cele zarządzania informacją w firmie? Polskie organizacje zazwyczaj pamiętają o:

• dostarczaniu rzetelnych informacji jednostkom biznesowym (odpowiednio ustrukturyzowane, aktualne, szczegółowe, o wysokiej jakości)

• udostępnieniu na czas, tj. w momencie podejmowania decyzji biznesowych

• dostępie dla właściwych osób

• spójnym rozumieniu znaczenia informacji oraz struktur danych.

Tak postawione cele są zrozumiałe, ale pytanie już o środki użyte do ich osiągnięcia sprawia problemy. Najprościej pytanym wskazać, jak dostęp do informacji jest chroniony, ale nie potrafią już powiedzieć, jak organizacja upewnia się, że dane są rzetelne, docierają na czas oraz czy są znane definicje danych. Bez wdrożenia systemu EDM nie uda się w sensowny sposób udowodnić, że organizacja w ogóle te cele realizuje.

Pomocą w zrozumieniu i realizacji celów jest wskazanie celów „dodatkowych” dla zarządzania danymi i informacją – celów odpowiadających na realne, namacalne potrzeby biznesowe lub powiązanych z toczącymi się właśnie projektami. W takim kontekście pracownicy dostrzegają potrzebę wskazania modelu odpowiedzialności za dane i informacje. Widzą korzyść z posiadania systematycznego i spójnego opisu struktur dla wymiany informacji. Używają definicji, słowników i modeli referencyjnych dla danych. Optymalizują procesy przeliczania i transformacji danych, np. eliminują dublowanie wyliczania danych wtórnych, przyspieszają procesy ETL. Tworzą opisy architektoniczne struktur danych i przepływów danych, a także budują opisy informacji (znaczenia struktur danych). Rozumieją znaczenie uzyskania zgodności z wymaganiami branżowymi i regulacyjnymi, np. z Rekomendacją D KNF.

Lepsze zrozumienie nie chroni jednak nadal przed popełnianiem błędów.

Lista typowych błędów obejmuje sześć punktów:

• Nadprodukcja danych, kopiowania danych „na wszelki wypadek”, dublowanie.

• Wielokrotne przetwarzanie, przenoszenie i zmienianie danych.

• Brak zasad usuwania i depersonalizacji danych.

• Ustalanie szablonów struktur danych niedostosowanych do rzeczywistych potrzeb.

• Nieznajomość struktur danych przez pracowników powodująca złe użycie danych.

• Budowa „świata idealnego”.

Na czym polega systematyczne podejście we wdrażaniu EDM?

Doświadczenie podpowiada, aby zacząć od zbudowania dobrych relacji z jednostkami biznesowymi. Należy działać z biznesem i poznać interesariuszy. Należy zadawać pytania: kto i jakich danych używa, gdzie dane są realnie przetwarzane, kto jest ostatecznym beneficjentem danych, jak dane są przekazywane? Ułatwieniem w tej pracy może być rysowanie diagramów celowych ukazujących drogę danych od źródła (systemu) do wyniku (odbiorcy). Diagram staje się opisem rzeczywistości i podstawą do rzeczowej dyskusji. Warto też sięgać po „nośne” wymagania, takie jak: rekomendacje KNF, ustawy i rozporządzenia dotyczące danych czy modeli ryzyk, a także wymogi udziałowców.

Należy unikać tworzenia strategii związanej z zarządzaniem danymi „na półkę”. Lepiej wskazać jasne i krótkoterminowe wyniki do osiągnięcia. Wizja jest ważna, ale z czasem ginie w gąszczu bieżących zmian dotyczących systemów i danych.

Rysowanie diagramów i tworzenie opisów danych jest chyba największym wyzwaniem. Często istnieje pokusa stworzenia struktur od ogółu do szczegółu i skorzystania w tym celu z komercyjnych modeli referencyjnych dla sektora finansowego, banku czy sektora telekomunikacyjnego. Takie rozwiązanie powoduje często, że projekt porządkowania struktur danych trwa bardzo długo lub w ogóle kończy się klęską. Lepszym rozwiązaniem jest rysowanie modeli danych fragmentami i porządkowanie ich na poziomie małych struktur, którymi łatwiej się zarządza. Oczywiście występować będzie zjawisko pojawiania się uporządkowanych i opisanych wysp w oceanie nieoznaczoności danych. Jednak w tym przypadku każde działanie związane z budową modelu danych będzie miało swój cel biznesowy i budżet. Łatwiej też jest potem łączyć wyspy, niż budować całościowy świat idealny. Cierpliwość jest cnotą każdego architekta danych, bo proces tworzenia modeli może być długi...

Tadeusz Kifner

Tadeusz Kifner

O Autorze

Tadeusz Kifner odpowiada za obszar architektury danych w jednym z banków w ramach procesów rozwoju informatycznego. Pracuje ponad 15 lat w branży finansowej na stanowiskach związanych z: rozwojem oprogramowania, audytem IT, IT Governance i architekturą rozwiązań. Posiada 13 lat doświadczenia jako niezależny doradca w obszarze zarządzania bezpieczeństwem informacji oraz zarządzania organizacjami IT. Jako rzeczoznawca Polskiego Towarzystwa Informatycznego uczestniczący w wielu projektach dla administracji publicznej. Jest absolwentem Politechniki Gdańskiej i posiada tytuł MBA walidowany przez RSM Erasmus University. Posiada również szereg certyfikatów branżowych takich jak: TOGAF 8/9, ITIL Expert, ITIL SM, CISA, CGEIT, Prince2 F.