Domek w Jeziorze Danych, czyli Bullshit Bingo nadal modne

Dla tych co nie znają gry w Bullshit Bingo – wyjaśniam. To taka zabawa w obstawianie które modne słowo najczęściej zostanie użyte w zadanym czasie. Można się bawić na konferencji, prelekcji czy dowolnym spotkaniu w korpo. Ten wpis jest jednak mniej o samej zabawie a bardziej o dostawcach modnych słówek, czyli BuzzWordów.

Śledząc nowinki w swojej branży (od około 30 lat!) mam wykształcony swego rodzaju radar. Pomaga mi on odsiewać to co już znam od nowych pojęć, które być może za chwilę będą w obiegu.

Jednym ze sposobów na “bycie na czasie” jest lektura branżowych blogów, portali i prasy. A jednym z lepszych takich miejsc jest The New Stack. Tu regularnie trafiam na teksty, które uświadamiają mi jak mało jeszcze wiem. Albo jak bardzo zacofanych narzędzi używam. Albo (niestety) jak bardzo działy marketingu starają się dotrzeć do potencjalnego “kupującego” wymyślając nowe pojęcia (czyli wspomniane BuzzWordy).

Ten wpis będzie o tym ostatnim przypadku. Co mnie skłoniło do jego napisania? Tekst How to Build a Modern Data Infrastructure Using a Lakehouse. Nie jest on jakimś wyjątkiem a raczej przykładem (jednym z wielu) jak bardzo trzeba filtrować materiały na tego typu portalach brażnowych. Oraz, że niekoniecznie musimy pałać miłością do wszystkich nowinek i trendów.

Najpierw muszę oddać sprawiedliwość autorom artykułu – bardzo słusznie zauważyli że budowanie “Data Lake” bardzo często kończy się na posiadaniu “Data Swamp”:

Zrzut ekranu z artykułu "How to Build a Modern Data Infrastructure Using a Lakehouse" z wyróżnionym tekstem "While the data lake was a promising strategy, “data swamp” — disorganized data — quickly caught on due to improper data governance, resulting in stale, unused data within a data lake."
Zrzut ekranu z artykułu

Trudno się z tym twierdzeniem nie zgodzić. Nawet jeśli nie zajmuję się na codzień budową tego typu struktur, to znam wiele przypadków, gdzie dane składowane w systemach “padały ofiaramii entropii” aż w końcu stawały się niemożliwe do sensownego użycia w najprostszym raporcie czy zestawieniu.

Wracając do artykułu, mamy w nim bardzo prostą tezę:

  • Ponieważ budowanie “Data Warehouse” jest drogie, długie i trudne w utrzymaniu…
  • …a ratunek w postaci taniego “Data Lake” prowadzi nas do chaosu informacyjnego…
  • …zbudujmy sobie “Data Lakehouse” – żyjmy długo, tanio i szczęśliwie.

Proste, prawda? Ekscytujące i aż człowiek chce rzucić się w wir pracy nad nową koncepcją, czyż nie?

No nie wiem. Nie jestem super specem od tych wszystkich “Data cokolwieków” ale mój Bullshit Radar już zaświecił się na czerwono. Szczególnie, że chcąc dowiedzieć się co to właściwie jest ten “Domek w Jeziorze Danych”, czytam między innymi takie akapity (wyróżnienia moje).

Mam więc już pewne skojarzenia z setkami podobnych artykułów, pisanych według schematu:

  • Zaznaczmy, że to najnowsza nowość,
  • podkreślmy dwa razy że zmniejsza ona koszty, niech księgowi i CIO się zaciekawią,
  • dorzućmy kilka frazesów o tym, że będzie dostępniej, szybciej, optymalniej i że dzięki temu będziemy podejmować lepsze decyzje biznesowe – niech ślinka zacznie ciec wszystkim, którzy pracują z danymi i mają na ich podstawie podejmować jakieś decyzje,
  • wsadźmy kilka kluczowych fraz i słówek modnych w ostatnich latach, żeby trafić do szerokiego grona; przykładowo (to z wspomnianego artykułu):
    • Automated Workflow and Orchestration
    • Data Pipelines and ELT Processing
    • AI/ML (Artificial Intelligence and Machine Learning)
    • Data Governance and Security
    • Data Observability

Co dostaniemy w efekcie? Tekst kierowany do decydentów, osób “kupujących informatykę”, w którym kreślimy wizję jakoby podejście “Data Lakehouse” było lekiem na całe zło. A już na pewno na ten ciagnący się od wielu lat projekt, w którym próbowaliście zbudować hurtownię danych a wyszła wam studnia bez dna na pieniądze.

Decydent albo osoba, która ma do niego dojścia, ma po przeczytaniu tekstu zostać z przekonaniem, że oto nadchodzi era czegoś nowego. Czegoś w co warto zainwestować czas, pieniądze, energię. Czegoś redefiniującego podejście do procesu wdrażania [tu wstaw cokolwiek] w Twojej organizacji.

Tyle, że to jedna wielka ściema.

Cały ten tekst – jak wiele podobnych – nie wymienia żadnego konkretu, żadnej faktycznej przewagi, żadnego przykładu wdrożonego rozwiązania. Jest marketingowym zbiorem gładkich słówek, fragmentów opisów produktów, nazw własnych i słów kluczowych.

Mam wrażenie, że takie artykuły mają jeden cel. Wprowadzić i promować nowe modne słówko a następnie zbudować wokół niego swoją “unikalną” ofertę. Czyli “My nie robimy tych przestarzałych łerhałsów czy lejków, my robimy coś co teraz jest na topie, jesteśmy liderami zmiany”.

Tyle, że kolejna gładka nazwa nie pomoże w budowaniu czegoś tak skomplikowanego jak zarządzanie danymi w przedsiębiorstwie (albo w podobnym przedsięwzięciu o takiej skali). To jest zadanie gigantyczne, długotrwałe i, niestety, bardzo rzadko precyzyjnie zdefiniowane.

Nawet nie chodzi o to, że błędnie się podchodzi do definicji tego typu projektów (chociaż też tak bywa). Wyzwanie polega na tym, że projekty takie żyją wiele lat i muszą reagować na zmiany, nowe potrzeby i wyzwania. To trochę jak (prze)budowa trakcji, wagonów i lokomotywy trakcie jazdy w pociągu.

Nie istnieje jeden system, narzędzie, szablon, który wystarczy wdrożyć aby odnieść sukces w takim projekcie. Nie ma dróg na skróty ani gotowych przepisów, które wystarczy wykonać jak w termomiksie i dostać na końcu “tanie i dobre cokowiek marketingowcy wymyślili, że teraz akurat biznes tego najbardziej potrzebuje”.

Nie twierdzę, że Marketing jest co do zasady zły albo szkodliwy. Bywają firmy, których działania promocyjne są “nietoksyczne” i niosą prawdziwą wartość dla odbiorców. Szkoda, że jest ich tak mało, ale to poniekąd zrozumiałe. W końcu taniej jest napisać tekst naszpikowany nowomową i pustymi obietnicami (a za chwilę będzie to jeszcze tańsze, dzięki AI) niż podzielić się realnym, popartym przykładami doświadczeniem.

[…]

Spotkamy się ponownie?

otrzymasz jeden mail miesięcznie z najnowszymi wpisami

klikając "Zapisz mnie" potwierdzasz zapoznanie się z polityką prywatności tego bloga

Spotkamy się ponownie?

otrzymasz jeden mail miesięcznie z najnowszymi wpisami

klikając "Zapisz mnie" potwierdzasz zapoznanie się z polityką prywatności tego bloga

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *