Projekty AI upadają nie dlatego, że brakuje nam wizji czy technologii – lecz dlatego, że fundament,
na którym mają działać, jest kruchy. Bez świadomego podejścia do danych i procesów dane stają się przeszkodą zamiast przewagą. To właśnie na tym poziomie rozstrzygać się może, czy inwestycja
w sztuczną inteligencję przyniesie realną wartość biznesową, czy stanie się kolejną kosztowną iluzją.
Internet niedawno rozhuczał się informacją, iż nawet ponad 90% komercyjnych projektów związanych
z Generatywną Sztuczną Inteligencją (GenAI) kończy się niepowodzeniem. Rzeczywiście poziom niepowodzeń
w projektach, gdzie policzenie zwrotu z inwestycji dawało się określić, poziom niepowodzeń był właśnie tak wysoki. Według wspomnianego badania, tylko w pierwszym półroczu 2025 roku zainwestowano w takie projekty ponad 44 mld dolarów. Coraz częściej pojawia się obawa, że GenAI stanie w jednym szeregu
z wcześniejszymi „bańkami technologicznymi” - takimi jak telewizja 3D, Segway czy metaverse.
Dlaczego tak się dzieje? Wskazuje się na wiele przyczyn: luki kompetencyjne, słabą integrację systemów, brak strategii, niedostateczne wsparcie dla pracowników czy niewłaściwe metody mierzenia ROI. Ale tak naprawdę jest jeden obszar, który ma znaczenie fundamentalne dla każdego projektu AI: dane i procesy danych.
Firmy często zapominają, że sztuczna inteligencja nie działa w próżni. Modele uczą się wyłącznie na podstawie danych, które posiada firma. Jeśli chcemy skorzystać z zasobów, któregoś z Wielkich Modeli Językowych, jego reakcje opierają się na danych oraz na modelu sztucznej inteligencji wytrenowanej i dostosowanej do danego typu danych. Jeśli chcemy, aby taki model uwzględniał również dane naszej firmy (świadomie pomijam kwestie bezpieczeństwa danych), to modelowi temu trzeba udostępnić dane dotyczące naszej firmy - wewnętrzne, swoiste, konkretne dane. Jeśli takie dane są niepełne, niespójne albo niskiej jakości, wynik, jaki uzyska pracująca na nich AI, będzie bezużyteczny. Obowiązuje tu żelazna zasada: „trash in – trash out”.
Skalę tego problemu miałem okazję zaobserwować, pracując w polskich firmach średniej wielkości. Okazuje się, że wiele z nich:
Posiadanie danych to jeszcze nie wszystko. Ogromnie wiele zależy od tego, o jakiego rodzaju danych mówimy. Szczególnie chodzi tutaj o kwestię ich opracowania.
Paradoks polega na tym, że nawet dane nieustrukturyzowane mogą stać się bardzo wartościowe - pod warunkiem, że firma świadomie zaprojektuje proces ich zbierania i organizowania.
W B2B profil idealnego klienta (ICP) powinien być opisany konkretnymi, odpowiednimi dla rodzaju działalności firmy gromadzącej dane, wartościami, np.: przychód, liczba pracowników, branża, potrzeby (ułożone w sensowną listę), problemy sygnalizujące potrzeby (również w postaci listy sensownych wartości). Na fundament podstawowego opisu rynku należy następnie nałożyć dane dotyczące aktywności zespołu sprzedaży. Dopiero na takich danych można budować modele predykcji sprzedażowych. Z pozoru to niewielkie wymagania, ale ich niespełnienie sprawia, że predykcja z wykorzystaniem AI na niewiele się zda.
Dobranie odpowiednich atrybutów, które powinny wyznaczać profil idealnego klienta musi być poprawne dla danej firmy lub branży. To jest warunek konieczny tworzenia przydatnego zbioru danych. Jednakże musi również zajść warunek wystarczający, aby ten konieczny mógł się zrealizować. Określony ICP zbiór danych kluczowych musi mieć szansę bycia wypełnionym. Jeśli nie znajdziemy wiarygodnego źródła odpowiednich danych, to stopień wypełnienia wszystkich lub części i pól będzie zbyt niski, aby rzeczywiście na podstawie takich danych z sukcesem budować wyższe piętra informacji.
Jeśli dane są rzetelne i wypełnione w wystarczającym stopniu – AI wskaże firmie najbardziej obiecujące segmenty rynku. Jeśli dane są chaotyczne – AI nauczy się chaosu.
Firmy, które odnoszą sukcesy z AI, mają zaprojektowane procesy gromadzenia danych, np.:
Dzięki temu gromadzone dane nie są przypadkowym zapisem, ale sensownym odzwierciedleniem działalności firmy, a więc gotowym wsadem do trenowania modeli.
Nawet najlepiej przygotowane dane i wyszkolone modele nie mogą działać w oderwaniu od ludzi. W praktyce najlepiej sprawdza się podejście human-in-the-loop:
To zamknięta pętla, w której sztuczna inteligencja i człowiek wzajemnie się uzupełniają. Przykładem możę tu być model sztucznej inteligencji rekomendujący, których dłużników należy skierować do intensywnego procesu windykacji. Sztuczna inteligencja musi w tym przypadku być wytrenowana na przygotowanych danych kluczowych. Jednakże uruchomienie automatyzacji opartej o taki model, bez weryfikacji odpowiedniego specjalisty może w oczywisty sposób zaszkodzić. Informacja zwrotna przekazywana przez specjalistę modelowi jest przedłużeniem procesu szkolenia modelu. Dzięki temu będzie on stopniowo przedstawiał coraz lepsze rekomendacje.
Jakie wnioski?
Jeśli chcesz dowiedzieć się, jak przygotować swoją firmę na skuteczne wdrożenie AI i zbudować trwałą przewagę konkurencyjną, dołącz do naszego webinaru 2 października i poznaj sprawdzone rozwiązania i narzędzia, które naprawdę działają.