Jak wdrożyć GenAI w firmie nietechnologicznej?
Tak jak wspominałem w ostatnim mailu spróbujemy dzisiaj przejść krok po kroku przez proces wdrażania generatywnej sztucznej inteligencji w firmie, która nie jest technologiczna. Co to znaczy firma “nietechnologiczna”? To w mojej opinii firma, która nie ma własnego działu IT rozwijającego produkty cyfrowe na własny użytek lub do sprzedaży. To firma, która nie ma ekwiwalentu CTO - Chief Technology Officer - osoby w randze “wiceprezes/ka” od technologii, która to osoba wpływa bezpośrednio na długofalową strategię firmy, a sama strategia (strategia, nie taktyka) firmy nie zmienia się w zależności od rozwoju technologii na świecie. To w końcu firma, której technologia ma pomagać dostarczać wartość w już zdefiniowanym rynku, a nie otwierać nowe rynki zbytu.
Granica nie jest bardzo płynna i mam wrażenie, że większość firm doskonale sobie zdaje sprawę, w której kategorii się znajduje.
Podstawowe założenia
Proces wdrażania GenAI w firmie opisany poniżej oparty jest o kilka założeń:
Na obecnym etapie rozwoju generatywnej sztucznej inteligencji, bardziej się opłaca być w awangardzie poszukiwaczy nowych zastosowań, niż czekać na sprawdzone rozwiązania do wdrożenia.
To dość oczywiste, że to piszę - to jest podstawowe założenie tego newslettera poparte wieloma przykładami ze świata i naszego własnego doświadczenia.
Weźmy dla przykładu firmę Klarna, która niedawno przetoczyła się przez media, w tym polskojęzyczne, z historią o tym, jak czatbot do obsługi klienta oparty o modele językowe od OpenAI w miesiąc wykonał pracę 700 pracowników. W mediach jednak rzadko podawano, że Klarna nie czekała, aż gotowe rozwiązanie dedykowane dla fintechów (branża, w której operuje Klarna) zaproponuje któryś z typowych dostawców (np. Zendesk), ale wymyśliła i wdrożyła sobie sama całego czatbota (okazało się to dość proste, co też nie dziwi). Dzięki dobremu rozumieniu ograniczeń GenAI uniknęła przy tym wpadek takich jak Air Canada (czatbot Air Canada wymyślił nieistniejące polityki zwrotu biletów).
Cykle rozwojowe rozwiązań wokół AI są krótsze niż cykle wdrożeniowe, więc bardzo opłaca się mieć kompetencje “eksperymentowania”.
Decyzja o wdrożeniu GenAI należy do zarządu, ale zastosowania GenAI znajdują pracownicy.
Wciąż trudno nam znaleźć jakieś intuicyjne ograniczenia tego, do czego da się zastosować generatywną sztuczną inteligencję. Analiza i tworzenie tekstu to tak szeroki obszar, że wciąż znajdujemy nowe zastosowania modeli językowych. Jeśli Wam się wydaje, że jak pracownik operuje na arkuszach kalkulacyjnych to już nie pracuje z tekstem to popatrzcie (sekcja “zastosowania”) na przykłady tego, jak może usprawnić pracę podłączenie modelu od OpenAI do Google Sheets.
Czy zarząd odgórnie wymyśli takie zastosowania? Prędzej zrobi to pracownik, o ile dostanie przestrzeń na eksperymentowanie.
Technoentuzjazm partnerów wymaga dobrego zarządzania
Jest dość oczywiste, że część kompetencji technicznych (w postaci szkoleń, wdrożeń, mentoringu, itp.) trzeba pozyskać z zewnątrz, natomiast moim zdaniem w tym procesie bardzo łatwo ulec entuzjazmowi lub nieziemskim obietnicom takich partnerów (pisałem o tym w mailu dotyczącym dotrenowywania własnych modeli). Co za tym idzie, istnieje ryzyko przeinwestowania w GenAI (jak 10 lat temu firmy nietechnologiczne przeinwestowały w Big Data i Data Science). Tym ryzykiem można zarządzić na wiele sposobów, natomiast z naszego doświadczenia wynika, że lepiej budować kompetencje technologiczne wewnątrz firmy, niż próbować tłumaczyć partnerom IT, na czym polega Wasz biznes.
Proces wdrażania
W idealnym świecie taki proces miałby następujące kroki:
Decyzja “próbujemy na poważnie” oraz wybór czempiona zmian
“Próbujemy na poważnie” oznacza tylko tyle, że zarząd nie oczekuje cudów w tydzień i jest gotowy zainwestować jakieś środki w budowę kompetencji lub pozyskanie dostępu do oprogramowania. Na tym etapie nie polecam decyzji typu “all-in” i decydowania o wydaniu milionów na GenAI - za wcześnie.
Wybór czempiona zmian do element podyktowany koniecznością zarządzania ryzykiem związanym z technoentuzjazmem partnerów. To jest osoba, która nie tylko będzie motorem napędowym wdrożeń, ale też pozyska niezbędne techniczne kompetencje, żeby wiedzieć jakich usług/produktów szukać na rynku. Intuicji w temacie GenAI nie nabiera się po jednym szkoleniu a jednocześnie nie wszyscy w firmie muszą ją posiadać, dlatego w niedużych firmach jedna osoba w zupełności wystarczy. To jest osoba, która jest motorem napędowym wszystkich następnych kroków.
Powinna to być osoba blisko zarządu, żeby rozumieć dobrze biznes (dlatego zewnętrzny konsultant AI lub szeregowy pracownik to mogą być mniej optymalne wybory - choć oczywiście to zależy od konkretnej sytuacji).
Audyt procesów biznesowych i rozwiązań IT w firmie
Dobrze by było, gdyby taki audyt zawierał elementy cyberbezpieczeństwa, ale w wersji absolutnego minimum efektem tego kroku byłaby pełna lista oprogramowania używanego w firmie oraz lista zadań wykonywanych z pomocą tych narzędzi.
Taką listę można pokazać zewnętrznemu konsultantowi i zweryfikować, czy nie istnieją poważne bariery odnośnie wdrożenia GenAI (dla przykładu, jeśli firma nie ma systemu obiegu dokumentów, a jednocześnie setki dokumentów dziennie przesyłane są mailem, to żadna sztuczna inteligencja nie ogarnie takiego bałaganu).
Efekty takiej inwentaryzacji powinny też pomóc w wyborze pierwszej platformy/narzędzia GenAI do wewnętrznych testów.
Warsztaty z GenAI dla pracowników
Na tym etapie nasz czempion generatywnej sztucznej inteligencji powinien być w stanie albo samodzielnie poprowadzić takie warsztaty, albo poprowadzić je z zewnętrzną pomocą, ale wtedy powinien być współodpowiedzialnym za ich kształt.
Celem takich warsztatów powinno być zapoznanie pracowników z możliwościami i ograniczeniami (to drugie ważniejsze) technologii oraz z jedną wybraną platformą GenAI. Dla przykładu, może to być ChatGPT, ale wyłącznie w wersji płatnej (subskrypcja biznesowa dla firm) - nie warto tracić czasu na rozwiązania, które nie są w czołówce tego, co jest dostępne na rynku. W Polsce dużego wyboru nie mamy (Claude i Gemini Pro nie są dostępne w Europie), ale może z czasem się to zmieni.
Faza eksperymentowania i przebijania pierwszej niechęci
Tak, tak, wiemy, że GenAI nie nadaje się do wszystkiego. Ale do czegoś się nadaje i jest pytanie, czy jest taka rzecz u Was w firmie.
W tej fazie trwają poszukiwania niskokosztowych rozwiązań (np. automatyczne budowanie bazy “często zadawanych pytań” na podstawie emaili klientów, albo własny GPT do pisania podsumowań ze spotkań, itd.), które pozwolą przebić się przez (naturalną) niechęć pracowników do nowych systemów. Czempion AI doradza i wspólnie z zespołem szuka ciekawych zastosowań.
Jeśli ta faza zakończyła się sukcesem (znaleziono kilka ciekawych sposobów na przyspieszenie zadań) to wydarzyły się dwie rzeczy:
znaleziono potencjalnie opłacalny obszar wdrożenia GenAI
jeszcze nie wydano dużych pieniędzy na budowę i wdrożenie nowych systemów IT
Dlatego właśnie polecam często, żeby więcej czasu spędzić z ChatGPT, zanim zapadnie decyzja o większych inwestycjach lub wręcz przeciwnie. 20 dolarów miesięcznie od pracownika to nie są duże koszty, a kilka tygodni eksperymentów pokaże wszystkie możliwości i problemy związane z GenAI.
Jeśli ta faza nie zakończyła się sukcesem, warto sprawdzić z zewnętrznym partnerem lub wśród firm w podobnej branży w USA, czy aby na pewno coś nie zostało przeoczone. Jeśli nie, piszemy post-mortem i zamykamy temat na dłuższą chwilę.
Stworzenie wewnętrznej polityki AI
Na bazie warsztatów, eksperymentów, feedbacku od pracowników, obszaru pierwszych wdrożeń w tej fazie tworzy się następujące elementy wewnętrznej polityki AI:
wewnętrzny benchmark GenAI (mówiący o tym, co zdaniem firmy modele potrafią, czego nie potrafią) - szalenie ważny instrument pozwalający szybko zweryfikować, czy nowe modele cokolwiek zmieniają w podejściu do GenAI
obszary zaangażowania i obszary ryzyka - dokument określający, gdzie warto eksperymentować, a gdzie jest ryzyko, którego chcemy uniknąć - to powinno być jasne dla wszystkich pracowników skąd się to wzięło
wskaźniki technologiczne wymuszające reewaluację podejścia do tej technologii (np. pojawienie się nowego modelu o konkretnych własnościach)
inne, branżowo specyficzne rzeczy (np. odniesienie się do bałaganu w obrębie praw autorskich)
Nie musi to być korporacyjny dokument na 500 stron. Może być prezentacja na 20 slajdów. Natomiast ważne jest, aby pracownicy mieli wrażenie, że to jest wiążący dokument (i na przykład nie marnowali czasu na budowanie czatbota dla klienta, jeśli polityka AI wyraźnie stwierdza, że ryzyko pomyłki w stylu Air Canada jest zbyt duże i na razie nie będzie inwestować w takie rozwiązania).
Określenie wskaźników biznesowych
Jest taki ciekawe zjawisko w badaniach naukowych prowadzonych z uczestnictwem ludzi, zwane efektem Hawthorna, gdzie mierzona wartość zmienia się zgodnie z oczekiwaniami wyłącznie dlatego, że ludzie wiedzą, że uczestniczą w eksperymencie (interpretacje dlaczego tak się dzieje zostawmy na boku - to wcale nie jest takie oczywiste).
W praktyce oznacza to, że jeśli firma zdecyduje się mierzyć efekty GenAI i wprowadzi jakieś wskaźniki, żeby zmierzyć czy implementacja poprawiła określone procesy, to prawdopodobnie przekona się, że poprawiła.
Określenie, czy implementacja GenAI poprawiła coś biznesowo jest konieczne, ale doświadczenie pokazuje, że ze wskaźników ilościowych najlepsze są wskaźniki wysokopoziomowe (skorygowany o naturalną zmienność przychód, stan zatrudnienia itp.), a ze wskaźników jakościowych, anonimowy feedback pracowników.
Szybkie cykle
I dopiero na ostatnim etapie firma jest przygotowana, żeby w miarę samodzielnie (bez zależności od konkretnego partnera biznesowego i bez zależności od konkretnego rozwiązania technologicznego) podejść do tematu generatywnej sztucznej inteligencji. Ta gotowość wyrażać się będzie w kompetencjach do szybkiej ewaluacji i ewentualnego wdrożenia nowych narzędzi, których pojawia się na rynku cała masa każdego dnia.
Ciekawe niusy
W tym tygodniu modele językowe miały mnóstwo uaktualnień:
GPT-4 dostał kolejną aktualizację, pierwszy feedback i wyniki benchmarków mówią: znowu spory skok
Command-R + (tak brzmi nazwa modelu) od Cohere został udostępniony do lokalnej instalacji
Gemini Pro dostępne w 180 krajach (oczywiście nie w Europie)
Mistral udostępnił nowy model na otwartej licencji
To co robią francuskie firmy Cohere i Mistral jest warte wzięcia pod uwagę przy rozważaniu kwestii związanych z bezpieczeństwem danych. Mac Studio w najwyższej konfiguracji uruchomi modele obu firm z dość przyzwoitą prędkością bez dostępu do internetu. Już wskazywałem wcześniej, że niedługo powinny pojawić się na polskim rynku firmy, które będą oferować gotowe pudełka z GenAI w środku.
W niektórych przypadkach to może być lepsze rozwiązanie od ChatGPT, zwłaszcza, że modele uruchamiane lokalnie oferują dużo więcej możliwości kontroli (np. precyzyjne odtworzenie stylu).