Klucz do efektywnego instruowania modeli językowych
Czym jest wiedza utajona (niejawna)?
Wiedza niejawna (ang. tacit knowledge) to termin oryginalnie wprowadzony do filozofii nauki przez Polanyiego, który potem został zaadoptowany przez biznes w kontekście zarządzania wiedzą. Do wiedzy niejawnej zalicza się m.in. całe “know-how”, które jej w firmie. Współczesne podejście postrzega ten koncept jako pewne spektrum - od wiedzy łatwo wyrażalnej do trudno uchwytnej, silnie zależnej od kontekstu i środowiska (w tym sensie, że nie ma jasnej granicy co jest a co nie jest wiedzą utajoną). Obejmuje zarówno wymiar osobisty, jak i społeczny - odzwierciedla zarówno indywidualne umiejętności jak i normy kulturowe.
Wiedza niejawna to nie tylko rzeczy, które są z natury trudne do przekazania (np. intuicja rynkowa), ale także rzeczy, których formalnie nie skodyfikowano, mimo tego, że jest to możliwe (np. proces oceny ryzyka).
Nieszczęsna inżynieria promptów
Od dłuższego czasu nabijam się z dominującego podejścia do pisania instrukcji dla modeli językowych. Optymalizowanie instrukcji z pomocą trików takich jak “dam ci stówę”, “jak nie zrobisz tego dobrze, wylecisz z pracy”, “myśl krok po kroku” i wielu innych ma niestety ograniczony termin przydatności do spożycia. Mocno zoptymalizowane instrukcje:
zabierają dużo czasu, żeby je odpowiednio skalibrować
są niestabilne, tj. często przestają działać pomiędzy wersjami modeli, co za tym idzie, wymagają nakładów na utrzymanie
były kluczowe 2 lata temu, kiedy ogólny poziom umownych kompetencji modeli językowych był bardzo wrażliwy na jakość instrukcji, teraz nie mają już takiego znaczenia
Jednocześnie na rynku jest wielu konsultantów, którzy twierdzą (i mają na to dowody), że ich instrukcje świetnie działają. Dlaczego? W tych instrukcjach zawarta jest przede wszystkim wiedza biznesow nt. procesu, który ma przejść model językowy, a triki typu “bo wylecisz z pracy” są co najwyżej wisienką na torcie (albo czasem kwiatkiem do kożucha).
Czy jestem w stanie napisać dobrą instrukcję przygotowania planu rozwoju pracownika, albo pozwu rozwodowego? Absolutnie nie, nawet jak użyję setki trików i obiecam modelowi językowemu prezydenturę USA. Nie mam doświadczenia w procesach HRowych, ani w kwestiach prawniczych. Mogę podpowiedzieć jak to zrobić, czy pomóc w procesie jako konsultant (więcej o tym poniżej), ale nie zastąpię eksperta z danej dziedziny.
Instrukcja dla AI jako SOP
SOP (Standard Operating Procedure) to udokumentowany, szczegółowy zestaw instrukcji opisujących, jak wykonać określone zadanie lub proces w organizacji. SOPy zapewniają zgodność z najlepszymi (i dostępnymi) praktykami, minimalizując jednocześnie ryzyko błędów i nieporozumień. Takie dokumenty to przechwycona wiedza niejawna.
SOPy, nawet w dużych firmach, nie są generyczne. Są dostosowane do specyfiki organizacji. Odzwierciedlają “jak my to robimy”, a nie “jak wszyscy to robią”.
Jeśli SOP dotyczy rozwiązania otwartego problemu (np. zaproponowania planu rozwoju pracownika, albo harmonogramu projektu, albo zaopiekowania reklamacji klienta), tj. problemu dla którego istnieje więcej niż jedno dobre rozwiązanie, to jest to prawie gotowa instrukcja dla AI. Spekulatywny charakter technologii nie przeszkadza (bo to otwarty problem), a pierwszy szkic, czyli wygenerowany zgodnie z taką instrukcją tekst, będzie zawierał większość istotnych szczegółów.
Skąd wziąć SOPy?
Pracownicy często doskonale znają swoje procesy, ale przekształcenie tej wiedzy w formalne, strukturyzowane procedury nie jest łatwe i w dodatku ma niski priorytet. Poza tym, część ekspertów tworzenie procedur uważa za dewaluację ich wieloletniego doświadczenia oraz boi się, że utraci kontrolę nad procesami, które do tej pory były ich domeną.
Ale bez SOPów nie da się efektywnie instruować modeli językowych (a co za tym idzie przyspieszyć pracy z pomocą AI). Co zrobić?
Jest kilka opcji:
Można wykorzystać autopromptowanie, tj. poprosić AI o wygenerowanie instrukcji, zadanie pytań i wygenerowanie ulepszonej instrukcji. Pokazałem to na konkretnym przykładzie omawiając metakompetencję zadawania pytań. Ostateczna instrukcja i tak będzie pewnie do poprawy i uzupełnienia, ale łatwiej edytować istniejący szkic, niż opisać samemu od zera.
Można poprosić danego eksperta, żeby przy kimś innym z danej firmy opisał po kolei kroki wykonania danej procedury, nagrać całość, zrobić transkrypcję i poinstruować model językowy, żeby przeanalizował tekst (m.in. pod kątem ew. niespójności, lub skoków myślowych) i na jego podstawie wygenerował taką instrukcję.
Można zatrudnić konsultanta, który ma doświadczenie w AI i kodyfikacji procesów biznesowych. Pewnie jakość instrukcji będzie trochę lepsza niż dla pkt. 2, ale taki konsultant wnosi też wiedzę, które procesy warto w ogóle opisywać (priorytetyzacja pod kątem technologii i wartości biznesowej). Z moich rozmów z ludźmi na polskim rynku usług “usprawniam z AI” wyłania się dość optymistyczny obraz, bo jest sporo osób, które mają kompetencje “biznes+tech”, a nie tylko “tech”. “Nie jesteś samaaaaaa…” jak śpiewał Seweryn Krajewski.
Podejrzewam, że za jakiś czas dostępna będzie opcja, żeby gotowe SOPy/instrukcje kupować/wypożyczać do dostosowywania od najlepszych ekspertów od tego procesu biznesowego (trzeba uważnie patrzeć na Microsoft). Ale póki co, nie wstrzymujcie oddechu.
Czego nie warto robić? Kupować gotowych promptów, bo 1.) nie pozwalasz swojej organizacji nabywać kluczowych kompetencji oraz 2.) nie rozumiesz, dlaczego dana instrukcja działa (albo nie działa) w Twoim przypadku.
Praca się zmienia
Do ciekawych wniosków doszliśmy w niedawnej dyskusji z Katarzyną Lorenc (z którą przygotowuję szkolenie z AI w HR) - w wielu obszarach sztuczna inteligencja zmienia pracowników z “twórców” w “kontrolerów jakości”. Niech będzie to na przykład programista, który do tej pory pisał kod ręcznie, teraz instruuje odpowiedni program i jego praca skupia się wyłącznie na kontroli, czy proces idzie w dobrym kierunku oraz na ewentualnej akceptacji/odrzuceniu wyników działania AI. Albo ekspert HR, który poprawia i klaryfikuje ocenę roczną pracownika wygenerowaną przez AI na podstawie ocen cząstkowych, opinii przełożonych oraz wytycznych firmy.
Wielu osobom taka sytuacja jest na rękę, bo ułatwia przesunięcie się w górę krzywej generowanej wartości. Tak jak niektóre maszynistki nauczyły się obsługi komputera, kalendarza, zarządzania listą zadań i zmieniły się w asystentki.
Dla innych jest to atak na ich poczucie własnej wartości. Nie dość, że AI zabiera im satysfakcję z dobrze wykonanej pracy, to jeszcze kodyfikacja wiedzy niejawnej odbiera im istotę ich ekspertyzy.
Tyle tylko, że sztuczna inteligencja, jak każda technologia operująca na wiedzy, jest siłą, która będzie transformowała firmy w stronę obsługi coraz bardziej złożonych procesów. Nie widać odwrotu od tego trendu, co najwyżej zmienia się tempo zmian. Im szybciej firmy podejdą do tematu wiedzy utajonej na poważnie, tym łatwiej im będzie przystosować się do nadchodzącej rzeczywistości.
Ciekawe niusy
Cursor, jedno z AI-owych narzędzi dla programistów, przeżywa “drugą młodość” (śmiesznie to brzmi jak na narzędzie, które ma ok. 1.5 roku), po tym jak ktoś udostępnił wideo ośmiolatki, która z pomocą tego narzędzia zbudowała funkcjonalną aplikację. Wiralowe wideo spowodowało gigantyczne zainteresowanie Cursorem. Ale programiści bawią się jeszcze ciekawiej, bo niektórym znudziło się kompletnie “pisanie” na klawiaturze i spięli Cursora z rozpoznawaniem mowy - na tym wideo Wrigley tworzy aplikację typu “dashboard” dla danych finansowych używając tylko skrótów Ctrl-C, Ctrl-V oraz swojego głosu.
Interfejs głosowy wciąż jest mało używany i “user experience” wciąż pozostawia wiele do życzenia. Ale widać na tych eksperymentach powiew przyszłości.
Przyszłości, w której potrzebować będziemy wszyscy jednoosobowych biur do pracy ;).