Pozdrowienia z przyszłości z Claude Sonnet 3.5

Nowa zabawka od firmy Anthropic

Jun 25, 2024

Nowe rozwiązania UX dla modeli językowych

Jest czerwiec 2024 i wciąż pod względem oprzyrządowania, czyli narzędzi wokół modeli generatywnej sztucznej inteligencji, firma OpenAI zdecydowanie wyprzedza pozostałych dostawców. Ma wbudowany interpreter kodu, możliwość tworzenia własnych asystentów, oraz tworzenie obrazów opisowo a nie przez słowa kluczowe czy parametry (np “- -sref 871236812 dla MidJourney).

Platforma Claude.ai od firmy Anthropic jest dużo uboższa w takie funkcjonalności, ale wraz z pojawieniem się nowego modelu Sonnet 3.5 (który po angielsku oraz w przypadku generowania kodu źródłowego jest lepszy niż GPT-4o) dodano bardzo ciekawą funkcjonalność, która nazywa się “artefakt”.

“Artefakt” to wbudowana w stronę przeglądarka, która wizualizuje kod HTML lub Markdown wygenerowany przez model językowy. De facto mamy możliwość tworzenia prostych, ale funkcjonalnych aplikacji lub wizualizacji (które kodowane są w językach JS/HTML, a nie przy pomocy GenAI, więc mają poprawny tekst itd.).

Pierwszy przykład: podałem plik z patentem na poduszkę elektromagnetyczną (m.in. do pociągów) i poprosiłem o infografikę przedstawiającą zastosowania tej technologii:

I otrzymałem:

Nie jest źle! Ikony do tekstu są dobrane dobrze, można się kłócić z merytoryką (poduszka elektromagnetyczna w ciężarówkach?), ale jako inspiracja lub do dalszej pracy super.

Zwróćcie uwagę, że odpowiedzi są po angielsku - tak jak wspomniałem wyżej, kompetencje modelu Sonnet 3.5 dostępne są głównie w języku angielskim.

Porównajmy z GPT-4 - ta sama instrukcja:

Stylistycznie świetnie, ale to nic nie ma wspólnego z instrukcją, a tekst jest oczywiście nieczytelny. To dlatego, że do wygenerowania tego obrazka użyty był model DALL-E (generatywny), który nie radzi sobie z tekstem.

Weźmy inny przykład. Kiedy w rozwoju osobistym celem jest identyfikacja głównych wartości wyznawanych przez daną osobę, podchodzi się do tego na dwa sposoby: albo przez deklarację - “najbardziej cenię X, Y i Z” (zły pomysł, odpowiedzi są aspiracyjne i nieprecyzyjne), albo przez eliminację - “spośród tej długiej listy wybieram 5”. Do tego drugiego sposobu potrzebna jest kartka z listą wartości i ołówek, specjalna aplikacja w sieci (znalazłem tylko jedną), lub… Claude Sonnet 3.5:

Efekt: w pełni interaktywna strona internetowa z licznikiem, pokazującym ile jeszcze muszę wykreślić:

(klikałem losowo, proszę się nie doszukiwać drugiego dna ;) )

Wygenerowane strony HTML można zapisać lokalnie, zachowując w pełni ich interaktywność. Jak ktoś chce się pobawić w edytowanie tego kodu, to ma taką możliwość.

Dlaczego to takie ważne?

Od dłuższego czasu w półświatku AI mówi się o tym, że proste “jednorazowe” aplikacje użytkownicy będą sobie generowali sami, bez pomocy programistów. “Jednorazowość” w tym kontekście oznacza “głównie dla jednego użytkownika”, czyli dla autora. Algorytmy GenAI potrafią już całkiem nieźle generować prosty kod źródłowy, a narzędzia takie jak Artefakt do Claude Sonnet 3.5 to pozdrowienia z przyszłości - prototyp opakowania dla tych aplikacji.

Już wkrótce pytania dotyczące danych czy ogólnie informacji, które da się obsłużyć z lokalnego komputera (np. poprzez API) będą realizowane na żądanie przez takie właśnie “jednorazowe” aplikacje. Wyobraźcie sobie takie scenariusze:

potrzebujecie wizualizacji głównych kategorii, w których ogłaszane są w Polsce przetargi (https://tenders.guru/ ma darmowe API)
potrzebujecie interaktywnego wykresu, na którym jest cena paliw na Orlenie vs cena ropy na świecie vs temperatura w Warszawie
potrzebujecie monitorować, czy na stronach firmy Lex nie ma nowych opinii prawnych w kontrowersyjnym temacie, który Was interesuje
chcecie sprawdzić jak się zmieniały trendy w ofertach pracy na stanowisku “dyrektor operacyjny” w Niemczech

Każdy taki przypadek da się zrobić na piechotę w skończonym czasie (jest w miarę prosty). Żaden z nich nie jest na tyle uniwersalny, żeby tworzyć dedykowany serwis i go utrzymywać. I zamiast delegować takie zadanie do młodszych stażem pracowników, już niedługo zlecicie to modelom GenAI, a te wygenerują kod prostej aplikacji, która zrobi dokładnie to, czego potrzebujecie.

Nie oznacza to, że wszyscy będą programistami. Oznacza to, że dostaniemy do ręki intuicyjne w obsłudze i bardzo zaawansowane kalkulatory.

Ciekawe niusy

Kilka dni temu pokazała się kolejna praca analizująca potencjalny wpływ generatywnej sztucznej inteligencji na rynek pracy (niestety, pełny dostęp wymaga opłaty). Jak ktoś korzysta z Twittera/X to tu jest link do wątku z podsumowaniem.

Autorzy wcale nie straszą totalną automatyzacją. Wręcz przeciwnie, większość zadań na rynku pracy nie ma wysokiej podatności na pełną automatyzację:

Ta podatność zależy oczywiście od dziedziny. Prawnicy, sprzątacze, “złote rączki” czy operatorzy maszyn będą spali spokojniej od programistów i naukowców. Ale mało kto będzie miał koszmary.

Autorzy zwracają również uwagę na to, że bardzo trudno jest ocenić wpływ GenAI na rynek pracy na tym etapie. I póki co wygląda na to, że rozszerzenie kompetencji pracowników dzięki współpracy z narzędziami GenAI (w zadaniach jak te przykładu opisane w głównej sekcji tego maila) będzie częstsze niż pełna automatyzacja i likwidacja stanowisk pracy.

AI w zasięgu biznesu

Discussion about this post