LLM w praktyce – case study z polskich firm

Jeszcze trzy lata temu rozmowa o wdrożeniu dużego modelu językowego w polskiej firmie brzmiała jak science fiction. Dziś to rzeczywistość dziesiątek przedsiębiorstw – od startupów po korporacje z wieloletnią historią. Zbadaliśmy kilka realnych wdrożeń, by pokazać, co naprawdę działa, ile kosztuje i jakie pułapki czyhają na tych, którzy ruszają bez planu.

Czym właściwie są LLM i dlaczego firmy po nie sięgają?

Large Language Models, czyli duże modele językowe, to systemy sztucznej inteligencji trenowane na ogromnych zbiorach tekstów. Potrafią rozumieć kontekst, generować treści, odpowiadać na pytania i automatyzować zadania wymagające przetwarzania języka naturalnego. Do najpopularniejszych należą modele z rodziny GPT (OpenAI), Claude (Anthropic), Gemini (Google) czy Mistral – ten ostatni szczególnie popularny w Europie ze względu na kwestie zgodności z RODO.

Polskie firmy sięgają po LLM przede wszystkim z trzech powodów: redukcji kosztów operacyjnych, przyspieszenia procesów i poprawy jakości obsługi klienta. Brzmi banalnie, ale diabeł tkwi w szczegółach wdrożenia.

Case study #1: Automatyzacja obsługi klienta w e-commerce – marka odzieżowa z Poznania

Średniej wielkości firma odzieżowa działająca online obsługiwała miesięcznie około 12 000 zapytań od klientów. Większość z nich dotyczyła statusu zamówień, rozmiarówki, polityki zwrotów i dostępności produktów. Zespół obsługi klienta liczył siedem osób i pracował w trybie dwuzmianowym.

W połowie 2024 roku firma zdecydowała się wdrożyć chatbota opartego na modelu GPT-4o, zintegrowanego z systemem ERP i bazą wiedzy zawierającą ponad 400 dokumentów wewnętrznych. Wdrożenie trwało osiem tygodni i kosztowało około 85 000 złotych (projekt, integracja, testy, szkolenia).

Efekty po 6 miesiącach:

72% zapytań obsługiwanych w pełni automatycznie, bez ingerencji człowieka
Czas pierwszej odpowiedzi skrócony z 4 godzin do poniżej 30 sekund
Zadowolenie klientów (CSAT) wzrosło z 3,8 do 4,3 na 5
Zespół obsługi klienta zredukowano do 4 osób, które zajmują się wyłącznie złożonymi przypadkami
Szacowane oszczędności roczne: 240 000 złotych brutto

Co ciekawe, firma nie zdecydowała się na całkowite zastąpienie ludzi. Jak mówi kierownik działu: „Model świetnie radzi sobie z typowymi pytaniami, ale przy reklamacjach emocjonalnych klientów nadal wolę mieć człowieka po drugiej stronie. To kwestia nie tylko skuteczności, ale i wizerunku marki."

Case study #2: Generowanie treści marketingowych – agencja digital z Warszawy

Warszawska agencja digital obsługująca kilkudziesięciu klientów borykała się z klasycznym problemem skalowalności: zamówień przybywało, ale tworzenie unikalnych treści SEO dla każdego klienta zajmowało nieproporcjonalnie dużo czasu copywriterów.

Agencja zbudowała wewnętrzne narzędzie oparte na Claude 3.5 Sonnet, które generuje pierwsze wersje artykułów blogowych, opisów produktów i postów na media społecznościowe. Kluczowym elementem było stworzenie rozbudowanego systemu promptów uwzględniającego tone of voice każdego klienta, wytyczne SEO oraz aktualne słowa kluczowe pobierane automatycznie z narzędzi analitycznych.

Model pracy po wdrożeniu:

Brief od klienta trafia do systemu
LLM generuje strukturę i pierwszy szkic treści (ok. 2 minuty)
Copywriter weryfikuje, edytuje i nadaje końcowy szlif (30–45 minut zamiast 3–4 godzin)
Treść przechodzi standardowy proces akceptacji klienta

Rezultat? Przepustowość działu content wzrosła o 340% przy tym samym zespole. Agencja mogła przyjąć nowych klientów bez zatrudniania dodatkowych copywriterów. Co ważne – właścicielka agencji podkreśla, że model nigdy nie publikuje treści bez przejrzenia przez człowieka: „LLM to nasz junior copywriter, który nigdy nie śpi i zawsze ma pomysły. Ale ostateczna odpowiedzialność za jakość jest po naszej stronie."

Case study #3: Analiza dokumentów prawnych – kancelaria z Krakowa

Krakowska kancelaria prawna specjalizująca się w prawie korporacyjnym mierzyła się z lawiną umów do analizy. Prawnicy spędzali znaczną część czasu na wstępnym przeglądaniu dokumentów – szukaniu klauzul ryzyka, niestandardowych zapisów, porównywaniu z wzorcami umów.

Wdrożono rozwiązanie oparte na modelu Mistral Large (hostowanym na europejskich serwerach, co było warunkiem koniecznym z perspektywy RODO i tajemnicy zawodowej) z rozbudowanym systemem RAG (Retrieval-Augmented Generation). System ma dostęp do bazy wzorcowych umów kancelarii, orzecznictwa i aktów prawnych.

Ważna uwaga: kancelaria zdecydowała się na wdrożenie on-premise, czyli model działa na własnych serwerach kancelarii. Koszt wdrożenia był wyższy (ok. 180 000 zł), ale dane klientów nigdy nie opuszczają infrastruktury firmy.

Konkretne zastosowania:

Automatyczne wyciąganie kluczowych klauzul z umów NDA, umów najmu, umów o pracę
Porównywanie nadesłanych umów z wzorcami i flagowanie odchyleń
Generowanie streszczeń dokumentów na potrzeby konsultacji z klientem
Wyszukiwanie precedensów w wewnętrznej bazie spraw

Czas wstępnej analizy 30-stronicowej umowy skrócił się z 2,5 godziny do 20 minut. Partner kancelarii zaznacza jednak wyraźnie: „To narzędzie wspierające, nie zastępujące. Każdy dokument i każda analiza podlegają weryfikacji prawnika. Ale teraz możemy obsłużyć więcej spraw bez rozbudowywania zespołu."

Case study #4: Wewnętrzny asystent wiedzy – producent przemysłowy z Łodzi

Łódzka firma produkcyjna zatrudniająca ponad 500 osób zmierzyła się z problemem rozproszenia wiedzy. Dokumentacja techniczna, procedury, instrukcje obsługi maszyn, historyczne raporty awarii – wszystko to było dostępne, ale trudne do szybkiego odnalezienia. Nowi pracownicy spędzali tygodnie na wdrożeniu, a doświadczeni często tracili czas na szukanie informacji.

Firma wdrożyła wewnętrzny chatbot oparty na architekturze RAG, który „czyta" całą dokumentację firmową (ponad 15 000 dokumentów) i odpowiada na pytania pracowników po polsku. System działa w intranecie firmy i jest dostępny przez przeglądarkę oraz aplikację mobilną.

Najczęstsze pytania do systemu:

„Jaka jest procedura przy awarii linii produkcyjnej nr 3?"
„Gdzie znajdę certyfikaty dla materiału X?"
„Jakie były przyczyny przestoju w lutym 2025 roku?"
„Kto jest odpowiedzialny za zamawianie części zamiennych do maszyny Y?"

Dane po roku użytkowania: ponad 8 000 zapytań miesięcznie, satysfakcja pracowników z narzędzia na poziomie 4,1/5, szacowany zwrot z inwestycji osiągnięty w 7 miesięcy. Dyrektor operacyjny szacuje, że system oszczędza przeciętnie 45 minut dziennie na pracownika operacyjnego.

Wspólne wnioski i pułapki, których warto unikać

Analizując te wdrożenia, można wyciągnąć kilka powtarzających się wniosków:

Co działa:

Jasne zdefiniowanie zakresu – najlepsze efekty dają wdrożenia skupione na konkretnym, dobrze opisanym problemie, nie próby stworzenia "asystenta do wszystkiego"
Człowiek w pętli – żadna z opisanych firm nie wyeliminowała całkowicie ludzkiego nadzoru; to świadoma decyzja, nie niedopatrzenie
Jakość danych wejściowych – im lepsza dokumentacja i baza wiedzy, tym lepszy model. "Garbage in, garbage out" obowiązuje podwójnie w przypadku LLM
Iteracyjne podejście – wszystkie firmy startowały od pilotów, zbierały feedback i stopniowo rozszerzały wdrożenie

Najczęstsze błędy:

Niedoszacowanie kosztów integracji – sam model to mniejsza część kosztu; prawdziwe wydatki kryją się w integracjach z istniejącymi systemami
Ignorowanie RODO – szczególnie przy używaniu zewnętrznych API, gdzie dane klientów mogą trafiać poza UE
Brak zarządzania zmianą – pracownicy, którzy boją się, że AI "zabierze im pracę", aktywnie sabotują wdrożenia lub nie korzystają z narzędzi
Halucynacje bez kontroli – LLM potrafią generować przekonująco brzmiące nieprawdy; bez mechanizmów weryfikacji może to prowadzić do poważnych błędów

Ile to kosztuje? Orientacyjny benchmark

Na podstawie zebranych danych możemy przedstawić orientacyjne widełki kosztów wdrożeń LLM dla polskich firm MŚP:

Proste wdrożenie chatbota (gotowe narzędzia, minimalna integracja): 15 000–40 000 zł + koszty operacyjne API (~500–3 000 zł/miesiąc)
Wdrożenie średniej złożoności (RAG, integracja z systemami, dostosowanie): 60 000–150 000 zł
Wdrożenie zaawansowane (on-premise, fine-tuning, rozbudowana integracja): 150 000–500 000 zł+

Co przyniesie przyszłość?

Rok 2025 i 2026 to czas dojrzewania rynku. Polskie firmy przestają pytać "czy wdrażać AI" i zaczynają pytać "jak wdrażać AI mądrze". Coraz więcej przedsiębiorstw szuka partnerów technologicznych, którzy rozumieją zarówno możliwości modeli językowych, jak i specyfikę polskiego rynku – przepisów, języka, realiów biznesowych.

Eksperci z branży wskazują, że kolejnym krokiem będzie upowszechnienie agentów AI – systemów, które nie tylko odpowiadają na pytania, ale samodzielnie wykonują złożone zadania, takie jak zamawianie towarów, umawianie spotkań czy przygotowywanie raportów. Kilka polskich firm już testuje takie rozwiązania.

Jedno jest pewne: LLM przestały być ciekawostką dla entuzjastów technologii. Stały się narzędziem biznesowym, które – wdrożone z głową – potrafi realnie zmieniać sposób działania firm. A polskie przedsiębiorstwa, jak widać z przedstawionych przykładów, coraz lepiej to rozumieją.

Artykuł powstał na podstawie rozmów z przedstawicielami firm oraz analizy dostępnych danych rynkowych. Nazwy firm zostały zmienione na prośbę rozmówców.

LLM w praktyce - case study z polskich firm