
Rozwój narodowych systemów sztucznej inteligencji staje się coraz bardziej dynamiczny. Swoje modele językowe posiadają już nie tylko Amerykanie (np. Gemini), ale też Chiny (Ernie), Niemcy (EleutherAI), Francja (Bloom), Szwecja czy Finlandia. W tym roku do tego grona dołączyła również Polska – z modelem PLLuM. Nie jest to jednak pierwsza próba stworzenia AI w języku polskim. Rozwój modeli językowych w Polsce datuje się na 2020 rok. Wtedy to polska lingwistyka komputerowa stworzyła Polbert, który wykorzystywano głównie do analizy tekstów, tłumaczeń i automatycznej klasyfikacji treści. Rosnące zapotrzebowanie na bardziej zaawansowane narzędzia zdolne do generowania treści i rozumienia kontekstu skłoniło jednak polskie instytucje badawcze i technologiczne do opracowania bardziej zaawansowanego i większego modelu językowego – PLLuM.
PLLuM – co to jest?
PLLuM (Polish Large Language Model) to polski model językowy AI. Prace nad nim rozpoczęły się w styczniu 2024 roku i formalnie zakończyły 31 grudnia tego samego roku. Obecnie model jest gotowy do wdrożenia, a jego implementacja w usługach administracji publicznej, takich jak aplikacja mObywatel, planowana jest na 2025 rok.
Zdj.1 .Premiera PLLuM – polskiego modelu językowego AI miała miejsce w 2025 roku. Źródło: www.linkedin.com
AI w języku polskim kosztowało 14,5 mln zł, a kolejne 19 mln zł ma zostać wydane na jego wdrożenie. Współpracowało nad nim sześć wiodących polskich instytucji naukowych. Inicjatorem projektu było Ministerstwo Cyfryzacji, a realizację projektu wspierały NASK, Centralny Ośrodek Informatyki (COI), Akademickie Centrum Komputerowe CYFRONET AGH, Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB) oraz inne jednostki badawcze.
Zdj. 2. PLLuM to polski model językowy AI, który swoją premierę miał w 2025 roku. Źródło: pllum.org.pl
Jak działa polski model językowy AI?
PLLuM opiera się na zaawansowanej architekturze transformera, która jest fundamentem współczesnych modeli językowych. W ramach projektu stworzono rodzinę modeli o różnej liczbie parametrów – od 7 do 70 miliardów, co pozwala na elastyczne dostosowanie narzędzi AI do specyficznych potrzeb różnych grup użytkowników. Innowacyjnym elementem PLLuM jest zastosowanie nowoczesnych technik tokenizacji, które skutecznie radzą sobie z morfologiczną złożonością języków słowiańskich, takich jak polski.
Chcesz w pełni wykorzystać potencjał sztucznej inteligencji w swojej strategii marketingowej?
Aby zapewnić wysoką jakość i precyzję modelu, zebrano korpus treningowy obejmujący 100 miliardów słów. Dane te pochodzą z różnorodnych źródeł, takich jak teksty literackie, dokumenty urzędowe oraz zasoby instytucji naukowych. Ważnym aspektem było organiczne pozyskiwanie danych, bez generowania treści syntetycznych, co zwiększa ich wartość i wiarygodność. Proces zbierania danych odbywał się zgodnie z obowiązującymi normami prawnymi i etycznymi, przy współpracy z wydawcami, instytucjami kultury oraz jednostkami publicznymi.
Zdj. 3. Proces pozyskiwania danych do sztucznej inteligencji w języku polskim odbywał się etycznie i z poszanowaniem prawa. Źródło: platforma X
Jakie są zastosowania PLLuM?
Twórcy polskiego modelu AI przekonują o szerokich zastosowaniach PLLuM. Ma on być przydatny zarówno w sektorze publicznym, jak i prywatnym. W tym pierwszym będzie wspierał cyfryzację usług, umożliwiając tworzenie inteligentnych asystentów oraz chatbotów, które ułatwią komunikację między obywatelami a urzędami.
Polski model językowy AI ma znaleźć również zastosowanie w edukacji. Według zapowiedzi ma stać się narzędziem zarówno dla nauczycieli, jak i uczniów, umożliwiając lepsze wykorzystanie nowoczesnych technologii w nauczaniu. Jego przykładowe zastosowanie to np. automatyczne sprawdzanie tekstów pod kątem poprawności gramatycznej, ortograficznej czy stylistycznej, wspieranie tłumaczeń i analiz literackich, pomoc w tworzeniu interaktywnych materiałów edukacyjnych.
Zdj. 4. PLLum ma znaleźć zastosowanie w administracji publicznej, edukacji, biznesie, marketingu, obsłudze klienta. Źródło: pllum.org.pl
Z PLLuM korzystać będzie mógł również biznes. AI w języku polskim umożliwi firmom analizowanie danych czy automatyzację obsługi klienta – co ważne, w języku polskim. Biznes może również wykorzystać PLLuM w marketingu. Model ten ma potencjał do tworzenia spersonalizowanych treści marketingowych, takich jak e-maile, posty na media społecznościowe czy opisy produktów, które będą idealnie dopasowane do oczekiwań polskojęzycznych klientów. Dzięki zaawansowanej analizie tekstu PLLuM może również wspierać firmy w analizie opinii konsumentów, monitorowaniu trendów rynkowych czy generowaniu raportów na podstawie danych zebranych z mediów społecznościowych i innych źródeł. Automatyzacja takich procesów pozwala na szybsze podejmowanie decyzji, lepsze dostosowanie oferty do potrzeb klientów oraz zwiększenie efektywności działań marketingowych.
Przeczytaj też: Nowości w AI – podkręć temperaturę swojego komunikatu
Czy Polski model językowy AI podbije świat?
Choć PLLuM stanowi ogromny krok w rozwoju narodowych modeli językowych, to nie jest wolny od wad, które mogą wpłynąć na jego funkcjonowanie i użyteczność. Jego największym mankamentem jest to, że nie ma dostępu do internetu. W praktyce oznacza to, że jest on uzależniony od danych treningowych, a te pochodzą z okresu od 1 stycznia 2010 do 1 lipca 2024 roku. Oznacza to, że PLLuM nie udzieli Ci informacji na temat aktualnych wydarzeń w Polsce czy na świecie. Sprawia to, że pierwsze recenzje, jakie PLLuM zbiera na platformie X czy LinkedIn, nie są optymistyczne. Wiele osób wskazuje błędy w podawaniu podstawowych, ale najnowszych informacji.
Zdj. 5. Recenzja PLLuM na portalu LinkedIn. Źródło: www.linkedin.com
Mimo to, AI w języku polskim ma już za sobą pierwsze wdrożenia w biznesie – z rozwiązania korzysta m.in. polska firma Comarch.
Zdj. 6. Pierwszą firmą, która wdrożyła AI w języku polskim, jest Comarch. Źródło: www.comarch.pl
Czy PLLuM zastąpi inne modele AI? Podsumowanie
Model PLLuM, choć jest przełomowym krokiem w rozwoju sztucznej inteligencji w Polsce, nie jest zaprojektowany z myślą o „zastąpieniu” innych modeli AI, takich jak ChatGPT. Zamiast tego, jego celem jest dostarczenie narzędzia opartego na języku polskim, które będzie lepiej rozumieć i przetwarzać teksty oraz interakcje w naszym rodzimym języku. Niemniej jednak warto przyjrzeć się, jak wypada porównanie PLLuM vs. ChatGPT.
Zdj. 7. Porównanie odpowiedzi PLLuM vs. ChatGPT na pytania o bieżące wydarzenia w Polsce. Źródło: PLLum, ChatGPT.
Podsumowując – PLLuM to model, który skupia się na polskim języku, oferując bardziej precyzyjne rozumienie i przetwarzanie tekstów w kontekście lokalnym. Dzięki temu jest lepszy w analizie polskich idiomów, tłumaczeniach i klasyfikacjach tekstów, które wymagają głębszej znajomości naszego języka i kultury. ChatGPT, mimo że obsługuje wiele języków (w tym polski) jest bardziej uniwersalny. Sprawia to, że zastosowanie ChatGPT w marketingu jest o wiele szersze. Dzięki temu, że ma on dostęp do internetu może dostarczać na bieżąco najnowsze informacje i aktualności, co czyni go wyjątkowym narzędziem do analizy trendów rynkowych i tworzenia treści zgodnych z aktualnymi wydarzeniami. Dzięki tej funkcji ChatGPT może wspierać marketing w tworzeniu kampanii, które odpowiadają na bieżące potrzeby i zainteresowania konsumentów. Może także łatwiej dostosować treści do zmieniających się oczekiwań odbiorców, dzięki ciągłemu monitorowaniu trendów w wyszukiwaniach, mediach społecznościowych i innych źródłach internetowych.