Polish Large Language Model (PLLuM) to rodzina modeli AI tworzona z myślą o języku polskim i wykorzystaniu „polskiej AI” w sektorze publicznym i prywatnym. Wyróżnia się na tle innych modeli językowych tym, że dostosowana jest do specyfiki języka polskiego oraz terminologii rodzimej administracji publicznej.
W procesie jego tworzenia stosuje się kompleksowe procedury gromadzenia danych i oceny ich jakości. Polski model językowy bazuje na etycznym pozyskiwaniu danych i przede wszystkim korzysta z danych organicznych – opracowywanych ręcznie, a nie przy użyciu innych modeli językowych. „Trenowany” na polskich zasobach, bardzo dobrze radzi sobie z wyzwaniami fleksji i złożonej składni, generując precyzyjne treści.
Wielkie modele językowe to jedna z najbardziej spektakularnych odsłon rozwoju generatywnej sztucznej inteligencji. Dzięki projektom takim jak PLLuM, nie tylko realizujemy zadania zlecane nam przez administrację rządową, ale też w zawrotnym tempie uczymy się naukowych i praktycznych podstaw budowy tej technologii
– mówi dr hab. Piotr Pęzik, prof. UŁ, z Wydziału Filologicznego, kierujący zespołem naukowców UniLodz w projekcie PLLuM.
Rozwój PLLuM to szansa na wzmocnienie konkurencyjności Polski w sektorze IT i całej gospodarce. Inwestycje w sztuczną inteligencję przyczyniają się do powstawania nowych firm i produktów opartych na AI, napędzając wzrost gospodarczy. Wykorzystanie PLLuM w różnych obszarach – od edukacji i administracji po sektor prywatny – sprzyja tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI.
Współtworząc nowy wariant PLLuM, koncentrujemy się na wykorzystaniu dużych, legalnie pozyskanych i odpowiedzialnie opracowanych zasobów językowych. Takich, które nie naruszają praw autorskich i spełniają najwyższe standardy jakości. To właśnie transparentne dane i kompetencje rozwijane w Polsce sprzyjają suwerenności technologicznej. Jeśli chcemy, by PLLuM realnie wzmacniał polski sektor publiczny i prywatny, musimy mieć kontrolę nad tym, na jakich danych i zasadach jest budowany
– podkreśla dr hab. Piotr Pęzik, prof. UŁ.
Rozwój PLLuM koordynowany i finansowany był przez Ministerstwo Cyfryzacji, które zleciło realizację tego projektu, m.in. z myślą o roli wirtualnego asystenta aplikacji mObywatel, wspierającej obywatelki i obywateli RP w uzyskiwaniu informacji publicznych. Rozwój kompetencji językowych modelu to zadanie naukowców, IBM zaś dostarcza model bazowy i kompetencje technologię.
Materiał: IBM, UniLodz
Redakcja: Biuro Prasowe UŁ
