Подбор и предварителна обработка на големи данни за български, както и на специфични за дадена компания или индустрия данни и фина настройка на подходящи свободно достъпни големи езикови модели за решаване на конкретни задачи.
Оценка и подбор на свободни за употреба големи езикови модели, които отговарят на предварително зададените критерии за предназначение и начин на работа.
Разработване на компонент от Инфраструктурата, предназначен за колекциониране, филтриране, анонимизиране и редупликиране на големи разнообразни и качествени текстови данни за български език.
Разработване на компонент от Инфраструктурата, предназначен за фина настройка на предварително обучени големи езикови модели за български език.
Разработване на компонент от Инфраструктурата и протокол за оценка на фината настройка за български език на големи езикови модели.
Достигане до ниво на технологична готовност 7 на Инфраструктурата за фина настройка на предварително обучени големи езикови модели.
Свободен достъп до резултатите от проекта за представителите на бизнеса, академичната общност и широката общественост.
Резултати
Големи езикови модели
Описание на съществуващи големи езикови модели с оглед на техните функционалности и приложимост за български език.
Данни
Описание на голям набор от чисти текстови данни без повторения на съдържание за целите на фината настройка.
Документация
Документация на инструменти за използване на големи езикови модели и за тестване и оценка на фината настройка.