В периода 11 – 16 май 2026 г. в Палма де Майорка, Испания, се проведе петнадесетото издание на конференцията Language Resources and Evaluation (LREC 2026) — водещ международен форум в областта на езиковите ресурси и обработката на естествен език, организиран от Европейската асоциация за езикови ресурси (ELRA).
Гл. ас. д-р Ивелина Стоянова от Секцията по компютърна лингвистика на Института за български език представи три колективни доклада върху различни резултати от работата по проекта.
На 11 май 2026 г. в рамките на 12-ия уъркшоп Challenges in the Management of Large Corpora (CMLC-12), организиран в рамките на LREC 2026, бяха представени две разработки на Светла Коева и Ивелина Стоянова.
Презентацията на тема IfGPT, a Large Dataset Representing Bulgarian, with the Bulgarian National Corpus as Its Core запозна международната аудитория с мащабния набор от данни, разработван в проекта IfGPT.
Беше представен и постер на тема Recent Developments of the Bulgarian National Corpus, който очерта най-новите развития на Българския национален корпус — едно от водещите езикови ресурси за българския език, поддържан и развиван в Секцията по компютърна лингвистика на Института за български език.
В основната програма на LREC 2026 беше представен постер на тема Bulgarian Massive Multitask Language Understanding Benchmark — съвместна разработка на авторски колектив в състав Светла Коева, Ивелина Стоянова, Димитър Георгиев, Светлозара Лесева, Валентина Стефанова, Мария Тодорова, Цветана Димитрова, Христина Кукова, Михаела Москова и Тинко Тинчев. Постерът е съпътстван и от видеопрезентация. Разработката представя ресурса MMLU-BG – български бенчмарк за оценка на общи познания при големи езикови модели, изготвен в рамките на проекта IfGPT.
Представените разработки предизвикаха дискусии предвид актуалността на темата за оценяване на езиковите модели при езици с ограничени ресурси като българския.