Описание на данните в колекцията от текстове IfGPT: история на версиите

IfGPT Dataset version 0.1 (2025-07-15)

Пилотна версия с малък набор текстове и ограничени функции.

Метаданните се съхраняват във формат JSON.


IfGPT Dataset version 0.2 (2025-09-15)
TRL 4

  • MARCELL (25 хил. текста и 45 млн. токъна),
  • CURLICAT (113 хил. текста и 35 млн. токъна),
  • Административен корпус на БНК (17 хил. текста и 79 млн. токъна),
  • Уикипедия статии от БНК (89 хил. текста и 41 млн. токъна),
  • Субтитри от БНК (146 хил. текста и 27 млн. токъна).

Метаданните са в графова база данни.

Събрана е обратна връзка от реални потребители.


IfGPT Dataset version 1.0 Open Beta (2026-05-15)
TRL 7

Разширен набор от текстове.

Метаданните са в графова база данни.

Възможности за обратна връзка от потребители.

Проследяване на статистики за употребата.


Към страницата на Големия набор от данни IfGPT