Она отмечает, что основная задача датасета – генерация краткого содержания. Ее слова передает пресс-служба университета.
Так, существующие системы способны генерировать краткое содержание на основе текста. Студентка предполагает, что графическая информация способна улучшить качество аннотаций.
Разработчиками были протестированы популярные языковые модели, такие как YandexGPT, GPT-3.5 Turbo и Gigachat.
Ранее «МК в Новосибирске» писал, что новосибирские ученые нашли способ очистки нефтяных скважин с помощью бактерий.