Исследователи из Новосибирского государственного университета представили универсальный математический метод для выявления плагиата и идентификации авторского стиля. По информации пресс-службы НГУ, распространённой ТАСС, система способна одинаково эффективно работать с текстами на русском, английском, китайском и эфиопском (амхарском) языках.
В основе разработки лежит статистический анализ текста. Учёным удалось вычислить минимальный объём данных, необходимый для достоверного распознавания уникального «почерка» автора. Этот подход позволяет сравнивать даже столь различные системы письма, как кириллица и иероглифы.
Автор метода, профессор НГУ Борис Рябко, пояснил, что одна из ключевых практических областей его применения — оценка качества машинного перевода. Другая важная задача — определение фрагментов текста, написанных разными авторами, в том числе выявление частей, сгенерированных искусственным интеллектом.
Как отметил Рябко, разработка особенно востребована в образовательной среде — вузах и школах, где ведётся борьба с плагиатом в учебных работах. Кроме того, система позволяет давать количественную оценку качеству перевода: чем точнее он передаёт оригинальный авторский стиль, тем выше балл.
Разработка может использоваться для проверки квалификации переводчиков, анализа текстов на предмет заимствований и идентификации контента, созданного нейросетевыми алгоритмами.