РАЗРАБОТКА И ВНЕДРЕНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ РАСПРОСТРАНЕНИЯ ФЕЙКОВЫХ НОВОСТЕЙ

Лесов Рафхат Узакбайулы; Алимкулова Джанна Рыскуловна

Authors

Лесов Рафхат Узакбайулы Магистрант, Университет Туран, г. Алматы, Казахстан
Алимкулова Джанна Рыскуловна Научный руководитель, к.т.н., профессор, Университет Туран, г. Алматы, Казахстан

Keywords:

фейковые новости, дезинформация, машинное обучение, TF-IDF, LightGBM, стилометрия, SHAP, казахстанское медиапространство, верификация информации

Abstract

В статье представлены результаты разработки и экспериментальной верификации метода автоматического выявления фейковых новостей на основе технологий искусственного интеллекта применительно к русскоязычному медиапространству Казахстана. Предложена модульная архитектура системы, объединяющая многоэтапный конвейер предобработки текстов (токенизация, лемматизация посредством pymorphy2), TF-IDF-векторизацию с биграммами, авторский набор из 12 стилометрических признаков и классификатор на базе алгоритма LightGBM с байесовской оптимизацией гиперпараметров. Для обеспечения интерпретируемости решений применён механизм SHAP-анализа. По результатам экспериментальной оценки система достигла Accuracy = 0,898, F1-score = 0,897, ROC-AUC = 0,956 на тестовой выборке и Accuracy = 0,877 при апробации на 150 реальных казахстанских новостных материалах, при времени инференса менее 60 мс. Обоснован принцип разумной достаточности при выборе метода классификации, позволяющий достичь практически применимого качества без использования тяжёлых трансформерных архитектур

РАЗРАБОТКА И ВНЕДРЕНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ РАСПРОСТРАНЕНИЯ ФЕЙКОВЫХ НОВОСТЕЙ

Authors

Keywords:

Abstract

Published

How to Cite

Issue

Section

License