РАЗРАБОТКА И ВНЕДРЕНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ РАСПРОСТРАНЕНИЯ ФЕЙКОВЫХ НОВОСТЕЙ
Keywords:
фейковые новости, дезинформация, машинное обучение, TF-IDF, LightGBM, стилометрия, SHAP, казахстанское медиапространство, верификация информацииAbstract
В статье представлены результаты разработки и экспериментальной верификации метода автоматического выявления фейковых новостей на основе технологий искусственного интеллекта применительно к русскоязычному медиапространству Казахстана. Предложена модульная архитектура системы, объединяющая многоэтапный конвейер предобработки текстов (токенизация, лемматизация посредством pymorphy2), TF-IDF-векторизацию с биграммами, авторский набор из 12 стилометрических признаков и классификатор на базе алгоритма LightGBM с байесовской оптимизацией гиперпараметров. Для обеспечения интерпретируемости решений применён механизм SHAP-анализа. По результатам экспериментальной оценки система достигла Accuracy = 0,898, F1-score = 0,897, ROC-AUC = 0,956 на тестовой выборке и Accuracy = 0,877 при апробации на 150 реальных казахстанских новостных материалах, при времени инференса менее 60 мс. Обоснован принцип разумной достаточности при выборе метода классификации, позволяющий достичь практически применимого качества без использования тяжёлых трансформерных архитектур
Published
How to Cite
Issue
Section
License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.