Original size 1024x1536

Сравнение реальных и фейковых статей

The project is taking part in the competition

В данном исследовании я разобрал датасет, включающий в себя 20000 англоязычных новостных статей, одна половина которых описывает реальные события, а другая попадает под категорию так называемых «Fake news» — вымышленных новостей, созданных специально для ввода человека в заблуждение. В связи с огромным новостным шумом, который с каждым годом становится всё больше и больше и буквально формирует картинку мира каждого из нас, даже если мы и пытаемся минимизировать это влияние, мне стало интересно изучить природу новостей, насколько хорошо дезинформация мимикрирует под истину. Мне кажется, что навык критического мышления и оценки полученных сведений в достоверности очень важен в информационной эре, в которой находится человеческое общество прямо сейчас. Данный анализ ставит перед собой задачу показать, насколько легко спутать фейковую новость с настоящей, и как важно здраво подходить к тому, чтобы принимать на веру вещи, о которых люди узнают по первым выданным ссылкам в поисковом запросе.

Графики были стилизованы под внешний вид монохромных газетных изданий, чтобы подчеркнуть предмет моего анализа.

Original size 4150x3570

Original size 4772x2303

Original size 4770x2237

Original size 2085x2384

Original size 1785x1184

Вывод

Вывод, который получился после анализа статей, вышел для меня достаточно неожиданный. По моим ожиданиям я предполагал, что фейковые новости будут иметь гораздо больше экстремальных слов в своих заголовках и содержательных частях, и пики статей со лживой информацией будут приходиться на дни важных событий. Однако, к моему удивлению, фейковые статьи практически не отличаются ни по одному из пунктов с настоящими. Из этого можно сделать более печальный вывод, чем тот, что предполагался изначально: фейковые СМИ научились мимикрировать под СМИ реальные, что в теории поможет им гораздо эффективнее вводить в заблуждение читающих. Поэтому, мой вердикт — необходимо проверять информацию, полученную в интернете, не просто тщательно, а вдвойне более серьёзно, чем изначально люди привыкли это делать. Далеко не факт, что если статья написана грамотно, без перегибов и в более или менее авторитетном источнике, то её содержание имеет хоть что-то связанное с реальностью.

код для графиков

Описание применения генеративных нейросетей

Для создания кода, генерирующего графики по датасету, была применена генеративная нейросеть DeepSeek.

DeepSeek

Timofey Chukhraev

data visualization

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...