Сайт о сети интернет

Дезинформация в сети

Мы живем в эпоху слишком большого количества информации — бесконечный поток обновлений статуса, мемов, репостов, инфографики, цитат и хэштегов ежедневно прокручивается в наших социальных сетях, предназначенных для выражения точек зрения, усиления солидарности, предоставления информации, изменения мнения или причины.

Проблема в том, что у обычного интернет-браузера или пользователя социальных сетей нет времени или средств для изучения происхождения всего, что появляется в его каналах. И именно эту уязвимость используют менее скрупулезные генераторы контента для распространения дезинформации, результаты которой могут варьироваться от небольшого конфуза, до прямо изменяющих жизнь или потенциально смертельных последствий.

Для ученого из Калифорнийского университета в Санта-Барбаре Уильяма Вана этот хаотичное «болото» является плодородной почвой для исследований. Ван считает, что методы глубокого обучения, когда они развернуты в сети текстовых и гиперссылок онлайн-постов и новостных статей, могут помочь нам в тяжелом подъеме критического мышления. «Таким образом, вопрос — как вы сможете понять, является пост вводящим в заблуждение или это подлинный пост?» — сказал Ван. Это сложный вопрос, особенно на арене социальных сетей, которые выровняли игровое поле между законными, авторитетными новостными сайтами и сомнительными сайтами, которые делают все возможное, чтобы выглядеть официально, или апеллировать к эмоциям пользователя, прежде чем те смогут задать вопрос по источнику их информации.

Тем не менее, благодаря обработке естественного языка, текст в этих постах и ​​статьях может использоваться для раскрытия информации об их создателях и пропагандистах, таких как их принадлежность, идеологии и стимулы для публикации, а также кто является их целевой аудиторией. Алгоритм просматривает миллионы новостных статей, размещенных анонимными пользователями на таких платформах, как Twitter и Reddit, и анализирует заголовки, контент и ссылки статей. Цель состоит в том, чтобы получить представление не только о том, кто стоит за конкретной дезинформацией, но и о моделях распространения дезинформации по сети.

«Многие из нас принимают веб-сайты как должное и случайно ретвитят или публикуют дезинформацию, и именно так она распространяется» — сказал Ван. Он и его команда предложили механизм обучения, который позволяет понять, почему некоторые истории помещаются в репосты или ретвитируются в дополнение к тому, является ли сам контент истинным или ложным. По пути, по словам Вана, они могут выяснить, кто вовлечен в распространение дезинформации и какие закономерности могут возникнуть в этом процессе. Изображения также станут частью набора данных, добавил он.

Позже, исследователи планируют объединить другие аспекты своей работы с дезинформацией, например, кликбэйт, который использует броские, часто сенсационные заголовки, чтобы заманить читателей, нажав на ссылку, которая в лучшем случае отправляет их на изворотливый сайт. «Clickbait в основном это статьи низкого качества, которые действительно могут содержать много дезинформации и ложной информации, потому что они должны преувеличивать», — сказал Ван. Команда разработала метод, называемый «усиленное совместное обучение», в котором используется эффективная система маркировки нескольких сотен статей, которые затем используются для обучения классификатора машинного обучения, чтобы маркировать то, что, по его мнению, может быть приманкой для кликов в огромном количестве.

«Затем мы берем эти новые маркированные экземпляры и переобучаем классификатор», — сказал Ван. «Этот итеративный процесс позволяет нам со временем собирать больше данных о метках», — добавил он, что уточняет точность инструмента. Использование искусственного интеллекта для понимания и поиска закономерностей в массе текста, которую мы посылаем друг другу каждый день, поможет нам понять, как мы намеренно или невольно распространяем дезинформацию. «Это действительно прелесть обработки естественного языка и машинного обучения». «У нас огромное количество данных в разных форматах, и вопрос заключается в следующем: как превратить неструктурированные данные в структурированные знания? Это одна из целей глубокого обучения и науки о данных».

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

18 − 1 =