Полезные статьи о мире IT
ИИ может угадать, где живут пользователи Reddit и сколько они зарабатывают

Большие языковые модели (БЯМ), такие как GPT-4, могут определить возраст, местоположение, пол и доход человека с точностью до 85 процентов, просто анализируя его сообщения в социальных сетях.
Робин Стааб и Марк Веро из ETH Zurich в Швейцарии получили девять дипломированных специалистов, которые должны были изучить базу данных сообщений Reddit и собрать идентифицирующую информацию в том виде, в каком ее написали пользователи. Стааб и Веро случайным образом выбрали 1500 профилей пользователей, которые работали на платформе, а затем сузили их до 520 пользователей, для которых они могли уверенно определить такие атрибуты, как место рождения человека, уровень его дохода, пол и местоположение либо в их профилях, либо в сообщениях.
Учитывая историю публикаций этих пользователей, некоторые из БЯМ смогли идентифицировать многие из этих атрибутов с высокой степенью точности. GPT-4 достиг самой высокой общей точности — 85 процентов, тогда как LlaMA-2-7b, сравнительно маломощная БЯМ, оказалась наименее точной моделью — 51 процент.
«Это говорит нам о том, что мы выдаем много нашей личной информации в Интернете, не задумываясь об этом», — говорит Стааб. «Многие люди не предполагают, что по тому, как они пишут, можно напрямую определить их возраст или местонахождение, но дипломированные специалисты вполне способны».
Иногда в постах прямо указывались личные данные. Например, некоторые пользователи публикуют свои доходы на форумах, посвященных финансовым консультациям. Но ИИ также улавливал более тонкие сигналы, такие как местный сленг, и мог оценить диапазон зарплат в зависимости от профессии и местоположения пользователя. Некоторые характеристики ИИ было легче различить, чем другие. GPT-4 показал точность на 97,8% при определении пола, но только на 62,5% при определении дохода.
«Мы только начинаем понимать, как использование программ БЯМ может повлиять на конфиденциальность», — говорит Алан Вудворд из Университета Суррея, Великобритания.
Источник: Newscientist