- 04.01.2024
- 1586 Просмотров
- Обсудить
Исследователи создали инструмент искусственного интеллекта, который использует последовательности жизненных событий - таких как история здоровья, образование, работа и доход - для прогнозирования всего, начиная от личности человека до его времени смерти.
Исследователи создали инструмент искусственного интеллекта, который использует последовательности жизненных событий - таких как история здоровья, образование, работа и доход - для прогнозирования всего, начиная от личности человека до его времени смерти.
Новый инструмент под названием life2vec, созданный на основе трансформерных моделей, которые также используются в больших языковых моделях, таких как ChatGPT, обучен на наборе данных, извлеченных из всего населения Дании - 6 миллионов человек. Датский правительство предоставило доступ к этому набору данных только исследователям.
Инструмент, построенный исследователями на основе этого сложного набора данных, способен прогнозировать будущее, включая продолжительность жизни отдельных людей, с точностью, превосходящей современные модели. Но несмотря на его предсказательную силу, команда исследователей говорит, что его следует использовать в основе для будущих работ, а не как самостоятельный инструмент.
"Несмотря на то, что мы используем прогноз, чтобы оценить, насколько хороши эти модели, инструмент не следует использовать для прогнозирования реальных людей", - говорит Тина Элиасси-Рад, профессор информатики и первый профессор Джозефа И. Ауна при Университете Норт-Истерн. "Это модель прогнозирования, основанная на конкретном наборе данных конкретной популяции".
Элиасси-Рад внесла свой вклад в проект с точки зрения этики искусственного интеллекта. "Эти инструменты позволяют вам по-новому взглянуть на ваше общество: на ваши политики, правила и регламенты", - говорит она. "Можно считать это сканированием того, что происходит на месте".
При создании этого инструмента команда привлекла социальных ученых, чтобы внести гуманитарный подход к разработке искусственного интеллекта, не теряя из виду людей в огромном наборе данных, на котором основан инструмент.
"Эта модель предлагает гораздо более всестороннее отражение мира, так как он воспринимается людьми, чем многие другие модели", - говорит Суне Леманн, автор статьи, которая недавно была опубликована в журнале Nature Computational Science. Резюме исследования представлено в том же номере журнала.
В основе life2vec лежит огромный набор данных, на котором исследователи обучали свою модель. Данные хранятся в Статистическом управлении Дании, центральном органе по датской статистике, и, хотя они тщательно регулируются, некоторые члены общественности, включая исследователей, могут получить к ним доступ. Причина такого строгого контроля заключается в том, что он включает подробный реестр каждого датского гражданина.
Множество событий и элементов, составляющих жизнь, подробно описаны в данных, начиная от факторов здоровья и образования до доходов. Исследователи использовали эти данные для создания длинных последовательностей повторяющихся жизненных событий, которые подаются на вход модели, используя подход трансформерной модели, используемый для обучения языковых моделей, и адаптировали его для представления человеческой жизни в виде последовательности событий.
"В определенном смысле, историю человеческой жизни можно рассматривать как огромное длинное предложение о множестве вещей, которые могут произойти с человеком", - говорит Леманн, профессор сетей и науки о сложности в Техническом университете Дании, ранее постдок в Норт-Истерн.
Модель использует информацию, полученную из наблюдения за миллионами последовательностей жизненных событий, чтобы создать векторные представления во вложенных пространствах, где начинаются категоризация и установление связей между жизненными событиями, такими как доход, образование или факторы здоровья. Эти вложенные пространства служат основой для сделанных моделью предсказаний.
Одним из жизненных событий, предсказанных исследователями, была вероятность смерти человека.
"Когда мы визуализируем пространство, которое модель использует для прогнозирования, оно выглядит как длинный цилиндр, который переходит от низкой вероятности смерти к высокой вероятности", - говорит Леманн. "Затем мы можем показать, что в конце, где высокая вероятность смерти, многие из этих людей действительно умирают, а в конце, где низкая вероятность смерти, причины смерти такие, что мы не могли предсказать, например, автомобильные аварии".
В статье также показано, как модель способна предсказывать индивидуальные ответы на стандартный опросник личности, особенно в отношении экстраверсии.
Элиасси-Рад и Леманн отмечают, что, несмотря на то, что модель делает очень точные прогнозы, они основаны на корреляциях, очень конкретных культурных и общественных контекстах, а также на тех видах предубеждений, которые существуют в каждом наборе данных.
"Этот инструмент похож на обсерваторию общества - но не всех обществ", - говорит Элиасси-Рад. "Это исследование было проведено в Дании, и у Дании есть своя культура, свои законы и свои общественные правила. Вопрос, можно ли сделать такое же исследование в Америке, отдельная история".
Учитывая все эти оговорки, Элиасси-Рад и Леманн считают свою прогностическую модель не конечным продуктом, а началом диалога. Леманн говорит, что крупные технологические компании, вероятно, уже давно создают подобные прогностические алгоритмы в закрытых комнатах. Он надеется, что эта работа поможет создать более открытое общественное понимание того, как работают эти инструменты, что они могут и не могут делать, и как их следует использовать.
Подписывайтесь на наш Telegram, «X(twitter)» и «Zen.Yandex», «VK», «OK» и новости сами придут к вам..
Подписывайтесь на наш Telegram-канал, «X(twitter)» и «Zen.Yandex», «VK», «OK» и новости сами придут к вам..
Похожие материалы
Будь-те первым, поделитесь мнением с остальными.