Compass Investments

Crypto vs. Dollar

? Наборы данных для обучения ИИ содержат тревожные материалы о сексуальном насилии над детьми

Наборы данных для обучения ИИ содержат тревожные материалы о сексуальном насилии над детьми. Ion

– Этические вопросы были подняты после того, как исследование Стэнфордского университета показало, что модели ИИ, такие как Stable Diffusion, были обучены на наборах данных, содержащих материалы о сексуальном насилии над детьми.

Исследователи быстро приняли меры и сообщили об URL-адресах неприемлемых изображений в NCMEC и C3P, подчеркнув необходимость ответственного обращения с данными ИИ.

Расследование SIO подчеркивает проблемы, связанные с очисткой открытых наборов данных, и призывает принимать превентивные меры и сотрудничать с организациями по защите детей.

Недавнее расследование Стэнфордской обсерватории Интернета (SIO) показало, что открытые наборы данных, используемые для обучения распространенных моделей ИИ, генерирующих изображения из текста, включая Stable Diffusion, содержат сотни известных изображений материалов о сексуальном насилии над детьми (CSAM). Было обнаружено, что этот набор содержит сотни известных изображений материалов, содержащих сексуальное насилие над детьми (CSAM). Это открытие свидетельствует об использовании открытых наборов данных для разработки передовых моделей искусственного интеллекта (ИИ).

Исследование SIO показало, что эти модели ИИ были обучены непосредственно на CSAM, присутствующих в наборе данных LAION-5B. Набор данных LAION-5B содержит миллиарды изображений с различных платформ, включая основные социальные сети и популярные видеосайты для взрослых. Он содержит миллиарды изображений. Это открытие вызывает опасения по поводу непреднамеренного увековечивания эксплуатации детей через наборы данных, загрязненные незаконным и вредным контентом.

Обнаружив первоисточник, исследователи сообщили URL-адреса изображений в Национальный центр пропавших и эксплуатируемых детей (NCMEC) в США и Центр защиты детей (C3P) в Канаде, которые начали процесс удаления. Использование инструментов хэширования, таких как PhotoDNA, имеет решающее значение для сопоставления отпечатков пальцев изображений с базами данных, которые ведут некоммерческие организации, борющиеся с сексуальной эксплуатацией и насилием над детьми в Интернете.

Хотя существуют способы минимизировать присутствие CSAM в учебных наборах данных, в отчете подчеркиваются трудности, связанные с очисткой и прекращением распространения открытых наборов данных без центрального органа. Отсутствие хостинга таких наборов данных затрудняет усилия по обеспечению их целостности и безопасности. В исследовании подчеркивается необходимость принятия проактивных мер для предотвращения случайного включения незаконного контента в обучающие данные ИИ.

На основе этих выводов в отчете изложены рекомендации по обеспечению безопасности при сборе наборов данных, обучении моделей и развертывании моделей, обученных на сканированных наборах данных. В нем содержится призыв тщательно проверять изображения на соответствие известным спискам CSAM с помощью таких инструментов обнаружения, как PhotoDNA от Microsoft. В нем также рекомендуется сотрудничать с организациями по безопасности детей, такими как NCMEC и C3P, чтобы обеспечить этичное и законное использование технологий ИИ.

Исследование SIO служит тревожным сигналом для сообщества ИИ и призывает заинтересованные стороны принять строгие меры по сбору данных, обучению моделей и сотрудничеству с соответствующими агентствами по защите детей. чтобы убедиться, что их не используют в качестве инструмента для подрыва самого существования ИИ в обществе.

После этих разоблачений сообщество ИИ должно пересмотреть свои этические стандарты и принять решительные меры для решения проблемы непреднамеренного использования CSAM в обучающих наборах данных. Приняв рекомендуемые меры безопасности, индустрия сможет внести свой вклад в развитие технологий ИИ на ответственной и этичной основе и защитить себя от непредвиденных последствий использования непроверенных источников данных. Результаты исследования SIO подчеркивают важность бдительности в эпоху, когда технологический прогресс должен сопровождаться твердой приверженностью этическому развитию ИИ Для того чтобы технологии ИИ развивались в соответствии с ценностями общества и уделяли приоритетное внимание благополучию уязвимых групп населения, необходимо сотрудничество исследователей, лидеров индустрии и организаций по защите детей. необходимо.

Деррик – писатель-фрилансер, интересующийся блокчейном и криптовалютами. В основном он работает над проблемами и решениями для криптопроектов и предоставляет прогнозы рынка для инвестиций. В своих статьях он использует свои аналитические таланты.

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии
Bitcoin

Bitcoin

$62,900.81

BTC -0.32%

Ethereum

Ethereum

$1,674.70

ETH 0.87%

Binance Coin

Binance Coin

$602.54

BNB 1.26%

XRP

XRP

$1.17

XRP 2.48%

Dogecoin

Dogecoin

$0.09

DOGE 0.96%

Cardano

Cardano

$0.17

ADA 3.37%

Solana

Solana

$66.55

SOL 1.48%