Больше, чем математика: к лучшей стратегии расширенной аналитики

15.01.2022 0 Редакция Steelgrey

Если, подобно XVIII воздушно-десантному корпусу, вы планируете использовать ИИ при сбрасывании 1000-фунтовых бомб, вы должны быть уверены, что используете его правильно, публикует перевод статьи newssky.com.ua.

Вот почему Министерство обороны США работает над внедрением критического мышления, решения проблем и этики в ИИ и машинном обучении. Следуя примеру коммерческого сектора, в Стратегии образования в области искусственного интеллекта Министерства обороны на 2020 год особое внимание уделяется выявлению, пониманию и устранению предвзятости в ИИ, а также ограничениям расширенной аналитики в операционной среде и этическим последствиям взаимодействия в команде человека и машины.

Помня об этих целях, программа повышения грамотности данных в разведывательной бригаде Объединенного командования специальных операций определила четыре критически важных элемента для эффективного и ответственного использования ИИ. По опыту авторов, эффективное обучение ИИ и управление талантами включают в себя развитие людей, обладающих навыками критического мышления и решения проблем, создание команд по науке о данных, а не поиск отдельных талантов, использование процесса, в котором упор делается на то, чтобы проблема определяла решение, и понимание важности дополнительных наборов навыков и ролей, поскольку они вносят свой вклад в богатую экосистему науки о данных.

Элементы ответственного ИИ

Для расширенной аналитики требуется нечто большее, чем просто навыки программирования, математические расчеты или свободное владение определенным программным обеспечением. Наш (авторов — пер.) подход к грамотности данных использует исследования в области социальных наук и передовой коммерческий опыт для достижения более целостного подхода к ИИ следующими способами:

Понимание алгоритмов

Во-первых, люди всегда будут важнее аппаратного или программного обеспечения. Профессиональное сообщество по науке о данных переименовало критическое мышление, решение проблем и этику — традиционно описываемые как «гибкие навыки» — в новые «силовые навыки», необходимые для превращения стремления к науке о данных в реальное, измеримое конкурентное преимущество. Таким образом, наша учебная программа предназначена для заполнения аналитического «пояса полезности» жизненно важными инструментами критического мышления. Один из инструментов, на который мы обращаем особое внимание, — это выявление предвзятых алгоритмов. Предвзятость может быть убедительной, тонкой и даже соблазнительной, особенно в очень сложных алгоритмах или алгоритмах «черного ящика», когда кажется, что это подтверждает общепринятое мнение. Но предвзятые алгоритмы неверны и часто также имеют неприятные последствия. Аналитически конкурентоспособные организации выявляют и устраняют предвзятость не только потому, что это правильно, но и потому, что это дает им конкурентное преимущество.

В то время как примеры алгоритмической предвзятости встречаются с относительной регулярностью, особое внимание уделяется алгоритмам распознавания лиц и сопоставления, учитывая их крайне плохую эффективность в идентификации женщин и людей с другим цветом кожи. Исследователи признали, что проблема с этими моделями заключалась в том, что они были построены с использованием обучающих наборов, преимущественно заполненных светлокожими мужчинами. Таким образом, при использовании для классификации людей, не входящих в эту демографическую группу, их точность значительно падает. Чтобы гарантировать, что эти возможности используются ответственно и эффективно, необходимо обучать специалистов по данным, методологов и конечных пользователей тому, как понимать производительность модели и оценивать последствия ошибок.

Прозрачный, интерпретируемый ИИ тем более важен в операционной среде. Возможно, удастся убедить нетерпеливого продавца-консультанта в том, что ваша модель «черного ящика» поможет ему выполнить свою годовую квоту продаж. Но неприемлемо говорить товарищу по команде о том, что он или она собирается отдать свою жизнь в цифровые руки вашей высоко предсказуемой, но непонятной модели: «Поверьте мне, рост модели по сравнению с предыдущими итерациями был потрясающим, и общая производительность алгоритма выглядела великолепно, но я совершенно не понимаю, как это работает». Вам не нужно обучать аналитиков деталям алгоритмов обратного распространения, чтобы пользователь мог лучше понять нейронные сети, но они должны, по крайней мере, в целом знать, что происходит под капотом. Беря пример с финансовых услуг и других регулируемых отраслей, реальный перевод «интерпретируемого ИИ» означает, что если я не могу понять модель, я не могу ее объяснить. Если я не могу объяснить это предполагаемому конечному пользователю, то они не будут ему доверять и/или использовать.

Игра в команде

Во-вторых, в конкурентной организации к науке о данных относятся как к полноконтактному командному виду спорта, в котором никто не сидит на скамейке запасных. Повышение грамотности данных в организации повышает общую аналитическую зрелость и обеспечивает более широкий охват усилий в масштабах всего предприятия. И наоборот, организации, которые загоняют своих исключительно квалифицированных «единорогов» в области обработки данных в изолированный сервисный центр, упускают возможности для значимого вовлечения и участия конечных пользователей. Более того, как и в случае с мифическим единорогом, отдельные исполнители, полностью разбирающиеся во всех аспектах науки о данных, могут даже не существовать. Коммерческий опыт демонстрирует преимущества использования этого и обучения рабочей силы, которая обладает разнообразным, но взаимодополняющим набором навыков в области обработки данных. Этот подход расширяет организационную широту, глубину и устойчивый потенциал. Кроме того, это также сглаживает точки отказа, связанные с ограниченным набором исключительно талантливых людей, которых, как известно, трудно рекрутировать, нанять и удержать.

ВВС США решают эту проблему напрямую через свою инновационную программу TRON. TRON эффективно использует имеющиеся в продаже учебные программы по разработке программного обеспечения и науке о данных. Это обучение подкрепляется и обогащается за счет структурированных стажировок, которые позволяют студентам применять свои недавно приобретенные навыки для решения реальных проблем в среде с частичным наблюдением. Наша программа грамотности в отношении данных использует аналогичный подход к обучению военных и гражданских членов Объединенной разведывательной бригады командования специальных операций, чтобы гарантировать, что каждый член команды обладает базовым уровнем знаний в области данных, необходимых для того, чтобы не только поддерживать, но и активно участвовать в общеорганизационных усилиях по изучению данных. Как и TRON, наша программа также предоставляет дополнительное образование учащимся, демонстрирующим способности и интерес, как средство углубления внутреннего потенциала в области науки о данных.

Создание фундамента основных знаний по науке о данных в организации создает среду для органического роста талантов по науке о данных за счет обучения рабочей силы общепринятому «языку» науки о данных. Обучение грамотности в области данных, в отличие от простого обучения конкретным навыкам, создает рабочую силу, способную беспрепятственно, быстро и осмысленно интегрировать новые источники данных, методы и технологии, в том числе те, которые в настоящее время находятся на горизонте. Хотя мы можем обучаться известному, мы должны обучать неизвестному. Как описано в стратегии Министерства обороны США в области искусственного интеллекта, базовые концепции, которые стандартизированы, но гибки, задают условия, необходимые для успешных инноваций, сотрудничества, внедрения и ответственного использования расширенной аналитики.

Сфокусируйтесь на проблеме

В-третьих, аналитически зрелые организации знают, что техническое владение конкретными программными инструментами или «кнопковедение» необходимо, но недостаточно. Зависимость исключительно от обучения конкретным языкам кодирования или технологическим платформам грозит созданием негибких, хрупких способностей, которые не могут расти или развиваться в ответ на меняющиеся условия и могут сломаться в случае стресса. Если вы умеете пользоваться только молотком, все будет выглядеть как гвоздь. Лучшая альтернатива, как указано в Стратегии образования в области искусственного интеллекта на 2020 год, включает разработку рабочих процессов и процессов, которые позволяют проблеме определять решение, а не конкретную аналитическую технологию или инструмент.

Межотраслевой стандартный процесс интеллектуального анализа данных является наиболее широко принятой методологией решения проблем в сообществе специалистов по данным и служит основой для нашего базового курса. Подобно научному методу, описывающему стандартный процесс исследования и рабочий процесс, межотраслевой стандартный процесс интеллектуального анализа данных воплощает в жизнь передовой опыт аналитического процесса. Как и научный метод, он не ограничивается конкретными источниками, методами или технологиями. Скорее, он обеспечивает эффективную модель аналитического процесса, которую можно использовать для ответа на любой вопрос, который можно решить с помощью данных. Мы решили использовать межотраслевой стандартный процесс интеллектуального анализа данных в качестве основного рабочего процесса, учитывая его способность поддерживать плавное и эффективное внедрение новых возможностей по мере их появления.

Кроме того, использование стандартной модели процесса или контрольного списка может также включать «подталкивания», которые побуждают аналитиков сделать паузу, критически подумать и проверить на наличие предвзятости. Возвращаясь к предыдущему примеру, алгоритмы распознавания лиц, разработанные на белых мужчинах, «работали» до тех пор, пока не перестали. Даже технически подкованные конечные пользователи продолжали использовать эти модели до тех пор, пока не стало очевидно, что они плохо работают против людей за пределами узкого диапазона обучающих данных. Аналитические модели процессов или контрольные списки, такие как межотраслевой стандартный процесс для интеллектуального анализа данных, которые включают явные подсказки для оценки производительности модели, подтверждают тот факт, что все модели содержат ошибки, особенно когда потенциальное практическое применение расширяется из учебных случаев. Создание прочной основы критического мышления и воспроизводимых методов в сочетании со стабильным, воспроизводимым аналитическим рабочим процессом не охватит все. Однако, встраивая проверки на предвзятость и ошибки, этот подход, по крайней мере, вызовет критическое мышление в поддержку выявления ошибок, их смягчения и управления последствиями. По нашему опыту, использование общей модели процесса обработки данных и языка создает потенциал, который может выйти за рамки сферы обслуживания, отдельной роли и даже дисциплины разведки, создавая условия для успеха миссии в совместной операционной среде.

Создайте экосистему

Наконец, каждый член нашей команды должен быть обучен как информированный потребитель. Хотя прикосновение пальцев к клавиатуре для написания кода доступно не всем, стратегия Министерства обороны в области ИИ включает в себя нетехнические и менее технические роли, или «архетипы рабочей силы ИИ», которые все чаще требуются для закупки, управления, развертывания и внедрения все более сложных аналитических возможностей. В дополнение к этим архетипам наша программа учитывает возрастающее значение роли «аналитического переводчика». Подобно специалисту по науке о данных, переводчик обменивает глубокие знания на широту и связанный с ними опыт в предметной области, что позволяет им компетентно выполнять несколько ролей в организации и обеспечивать преемственность в усилиях по науке о данных. Это позволяет им служить важными строителями мостов, которые могут определить математическую «проблему со словами», встроенную в непростую бизнес-задачу, и преобразовать ее в действенные требования к науке о данных. Они также могут гарантировать, что результаты удовлетворяют потребности конечного пользователя, являются актуальными и действенными.

Опять же, наука о данных — это командный вид спорта. Мало того, что у каждого есть своя роль, даже второстепенные позиции должны понимать сценарий. Все в нашей команде нуждаются в грамотности данных, необходимой для того, чтобы задавать правильные вопросы, чтобы эффективно, ответственно и этично использовать расширенные аналитические возможности. Общее понимание создания модели, проверки и связанных с ней допущений может способствовать ответственному использованию, включая проверки систематической ошибки, а также выявление и устранение ошибок. 18-й армейский воздушно-десантный корпус вывел эту концепцию на новый уровень, представив инновационный проект «Логово дракона». Подобно популярной телевизионной программе Shark Tank, Dragon’s Lair представляет собой форум, на котором люди могут выявить реальные проблемы и предложить решения. Обучение рабочей силы грамотности в области данных способствует этому типу инноваций, развивая способность выявлять и описывать «словесную проблему», генерировать действенные требования и предоставлять содержательную обратную связь по предлагаемым решениям.

Вывод

В конечном счете, в основе науки о данных лежит математика, а не магия. Но математику по-прежнему сложно использовать эффективно, ответственно и этично. Отправной точкой для этого может послужить Стратегия образования Министерства обороны в области искусственного интеллекта на 2020 год. В частности, включение и акцент на «нематематических» навыках обеспечивает доступ к нетехническим/менее техническим членам команды и позволяет военным реализовать перспективы передовой аналитики. Это включает в себя создание условий для нового понимания и понимания в поддержку значимых решений некоторых из самых сложных проблем, с которыми сталкивается наша нация.


Поделиться статьей:

                               

Подписаться на новости:




В тему: