Сегодняшняя работа в области искусственного интеллекта удивительна. Мы научили компьютеры побеждать самых продвинутых игроков в самых сложных играх. Обучили их водить автомобили и создавать фотореалистичные видео, изображения людей. Компьютеры могут воссоздавать произведения искусства и эмулировать лучших писателей. Тем не менее, я знаю: многим предприятиям все еще нужно, чтобы люди, например, читали документы в формате PDF об офисном здании и записывали размеры содержащихся в нем арендопригодных единиц. Если искусственный интеллект может все это сделать, то почему он не может прочитать PDF-документ и преобразовать его в машиночитаемый формат? Современные алгоритмы искусственного интеллекта могут воссоздать игровые версии Pacman просто играя против самих себя 1. Почему я не могу поручить компьютеру перевести финансовую таблицу моего коллеги в формат, который нужен моему программному обеспечению SAP?
Несмотря на два десятилетия достижений в области искусственного интеллекта, создается впечатление, что большая часть офисной работы состоит из лакейских умственных задач. Следует ожидать, что искусственный интеллект автоматизирует эту работу во многом так же, как и прошлые машины автоматизировали физический труд. Действительно, многие бьют тревогу по поводу предстоящей потери работы 2. Хотя я считаю, что искусственный интеллект сделал бы более интересными существующие рабочие места и создал бы больше рабочих мест в пока еще малоисследованных областях. На практике, однако, я все еще вижу многих людей, выполняющих работу, с которой компьютер должен справляться, но просто не может сделать это сегодня. Почему так?
Я думаю, что часть проблемы может заключаться в том, как мы взаимодействуем с компьютерами. Компьютеры основаны на архитектуре, которая требует четких, точных инструкций по манипулированию данными. Даже с виртуальными ассистентами, управляемыми голосом на наших смартфонах, мы все равно взаимодействуем, давая им четкие (хотя и более высокоуровневые) инструкции. Алгоритмы искусственного интеллекта, вероятно, могут подразумевать многие из этих инструкций. Возможно, мы ждем второй информационной революции. Использование Excel для современных бизнес-задач похоже на написание программного обеспечения в машинном коде, когда доступны языки программирования более высокого уровня. Может быть, это и так, но я думаю, что мы сталкиваемся еще с двумя сиюминутными проблемами: недостаток данных и неосведомленность.
Сегодняшний искусственный интеллект питается данными. И большая часть сегодняшних данных поступает из Интернета - текст, изображения, видео и наше взаимодействие с ними. Если группа разработчиков программного обеспечения хотела создать модель, которая могла бы, например, идентифицировать марку и модель автомобиля на изображении, они могли бы начать с предварительно обученной модели от других исследователей, которая обнаруживает объекты на изображениях, а затем наполняет их путем обучения на меньшем наборе примеров, который просто включает в себя автомобили. Это называется трансферным обучением. Однако не существует модели «понимания документов», которую мы могли бы адаптировать к нашим конкретным бизнес-процессам с помощью трансферного обучения. Таблицы Excel, маркетинговые брошюры, юридические контракты и другие документы, составляющие деловой мир, скрыты в почтовых ящиках и других хранилищах в различных компаниях. Ни одна группа исследователей не может обучить модели «понимания документов» просто потому, что у них нет доступа к соответствующим документам или соответствующим учебным ярлыкам для них.
Более того, командам исследователей не хватает понимания конкретных бизнес-процессов и задач, которые в первую очередь можно автоматизировать. Исследователям необходимо разработать интуицию вовлеченных бизнес-процессов. Мы не видели, чтобы это произошло во многих областях. Большие успехи достигаются, когда проблема понятна и имеет много общедоступных примеров (машинный перевод), где есть обещание огромного ROI или когда крупная компания произвольно решает бросить достаточно ресурсов на проблему, пока нет возможности взлома (AlphaGo).
Это означает, однако, что мы можем ожидать, что искусственный интеллект преуспеет в автоматизации бизнес-процессов, когда 1) исследователи смогут сосредоточиться на конкретной проблеме, и 2) они смогут накопить достаточно данных для обучения работоспособной модели. (Другой критерий успеха заключается в том, что он должен быть направлен на расширение прав и возможностей людей, вовлеченных в процесс, а не на их замену, но для другого обсуждения.) И там, где они добиваются успеха, люди, работающие в этих отраслях, могут ожидать, что будут тратить больше своего времени на интересную, творческую работу и меньше времени делать скучные, трудоемкие задачи. Прекрасным примером этого является Proda 4, лондонский стартап, который может автоматически стандартизировать данные коммерческой недвижимости. Стартапы или инициативы, которые обещают более общие решения, могут столкнуться с трудностями.
Положительным моментом является практически бесконечный поток возможностей для бизнеса. Каждый бизнес-процесс - это шанс для автоматизации, а значит, возможность для бизнеса сэкономить много времени и денег, приумножить часть прибыли. Если достаточно хорошо разобраться в ИИ-исследованиях, понять бизнес-процесс и собрать достаточно данных для обучения модели, то из этого можно построить прибыльную компанию.
Спасибо Габриэлле Абрахам и Джагне Фейрабенд за чтение предыдущих проектов этого эссе.