Самое главное

• Alibaba — крупнейший китайский инвестор в исследования и развитие ИИ, что дает компании фору в гонке за лидерство в этой сфере.

• Модель предоставления ИИ многочисленным частным клиентам и компаниям основана на облачном сервисе. Клиенты ничем не рискуют и экономят на создании инфраструктуры, а Alibaba получает доступ к ценным данным о поведении пользователей.

• Применяя технологии повышения продаж в решении других общественных и бизнес-задач, Alibaba расширяет область применения ИИ внутри и за пределами своего бизнеса.

2. Alphabet и Google. Как преумножить потенциал ИИ

Международная группа компаний Alphabet размещается в США. Она специализируется на интернет-сервисе, технологиях и медико-биологических исследованиях. Среди прочих сюда входят поисковик Google, медико-технологическая компания Verily, производитель беспилотников Waymo, создатель устройств для «умного дома» Nest и Deep Mind — разработчик ИИ.

В 2017 году Сергей Брин, президент Alphabet, заявил: «Новый скачок в развитии ИИ — самое значительное событие в компьютерной области за всю мою жизнь» [Alphabet, 2017 Founder’s Letter: https://abc.xyz/investor/foundersletters/017/index.html], то есть важнее создания интернета.

В Alphabet осознают потенциал ИИ и применяют его во всех сферах: в оптимизации поисковиков, в беспилотных автомобилях, «умных домах», виртуальных помощниках, языковых переводах и медицинских технологиях.

Как Alphabet использует ИИ

«Умный» поиск

Самый популярный в мире поисковик Google оснащен ИИ. Текстовые и голосовые запросы и изображения обрабатывает умная самообучающаяся система — с 2015 года, когда был запущен RankBrain [Search Engine Land, FAQ: All about the Google RankBrain algorithm: https://searchengineland.com/faq-all-about-the-new-google-rankbrainalgorithm-234440].

Текстовый и голосовой поиск основан на обработке естественного языка: алгоритмы оценивают слова в контексте, а не по отдельности. Это семантический анализ.

В поиске по картинкам компьютерное зрение распознает и классифицирует данные об изображении, чтобы пользователи могли найти его текстовым или голосовым поиском. Алгоритмы глубокого обучения постоянно совершенствуются в том, чтобы распознавать и классифицировать отдельные элементы изображения. Чем больше учебных картинок обрабатывает машина, тем лучше понимает, что на них представлено.

Когда ИИ Google проанализировал запрос и предположил, что вам нужно, он сразу обращается к каталогу онлайн-контента: веб-страниц, изображений, видео и документов. Они уже обработаны системой машинного обучения.

Системы учатся сортировать, ранжировать и фильтровать контент каталога. Каждая единица контента оценивается по количеству ссылок на нее, точности содержащейся в ней информации. Также ИИ проверяет, не спам ли это или реклама и не нарушает ли контент закон или авторские права.

Обычный поиск Google — это множество сложных, мгновенно выполняемых вычислений ИИ. Системы, способные ежедневно осуществлять миллиарды вычислений, вознесли Alphabet и Google на вершину и принесли невероятную прибыль.

Google использует ИИ для других целей, например чтобы обеспечить безопасность аккаунтов Gmail и сервиса контекстной рекламы, которую показывают только потенциально заинтересованным пользователям.

Персональный помощник на базе ИИ

Персональный помощник с голосовым управлением на основе ИИ появился несколько лет назад. Сегодня всем известны Google Home, Amazon Alexa и Apple Siri.

Поначалу обработка естественного языка в пользовательских устройствах впечатляла, особенно по сравнению с недавним прошлым, но обнаружились ее ограничения. ИИ хорошо понимает только элементарные и короткие предложения и команды. Попробуйте поговорить с ним, как с обычным человеком, — и он сразу запутается.

По человеческим меркам нынешний ИИ — младенец. А если говорить на языке науки, ему не хватает данных. Но он быстро растет, например благодаря технологии Google Duplex. Она поддержит и довольно неформальную беседу, потому что обучена для конкретных ситуаций, и алгоритмы собирают только касающиеся этих событий данные. Google демонстрирует прогресс Duplex на примере записи в парикмахерскую по телефону [Google, Google Duplex: An AI System for Accomplishing Real-World Tasks Over the Phone: https://ai.googleblog.com/2018/05/duplex-aisystem-for-natural-conversation.html]. В таких узких и контролируемых случаях технология ведет себя почти по-человечески. Для этого инженеры Google запрограммировали свойственные нашей речи междометия: машина вставляет в разговор «эм-м», «ах» и «угу», когда сочтет это уместным.

Языковой перевод

Компьютер можно научить говорить на одном языке, а любой другой он освоит сам с помощью машинного обучения. По этому принципу работает переводчик Google, раскладывая язык на основные составляющие. Глубокие нейронные сети Google Translate постоянно оттачивают алгоритмы, изучая новые языки, и так совершенствуются в точности переводов. Google внедрила эту функцию в наушники Pixel Buds на базе Google Assistant, и пользователи могут слушать трансляцию перевода почти в режиме реального времени [The Verge, The Pixel Buds’ translation feature is coming to all headphones With Google Assistant: https://www.theverge.com/circuitbreaker/2018/10/15/17978298/pixel-buds-google-translate-google-assistantheadphones].

Беспилотные автомобили

У Waymo — подразделения Alphabet, которое разрабатывает беспилотные автомобили, — одна из самых развитых платформ в мире. Недавно компания стала первым коммерческим перевозчиком [Financial Times, Alphabet’s Waymo begins charging passengers for self-driving cars: https://www.ft.com/content/7980e98e-d8b6-11e8-a854-33d6f82e62f8].

Alphabet пошел еще дальше: автомобили полностью автоматизированы, в них даже нет руля и педалей. Они созданы для новой урбанистической эпохи, в которую быть владельцем автомобиля — дорого и неудобно. Сервис Waymo ориентирован на частный извоз: по прогнозам компании, такой формат будет основным в умных городах будущего.

Субтитры к миллионам видеозаписей

В машинном обучении Google использует алгоритмы естественного языка, когда автоматически записываются субтитры для слабослышащих (или предпочитающих тишину) людей на сервисе потокового видео YouTube. Как и с речью, для идентификации звуков (аплодисментов, музыки) система использует глубокие нейронные сети и автоматически выводит текст: он сообщает зрителю, что происходит [Google, Adding Sound Effect Information to YouTube Captions: https://ai.googleblog.com/2017/03/adding-sound-effect-information-to.html].

Диагностика заболеваний

Технология ИИ Alphabet (в частности на базе глубокого обучения) широко применяется в медицине. Из недавних новшеств стоит упомянуть офтальмологическую диагностику. Для обучения алгоритмов используются снимки оптической когерентной томографии — инфракрасные 3D-изображения глазного яблока [Nature, Clinically applicable deep learning for diagnosis and referral in retinal disease: https://www.nature.com/articles/s41591-018-0107-6]. Система основана на двух алгоритмах глубокого обучения. Один строит подробную схему устройства глаза и определяет, что нормально, а что может быть симптомом болезни, например возрастной макулодистрофии (истончение сетчатки глаза). Второй алгоритм анализирует медицинские показатели и выдает специалистам диагноз и схему лечения.

Google Brain

Исследовательское подразделение искусственного интеллекта Google называется Google Brain. Его основали в 2011 году Джефф Дин, Грег Коррадо и Эндрю Ын из Стэнфордского университета. Они стали пионерами практических технологий ИИ.

В Google Brain предположили, что обширные сверхбыстрые сети хранилища и огромный объем данных интернета, который проходит по их серверам, пригодятся для машинного и глубокого обучения. С тех пор команда разработала ключевые технологии, такие как компьютерное зрение и обработка естественного языка, и сделала ИИ востребованным в бизнесе [Google, Using large-scale brain simulations for machine learning and A.I.: https://googleblog.blogspot.com/2012/06/using-large-scale-brainsimulations-for.html].

Deep Mind

Deep Mind — еще один знаковый для Alphabet термин, появившийся в 2014 году. Британский стартап специализировался на симуляторах нейронных сетей мозга и обучал их играть в игры. Исследователи Deep Mind наблюдали, как мозг решает когнитивные, то есть связанные с познанием, задачи во время игры, а данные использовали для обучения машин. Технология стала сенсацией в 2016 году, когда оснащенный ей компьютер победил профессионального игрока в го [Wired, Google’s AI Wins First Historic Match: https://www.wired.com/2016/03/googles-ai-wins-first-game-historic-match-go-champion/].

Сегодня на Deep Mind работают интеллектуальные программы Alphabet. Они управляют охлаждающим оборудованием дата-центров, оптимизируют расход аккумулятора мобильных устройств на Android и т. д. А еще они участвуют в офтальмологической программе, о которой речь шла выше.

Самое главное

Alphabet и Google считают ИИ отправной точкой для революции компьютерных технологий.

• Компании уверены, что влияние следующей волны на общество будет еще более значительным, чем появление интернета.

• Большой объем данных позволил Alphabet разработать первые в своем роде услуги: поиск, показы рекламы, языковой перевод, обработку речи, «умные дома» и беспилотные автомобили.

• Благодаря инфраструктуре и вычислительной мощности для обработки большого объема данных на необходимой для поисковика супервысокой скорости Google применила все эти возможности к ИИ.

• Финансовые ресурсы Google позволили воспользоваться всеми качественно новыми разработками исследовательских групп и стартапов в сфере ИИ, такими как глубокое обучение.