В общем, в плане доступности технологии будущее уже наступило. Качеству есть еще куда расти, особенно в плане вычисления возраста и определения настроения, но для многих задач всё уже готово. Для иллюстрации: в Китае водитель Didi обязан иногда показывать таксометру свое лицо, чтобы доказать, что он — это действительно он, а не его знакомый на чужом подключении ездит.

Китайский Face++ — один из дюжины мировых проектов, называющих себя лидерами в технологии распознавания лиц. Впрочем, по венчурному финансированию Face++ точно среди лидеров, еще с предпоследнего раунда в 100 миллионов долларов. Зарабатывает компания в основном на контрактах с государством и крупными корпорациями, но и стартапчикам дает открытое API с онлайн-подключением и оплатой по карте.

Результаты бизнеса непрозрачны, масштаб новых интеграций оценить обычно трудно, но, судя по инвестициям, всё идет хорошо, в ноябре 2017 года Face++ получил почти полмиллиарда долларов по оценке в миллиард.

https://www.faceplusplus.com/

SOUNDHOUND

Еще одна внезапно решенная проблема — понимание простых фраз на естественном языке, что-то на уровне Siri или Cortana. Русский язык публично предлагает Яндекс, а сервисов для понимания английского или даже испанского в интернете просто много.

Не возьмусь утверждать, что стартап SoundHound — самый продвинутый из всех, но у него кроме технологии есть еще и ее собственные применения. Начнем с API. Сделан он правильно, с онлайн-регистрацией и открытым прайсом, без необходимости общения с сейлзами, но с бесплатным минимальным тарифным планом и преднастроенной демонстрацией технологии. Качество продукта объективно оценить сложно — что-то он понимает, что-то нет, процент успеха с очевидностью зависит от акцента говорящего, выбранной темы и просто везения, некое число типа «72 % верных ответов» не говорит ни о чем. Наверное, правильно было бы проверять его через детские тесты: «Разговаривает на уровне среднего ребенка 5 лет и 8 месяцев», — это была бы наиболее информативная оценка. Но, увы, сейчас могу только сказать, что субъективно по распознаванию звуков он примерно на уровне Nuance (это то, что в трех четвертях приложений с голосовым вводом используется), а по пониманию смысла — хоть и неожиданно хорош в простых предложениях, но запутаться может и в них. Сложносочиненные не берет ни в какую.

Сто́ит доступ в самом простом случае от нескольких сотен до нескольких тысяч запросов за доллар в зависимости от размеров выбранного пакета, но это «общая лексика», подключение некоторых тематических пакетов легко может изменить цену раз в десять. Тем не менее, считая даже по 100 запросов за доллар и три фразы в минуту от живого человека, получается, что «зарплата» робота — 300 долларов в месяц за восьмичасовой рабочий день без простоев, отпусков, перекуров, больничных и налогов на ФОТ. В большинстве стран это вполне экономически целесообразный сотрудник колл-центра — и нет, он не будет как голосовой IVR, который в «Аэрофлоте» стоит уже сто лет, конечный клиент может и не понять, с кем разговаривает. А уж во всевозможные текстовые онлайн-помощники его точно можно вставлять по схеме «робот отвечает на то, на что может, человек — на всё остальное». Даже интересно, почему это не встречается в обычной жизни — компания, между прочим, заявляет о 20 000 разработчиков, использующих ее API, а она такая не единственная.

Кроме синтетического демо, на технологии SoundHound можно посмотреть в двух живых приложениях. Hound — полный аналог Siri, но за счет отсутствия в девайсе по умолчанию в тысячу раз менее популярный. SoundHound — умный Shazam, приложение умеет определять звучащую музыку или песню. Главное преимущество SH по сравнению с оригиналом — возможность найти песню не только по профессиональному исполнению, но и если ее пользователь сам в микрофон напоет. «Лучший способ узнать, что за мелодия к тебе прилипла, если не считать любого поисковика». Тем не менее, несмотря на сомнительную пользу отличия и чудовищный интерфейс, страшно перегруженный рекламой, приложение очень популярно, порядка миллиона загрузок в месяц — 1/6 от настоящего Shazam.

Осенью 2017 года компания получила новый раунд инвестиций, по сравнению с предыдущим оценка выросла с 830 миллионов долларов до миллиарда (у Shazam, для сравнения, на пике был миллиард, а публичный Nuance стоит 5 миллиардов). Тратить деньги планируют на расширение числа предметных областей, с которыми умеет работать их AI, и, разумеется, на маркетинг.

https://www.soundhound.com/

MAILGUN

Казалось бы, что может быть проще, чем отправка электронного письма из кода сайта? Пара строчек на родном Python или PHP — вот и всё, задача для Junior-разработчика на полчаса с учетом отладки. Увы, спасибо спамерам и антиспамерам, на деле всё куда сложнее: нужно иметь свой почтовый сервер, нетривиально его настроить, а потом следить, чтобы он не сломался или кто-нибудь из крупных почтовиков его не забанил.

Mailgun позволяет без всего этого обойтись — они за небольшую денежку предоставляют HTTP API для отправки писем с их серверов, и создание e-mail из кода сайта вновь становится задачей на 2–3 строчки! Стоимость этого удовольствия начинается от 20 писем за цент — т. е. в интернет-магазине с 1000 заказов в день (и каким-то разумным уровнем почтовой активности) письма, связанные с заказами (подтвердите адрес — вы не оплатили корзину — вы не оплатили корзину — вы не оплатили корзину — заказ получен — заказ доставлен), будут стоить не более 200–300 долларов в месяц, что эквивалентно 5 % расходов на системного администратора или 0,05 % времени простоя почтовой системы. Но каждый день теребить каждого пользователя по таким расценкам будет дороговато — впрочем, если дойти до максимальных объемов и максимальных скидок, то уже и не так страшно, хотя свой сисадмин выйдет, наверное, дешевле.

Кроме упрощения жизни техотдела стартап старается дать дополнительную ценность и продажам с маркетингом. Логи отправки и доставляемости писем, красивые отчеты, инфраструктура для A/B-тестов — всего этого сложно добиться в небольшой компании, но можно из коробки при использовании Mailgun. А если кто-то подсел на изучение этих цифр, то ему предложат и консалтинг, но уже, разумеется, за деньги.

Рынок таких услуг неожиданно велик: публичных цифр по выручке самого Mailgun нет, но его клон-конкурент Sendgrid заработал в 2016-м около ста миллионов долларов, в следующем году вышел на успешное IPO, сейчас стоит больше миллиарда долларов.

https://www.mailgun.com/

CONFLUENT

Еще один пример бизнеса вокруг opensource-продукта — Confluent. Технология, с которой всё началось, — Apache Kafka, брокер сообщений, написанный на Scala в недрах LinkedIn. Он не так популярен среди гиков, как RabbitMQ, но имеет несколько десятков крупных инсталляций в компаниях типа Twitter и Airbnb.

Confluent, созданный бывшими сотрудниками LinkedIn, хочет работать с еще более солидными клиентами: банками, страховыми, телекомами и прочими традиционными бизнесами, владеющими большими объемами данных и желающими их умно обрабатывать. Место Kafka должно быть где-то между их серверами приложений и кластерами Hadoop.

Кроме обязательных инструментов монетизации opensource: помощи при внедрении, 24×7 поддержки и тренингов — Confluent продает и Enterprise-версию продукта. По сравнению с базовой в него добавлены управляющая админка, автобалансировщик и более мощная репликация, но понятно, что набор дополнительной функциональности может расти безгранично. В 2017 году к джентльменскому набору добавился Confluent Cloud — SaaS-версия продукта, с доступом по подписке. Потенциально эта бизнес-модель, конечно, куда интереснее старой, посмотрим, насколько ее примет рынок.

С точки зрения инвестиций стартап растет удивительно быстро: за первые два с половиной года жизни получено порядка 80 миллионов долларов, оценка, соответственно, недалека от полумиллиарда.

https://www.confluent.io/

JELLYVISION

Прекрасная иллюстрация зарабатывания денег из ничего и тридцати лет труда — Jellyvision. Очень старая компания, начинавшая с разработки компьютерных игр еще в 80-е годы, нашла свою золотую жилу относительно недавно: теперь она занимается разжевыванием очевидных истин для сотрудников больших компаний.

Представьте себе какую-нибудь корпорацию с парой тысяч сотрудников, каждый из которых должен подобрать опции своей медицинской страховки (или пенсионного плана, или даже правильный вариант больничного выбрать). И все они звонят, пишут или приходят поговорить со специальным человеком в HR, а может быть, и двумя такими людьми: пара тысяч раз по полчаса — это как раз примерно рабочий год, а полчаса выглядят реалистично, это же США, синие воротнички свои права знают лучше, а общая их грамотность ниже, чем у средних офисных сотрудников в Москве.

Jellyvision предлагает прослойку перед HR — специального компьютерного бота, ведущего сотрудника по относительно простому скрипту и приводящего к финальному решению — в конце концов, выбор страховки не такая уж сложная проблема. Сейчас Alex (у бота есть собственное имя) доступен 14 миллионам сотрудников в 800 компаниях, выручка у Jellyvision 20 миллионов долларов в год — т. е. примерно 1,5 доллара за человека или несколько десятков тысяч долларов с компании. Если, скажем, зарплата живого консультанта со всеми дополнительными надбавками — долларов 30 в час, то окупаемость компьютерного помощника начинается, например, с того времени, когда им воспользуется одна треть сотрудников, и каждый из них сэкономит 10 минут времени HR (в жизни должно быть заметно больше). С другой стороны, делать и поддерживать своего бота, как бы это ни было просто, — явно дороже, да и деятельность для 99,9 % корпораций непрофильная.