Поможет вспыльчивый олег. «тинькофф» запустил голосового помощника

Маруся

Пока работает в тестовом режиме, но активно развивается и уже может использоваться как основной ассистент. Расходы на создание Маруси составили два миллиона долларов.

Этот голосовой помощник, как и многие другие, самообучаемый. Нейросеть определяет намерения пользователей и понимает вопросы, которые они задают. Алгоритмы поиска помогают извлечь важные факты из сказанного и сформировать осмысленные ответы.

В скором времени Марусю интегрируют в продукты Mail.ru и сторонние сервисы. Это позволит:

  • слушать новости;
  • заказывать еду;
  • вызывать такси.

Голосовой ассистент доступен на площадках AppStore и Google Play. Маруся находится на стадии развития, но уже умеет:

  • включать музыку или радио;
  • подсказывать стоимость билетов на поезда и самолеты;
  • рассказывать прогноз погоды;
  • играть и рассказывать сказки;
  • отвечать на различные вопросы.

Утечки памяти

Олежка работал на самом простом инстансе DigitalOcean с 1ГБ ОЗУ, но так было лишь до тех пор, пока я не получил первую сотню юзеров. Он начал жрать память, пришлось разбираться. Сначала я конечно тупо увеличил ОЗУ дроплета, но оказалось, что это помогает лишь на время 🙂

Оказалось, что при массовой рассылке свежих постов, Олег каждый раз запрашивает из базы пул свежих постов (10-50к записей). Это тупо и медленно. По моим прикидкам это не должно было жрать память, ведь объект хранящий посты теряет ссылки на себя, как только метод рассылки заканчивает свою работу. Но у питонячего сборщика мусора, видимо, свой взгляд на этот вопрос. Кроме того, это просто некультурно — много раз подряд в цикле забирать из базы одну и ту же инфу. Я написал простой кеш пула свежих постов, это в общем помогло.

Память все еще течет, но гораздо медленнее. На докер-контейнере стоит , и когда контейнер вылетает по out-of-memory, он рестартит, происходит это раз в несколько суток.

Как полностью это побороть, я пока не понял. Много раз исследовал свой код на предмет утечек, есть пара методов — кандидатов на создание утечки. Это, например, метод, который добавляет в тензор эмбеддингов новую строку при добавлении нового юзера. PyTorch не поддерживает append строки к тензору, приходится пересоздавать тензор, и в этом месте возможна утечка. Но метод реализован по рекомендациям разработчиков PyTorch, и лучше его не сделать (вроде).

Где найти бота

В мобильном приложении банка. По официальной информации, бот доступен пользователям устройств на основе iOs и Android, но пока не всем, а выборочно. Разработчики обещали, что всем клиентам бот покажется до конца июня. На деле же бот появился только у некоторых владельцев устройств на iOs. Так нам ответили в банке. Когда Олег появится в гаджетах на Android, пока неясно.

Чтобы вызвать помощника, зайдите в мобильный интернет-банк и воспользуйтесь одним из трёх способов: командой «Привет, Олег» или «Слушай, Олег» на главном экране, нажатием на иконку микрофона в строке поиска или в разделе чата.

Если у вас уже появился Олег, а у друга ещё нет, ботом можно поделиться.

Для этого попросите помощника перевести другу деньги, после чего Олег автоматически поселится и в его мобильном приложении.

Сколько стоит услуга секретаря Олега от «Тинькофф банка»?

Услуга виртуального ассистента бесплатна для всех операторов. Однако в банке предупредили, что в некоторых случаях ваш оператор может взимать плату за переадресацию входящего вызова на определенных тарифах. Поэтому если не уверены, то обратитесь в поддержку своего сотового оператора.

Интересно, что для абонентов «Тинькофф Мобайл» услуга ассистента платная и стоит 99 рублей в месяц — по крайне мере, так указано в описании виртуального помощника на сайте компании. Впрочем, абоненты оператора «Тинькофф» могут более тонко настроить Олега: например, дать ему другое имя и выбрать голос ассистента.

Как это работает

В 2017 г. «Тинькофф» запустил биометрическую систему собственной разработки. По данным компании, система принимает правильное решение в 99,99% случаев. В 2018 г. в компании стартовала разработка собственной технологии синтеза речи на основе таких нейросетевых моделей, как WaveNet, Tacotron, Deep Voice.

Как дать сотрудникам возможность работать над интересными задачами, двигаясь в цифровую трансформацию
Бизнес

Согласно информации разработчиков голосового ассистента, в настоящее время им удалось добиться корректного распознавания до 95% произнесенных слов. За счет применения суперкомпьютера «Тинькофф» (вычислительный кластер «Колмогоров», пиковая производительность 658,5 Тфлопс/с, восьмое место в рейтинге топ50 российских суперкомпьютеров 30 редакции от 02 апреля 2019 г.) производится обучение нейросетевых моделей для распознавания и синтеза речи, обработка естественного языка, общения на свободные темы.

В процессе используются терабайты данных и десятки тысяч часов человеческой речи. В итоге система распознавания речи «научилась» справляться как с чистыми источниками голоса, так и с зашумленной речью телефонных каналов.

Голосовые технологии «Тинькофф» также помогают компании автоматизировать процессы обслуживания. Так, через распознавание речи ежедневно проходит около миллиона звонков обслуживания, а биометрическая система, обученная на голосах клиентов, помогает отсеивать мошеннические действия в колл-центре.

Голосовой ассистент Олег будет доступен пользователям в мобильном приложении «Тинькофф». Первыми доступ к Олегу получат пользователи мобильных устройств под управлением ОС iOS, позже – после обновления приложения до версии 4.8, которая будет опубликована в ближайшее время, в компании обещают запустить версию для Android-устройств.

Первые обладатели Олега смогут поделиться им со своими друзьями, совершив денежный перевод через голосового помощника. Для этого необходимо попросить Олега сделать перевод нужному клиенту «Тинькофф». В течение часа после поступления денег на счет получателя в его мобильном приложении также появится Олег.

Что умеет бот

Чтобы Олег рассказал, что умеет, достаточно спросить его: «Что ты умеешь?». В ранней версии, которая доступна сейчас, бот может:

  • переводить деньги на Тинькофф и Сбербанк;
  • бронировать места в кафе и ресторанах;
  • записывать пользователей в салоны красоты;
  • покупать билеты в кино с кэшбэком 15%;
  • искать необходимые клиенту товары и услуги;
  • общаться на отвлечённые темы;
  • давать полезные советы;
  • консультировать по тарифам и акциям;
  • управлять финансовыми продуктами;
  • изменять личные данные в экосистеме Тинькофф;
  • предоставлять электронные справки, выписки и т.д.

В будущем бот сможет заказывать такси, авиа- и ж/д билеты, покупать билеты в театр и на концерты, организовывать путешествия, записывать на приём к врачу. Также Олег возьмёт на себя оплату счетов, досуг (предложит варианты), инвестиции и другое.

Бот Олег стал логичным продолжением развития технологий в Тинькофф. На момент его запуска 35% обращений пользователей уже решались в автоматическом режиме. Это экономит банку десятки миллионов рублей в месяц.

Берта Пяттоева (Берта и Ко)

актриса театра и кино, чревовещатель

Чревовещание (или вентрология) — это сценический прием, при котором артист говорит или поет за куклу не открывая рта. При этом создается иллюзия, что голос исходит не из него.

Чревовещанию я научилась сама. В театральной академии СПбГАТИ мастер курса дал нам задание придумать эстрадный номер. Я уже умела имитировать голоса, а тут вспомнила, что мама в детстве мне показывала, как говорит не открывая рта. Я решила тоже потренироваться у зеркала. И у меня получилось! Потом я стала искать информацию в интернете, следила за зарубежными чревовещателями, познакомилась с русской чревовещательницей Раисой Виноградовой. В академии стала заниматься кукольным искусством и углубленно изучать голосовой аппарат, чтобы улучшать технику.

Никита Кукушкин

актер «Гоголь-центра»

Голос неотделим от тела и внутреннего состояния. Вот ситуация: ты едешь в маршрутке, и вдруг, когда тебе нужно сказать «Остановите, пожалуйста», голос как-то дико меняется и звучит неестественно. И это не из-за того, что что-то не так с голосом, — ты просто стесняешься самого себя. Но это идет от головы, от твоего ощущения в пространстве: кто ты — тварь дрожащая или право имеешь. Ты думаешь, что людям не нравится твой голос, что он некрасивый, что ты некрасивый вообще. Это может выражаться как в голосе, так и в теле, и в рассуждениях, и в том, можешь ли ты сказать «да» и «нет» открыто, не побоявшись осуждения со стороны окружающих.

В театральном институте актеры четыре года ищут собственный голос. Хороший мастер помогает полюбить себя таким, какой ты есть. Не возгордиться, а просто знать, что ты прекрасен. Как говорил один наш педагог, «вы можете не стать актерами, но лучшее, что в этих стенах вы можете обнаружить, — это самих себя. Одно из первых упражнений, которые мы делали, когда искали свой голос, — это пение колыбельных. Также мы учились тяну-у-у-уть какую-то гласную

Красиво или некрасиво — неважно, ты уже поешь. Важно поймать ощущение, будто у тебя внутри труба

Дышать нужно животом и петь от живота тоже. И чтобы резонаторы работали (грудь, голова, талия) и не звучать, как говорят, на связках, работая высокими резонаторами.

Когда ты наконец обнаруживаешь самого себя, то упражнения для голоса становятся не нужны (говорю исключительно за себя). Дальше всё, что необходимо, — это поддерживать себя в тонусе. Иногда перед спектаклем мне достаточно сделать так: «м-м-м» — и громко что-то сказать разочек. И всё. А перед спектаклем «Человек без имени», который мы сделали вместе с Тинькофф, где я на сцене 1 час 40 минут, делаю такое упражнение для артикуляции: беру пробку от шампанского, сжимаю зубами и проговариваю текст. Всё это полотно текста. И главное — выговаривая все звуки: Р, Л, М, Н. Кому-то нужно долго настраиваться, кто-то перед спектаклем поет. У каждого актера своя настройка, но не только голоса, а вообще всего организма — чтобы потом грамотно выстроить коммуникацию с залом.

Кристина Вайсман

логопед, руководитель Международной команды логопедов

Педагог по сценической речи ставит речь для сцены и публичных выступлений, а логопед — для жизни. Взрослые приходят к логопеду не так часто: речь сформирована, к особенностям привыкли и они сами, и их близкие. Дефектов или не слышат, или слышат только отдельные неверные звуки. Часто это Р, Ш, С и их мягкие пары.

Можно тренироваться и самостоятельно, когда знаете как. Для проверки звуков есть фраза «Бабушка сушила мокрое бельё на верёвке». Скороговорки используются для отработки сложных звуков и совершенствования дикции. Из новеньких есть такие: «Бессмысленно осмысливать смысл неосмысленными мыслями!» и «Полосу про паласы заменили двумя полуполосами про пылесосы». Есть еще сложные слова.

Что умеет Олег?

  • Принимать звонки от имени абонента, когда тот по определенным причинам не может или не хочет брать трубку
  • Определять категорию звонка — делить на полезные и назойливые, безопасные и опасные
  • Понимать, что говорит собеседник, отвечать на его вопросы и вести какой-никакой диалог, полагаясь на контекст
  • Записывать входящий звонок и присылать в приложение или Telegram расшифровку
  • Перезванивать абоненту, чтобы поинтересоваться, зачем он звонил

То есть Олег — это такая приколюха, которая в теории поможет облегчить жизнь пользователю. Лично я давно знал о технологии и хотел перейти на «Тинькофф Мобайл» — оператора одноименного банка — только ради возможности получать расшифровки пропущенных звонков. Хорошо, что в 2021 году аналог автоответчика от известного банка стал доступен всем пользователям вне зависимости от выбранного оператора.

Имиджевый пилот

Обучать Олега помимо пользователей будет суперкомпьютер «Колмогоров» — с его помощью команда разработчиков обучает нейросетевые модели для распознавания речи, синтеза речи, обработки естественного языка, общения на свободные темы. Разработка собственной технологии синтеза речи от банка стартовала в 2018 году на основе таких нейросетевых моделей, как WaveNet, Tacotron, Deep Voice, разработкой распознавания речи в банке занимаются с 2016 года. В настоящее время им удалось добиться корректного распознавания до 95% произнесенных слов, заверили в банке. Голос для Олега записывал актер Никита Прозоровский (он, в частности, озвучивал Фрэнка Андервуда из «Карточного домика» и комиссара Гордона в трилогии Кристофера Нолана о Бэтмене). Прозоровский записал около 30 часов реплик, на основе которых синтезируется голос.

Затраты на разработку, рекламную кампанию и поддержку продукта в банке не раскрывают. Там отмечают, что вся разработка Олега «отбивается меньше чем за месяц текущей экономией, которую дают текстовые чат-боты». «Мы запустили чат-ботов для клиентов около года назад, сегодня в клиентских чатах «Тинькофф» более 35% входящих обращений клиентов уже полностью обслуживаются и решаются роботами, диалог происходит вообще без участия человека со стороны «Тинькофф». Сегодня только в текстовом канале клиентской поддержки роботы позволяют сэкономить нам около 50 млн рублей в месяц», — сообщили в пресс-службе банка.

Олег позиционируется банком как первый голосовой финтех-ассистент в России и в этой нише пока остается единственным. Ближайшим конкурентом может стать Сбербанк и даже без помощи голосового помощника Алисы от «Яндекса». В ноябре 2019 года подразделение «Сбербанк Технологии» планировало запустить собственного голосового помощника для клиентов. Им может стать Варвара — сервис от Центра речевых технологий, долю в котором банк купил в апреле.

Самым популярным и активно продвигаемым продуктом на этом рынке остается Алиса. Примечательно, что на ПМЭФ Олег Тиньков предлагал основателю «Яндекса»Аркадию Воложу объединить бизнес, а помощник Олег пытался флиртовать с Алисой. Отказ получили оба Олега. Своих ассистентов обещали запустить Mail.Ru Group (17-18 июня, как ожидается, будет представлена Маруся), Wildberries (Ева Вайлет), у «МегаФона» уже работает Елена.

Пока этот продукт в большей степени пилотный, нужно время для того, чтобы оценить степень его проникновения, удобство и востребованность, но как идея — это интересно, прогрессивно и ярко, считает Анна Бодрова, старший аналитик информационно-аналитического центра «Альпари».

«Вполне возможно, что частные банки сейчас разрабатывают аналоги, и это простимулирует сектор к развитию. В технологиях, однозначно, будущее. Прогрессивная доля пользователей, а таких у Тинькофф Банка много, нововведение, скорее всего, оценит. Насколько это прогрессивное решение, покажет время, но главное, чтобы его функционал оказался востребованным», — отмечает аналитик.

Тинькову запуск Олега поможет сохранить имидж высокотехнологичного банка, привлекательного для самой активной аудитории, позволит и дальше позиционировать себя как «новый банк» или «другой банк», выделиться среди конкурентов, не имея клиентской базы Сбербанка, это вопрос позиционирования, очень важный для компании, говорит ведущий аналитик «Финам»Леонид Делицын. По его словам, в целом появление таких помощников — закономерный тренд.

«Человек, если ему дать возможность, с удовольствием разучился бы читать и писать. Это прекрасно понимали еще 20 лет назад, когда IBM начала разработку голосовых команд. Сегодня своих помощников выпустили крупнейшие it-гиганты, дело закономерно дошло и до банков, которые обслуживают миллионы своих клиентов. Могу предположить, что такие помощники в ближайшее время появятся у сотовых операторов и продуктовых сетей», — прогнозирует Делицын.

Обсуждаем новости здесь.
Присоединяйтесь!

Что умеет Олег

Для начала общения с помощником в мобильном приложении «Тинькофф» можно сказать «Привет, Олег!» или «Слушай, Олег!». Найти его можно также в разделе «Чат» или нажав на кнопку «Микрофон» рядом со строкой поиска на любом экране.

Голосовой помощник «Тинькофф» может распознавать и интерпретировать запросы пользователей, задавать уточняющие вопросы, беседовать на разные темы и консультировать в решении различных задач. Помощнику можно задать вопрос, например – «Что делать вечером?», или обратиться с просьбой сделать перевод другу и пр. Чтобы узнать о текущих возможностях Олега, нужно спросить его «Что ты умеешь?».

Навыки голосового ассистента Олега

Самая первая версия Олега уже способна совершать денежные переводы на счета в «Тинькофф» и Сбербанке, бронировать столики в ресторанах, записывать пользователей в салоны красоты, покупать билеты в кино с кэшбэком 15%, а также искать скидки на товары и услуги. Например, можно сказать «Покажи скидки на кроссовки», на что Олег покажет подходящие спецпредложения от «Тинькофф».

Ассистент может поиграть с пользователем в викторину, если сказать ему «Олег, задай вопрос». Он предложит догадаться, например, какие продукты нельзя купить в Австралии, что Лев Толстой мог купить на гонорар за «Анну Каренину» или сколько кэшбэка получил пользователь за прошлый год.

Голосовой ассистент поможет скрасить время общением на свободные темы, полезными советами и «лайфхаками» из «Тинькофф Журнала». Олег ответит на вопросы «Как тебя зовут?», «Как дела?», «Что ты делаешь в свободное время?», «Какую музыку ты слушаешь?», «Что нового в банке?», «Олег — красавчик?», «Какой курс доллара?» и т.д.

Результаты запросов к ассистенту «Тинькофф»

Олег способен проконсультировать по банковским вопросам и акциям, обеспечить управление финансовыми продуктами – такими как дебетовая и кредитная карты. Его можно спросить «Что такое беспроцентный период», «Какая у меня полная сумма задолженности», «Как перевыпустить карту», «Какой у меня минимальный платеж», «Как начисляется кэшбэк», «Как оплатить коммунальные платежи» и т.д. Он расскажет про комиссии, лимиты, программы лояльности, как пользоваться текущими банковскими услугами в Тинькофф и т.д.

Подсказки голосового ассистента Олега

С помощью голосового ассистента также можно изменить личные данные в экосистеме «Тинькофф», заказать и отправить на почту электронные документы – например, справку для посольства.

Олег может интерпретировать запросы и при необходимости задавать уточняющие вопросы. Например, если клиент произносит «Хочу в ресторан завтра», голосовой помощник не будет спрашивать дату, а уточнит только недостающую информацию (название ресторана, количество гостей, время) и подтвердит заказ. Если клиент решит перенести поход в ресторан, голосовой ассистент отменит бронирование и предложит другие варианты.

Иногда Олег может сказать или ответить на вопрос, не подумав. Он объясняет это «вспыльчивым характером». Пользователи смогут помочь в обучении Олега, проставляя его репликам «лайки» или «дизлайки», которые будут анализироваться командой «Тинькофф». Если у Олега возникнут затруднения с решением задачи клиента, ему можно сказать «Хватит», или «Позови человека».

Финансовые консультации ассистента «Тинькофф»

Большую часть пользовательских задач Олег будет решать автоматически, для оставшихся голосовой помощник будет привлекать операторов из колл-центра «Тинькофф». Для этого он уточнит необходимую информацию, а затем поставит задание, которое будет выполнять человек. Такое решение, по мнению разработчиков сервиса, позволит максимально автоматизировать все процессы, такие как, например, запись клиента в те салоны красоты, которые пока еще не подключены к общей системе через партнеров.

Модель рекомендаций

В предыдущей статье я писал, что решил отказаться от нейросети в модели, тк модель на основе произведения векторов эмбеддингов обучается быстрее и менее склонна к переобучению. Поюзав немного старую модель и собрав фидбек с первых юзеров, мне стало понятно, что модель все-таки нужно немного усложнить.

Поисследовав немного, я пришел к тому, что нужно поработать над следующими вещами:

Научить модель отличать каналы

Старая модель не знала ничего про каналы, для нее каждый пост был уникальным. Я думал, что в результате разметки постов голосами пользователей посты с одного канала получат похожие эмбеддинги. Но внимательно присмотревшись к этому вопросу, я понял, что так не будет, потому что постов всегда будет гораздо больше чем юзеров, а это значит, что пространство постов будет размечено разреженными оценками. Далеко не всем постам достанется хотя бы одна оценка, а ведь чтобы считать пост хорошо размеченным, ему нужно 10-100 оценок.

Как быть? Количество каналов гораздо меньше количества постов и меньше количества юзеров. В канале все посты имеют примерно одинаковый flavour (извините), поэтому есть смысл ввести в модель эмбеддинги каналов и сделать их основным источником предсказательности. Посты тоже имеют свои эмбеддинги, но теперь 80% эмбеддингов несет канал и 20% — пост.

Окей, если мы вводим эмбеддинги каналов, простая модель DotProduct перестает работать, потому что перемножить три вектора для получения скаляра мы уже не можем. На помощь приходит нейросеть!

Нейросеть с одним скрытым слоем

Берем эмбеддинги юзера, канала и поста, конкатенируем их в один длинный тензор, и подаем этот тензор на входы нейросети. В моем случае эмбеддинг юзера имеет размерность 100, канала — 80, юзера — 20. Соответственно, у нейросети должно быть столько входов, сколько элементов у конкатенированного тензора. На иллюстрации я изобразил в 10 раз меньше нейронов (10-8-2) просто для удобства иллюстрации. Почему я выбрал такие размерности (100-80-20) — см. ниже.

Нейросеть имеет один скрытый слой из 70 нейронов и 1 нейрон на выходном слое, степень активации которого означает предсказанную оценку.

Предполагается, что нейроны скрытого слоя обучаются признакам более высокого порядка, и сигнал от слоя эмбеддингов, проходя через них, формирует в итоге скаляр, предсказывающий оценку поста юзером.

Подобрать размерности эмбеддингов

В прошлой статье я писал, что не нашел какого-то четкого правила выбора размерностей эмбеддингов, и выбрал размерность 13 для юзера и для поста.

На этой итерации я поисследовал этот момент самостоятельно и провел пару дней в экспериментах.

Я пробовал разные размерности эмбеддингов и соотношение размерностей скрытого слоя и эмбеддингов, а также константы learning rate. Я смотрел, как быстро обучается модель, следил, чтобы скорость обучения (хорошо) не перерастала в быстрое скатывание в переобучение (плохо). Пытался найти баланс между точностью предсказания и генерализацией.

Поскольку у меня на руках был реальный датасет из нескольких десятков тысяч оценок, я мог себе позволить отрезать от него кусок для валидации, и сделать всё как надо: тренировать сетку на обучающем подсете, и валидировать ее работу, находя момент, когда начинается переобучение.

Попробовав различные комбинации размерностей, я подобрал такие значения:

  • Эмбеддинг юзера — 100,

  • Канала — 80,

  • Поста — 20

Соотношение между каналом и постом я выбрал самостоятельно, мне показалось, что смыслы которые несет собой канал превалируют над смыслами, которые несет собой отдельный пост. Также я чисто эмпирически предположил, что общая размерность канал+пост должна быть равна размерности эмбеддинга юзера. Остальные соотношения я подбирал экспериментально. Так, у меня получилось, что размерность скрытого слоя = 70. Такой результат получился, когда я пытался сделать обучение гладким, быстрым, но не очень быстрым, чтобы не проскакивать момент начала переобучения.

Учи Олега

Олег — совсем молодой голосовой помощник, и ему еще многому предстоит научиться, отмечают в банке, обещая, что по мере развития и общения с пользователями Олег «будет обучаться и менять свой характер». «Ему интересно все новое, он ежедневно совершенствует свои навыки общения. Иногда Олег может сказать или ответить на вопрос, не подумав. Он объясняет это вспыльчивым характером, но работает над собой и каждый день становится лучше», — уверяют в банке.

Способствовать обучению голосового помощника должны клиенты Тинькофф Банка. Пользователи смогут ставить его репликам «лайки» или «дизлайки», которые будут анализироваться командой «Тинькофф». В случае если у Олега возникнут затруднения с решением задачи клиента, ему можно сказать: «Хватит» или «Позови человека». Предполагается, что голосовой помощник уточнит у пользователя необходимую информацию, а затем поставит задание, которое уже будет выполнять оператор банка.

На практике голосовой помощник Тинькофф Банка далеко не всегда выполняет поставленные задачи и часто вынужден переадресовывать запрос операторам или вручную выполнять его в приложении. Так, на первый ключевой запрос «Переведи деньги», который по замыслу разработчиков должен помочь установке сервиса, Олег предлагает пользователю открыть список контактов, чтобы выбрать адресата вручную. Он также может попросить продиктовать номер телефона получателя, но закончить операцию не может. «Что-то пошло не так», — признается Олег.

На этапе запуска для помощника большое значение имеет формулировка запроса. Так, Олег не может ответить на вопрос: «Сколько стоит доллар?», но может указать раздел в приложении в ответ на просьбу: «Какой курс доллара?». Не реализованы в полной мере и анонсированные банком опции «заказа в салон красоты» или в любую компанию не в списке партнеров банка, довольно сложно с помощью Олега забронировать столик в ресторане или купить билет в кино. Не избежал Олег и распространенной проблемы других помощников — часто он воспринимает как запрос речь стоящих рядом случайных собеседников.

В затруднительных ситуациях Олег передает информацию оператору, и это действие нельзя отменить. Поскольку такие ситуации на старте работы помощника встречаются часто, клиенту банка приходится много общаться с колл-центром или прерывать запрос. Кроме того, в качестве альтернативы на сложный запрос Олег предлагает спросить у него совет. Ответы, как правило, касаются финансовых рекомендаций клиенту. Однако помощник все же способен дать ответы на сложные вопросы. Так, редакция российского Forbes спросила Олега: «Как попасть в список Forbes?» Помощник после пятиминутных раздумий ответил: «Надо увеличить список до 1 млрд богатейших людей». «Сейчас в глобальном списке Forbes — 2153 миллиардера, так что если расширить список, то шансы попасть в него действительно вырастут», — иронизирует издание.

Как «включить» голосовой ответ для Олега

Я об этом долго не знал. Олег может отвечать не только текстом, но и голосом. Для этого надо выключить беззвучный режим на смартфоне, увеличить громкость динамика и задавать вопросы ассистенту именно голосом.

Голос у Олега, кстати, необычный – не похож на распространённые ассистенты спокойным тембром и уверенностью в тоне. Даже общаться хочется, лишь бы отвечал голосом.

Единственное, надо голосовому движку получше работать с озвучиванием пауз перед знаками препинания. А то иногда ка-ак зажует их – и резко из убедительного «мужика» превращается в робота.

Лично меня как редактора отдельно радует, что любые голосовые запросы, заданные Олегу, автоматически распознаются уже со знаками препинания, включая запятые. До сих пор так не делает ни та же Siri, ни Google Ассистент, ни Алиса от Яндекса.

Дарья Черкудинова

журналистка, ведущая подкаста «НОРМ»

Мне всегда нравился мой голос в записи. Это было одним из важных пунктов, почему мы решили делать подкаст — ни у меня, ни у Насти Курганской не было проблем с отношением к своему голосу. Какое-то время меня немножко парило, что я не могу, как в письменной журналистике, взять и переписать в косвенную речь какую-то косноязычную фразу моего спикера. Но потом привыкаешь редактировать по звуку, а не по тексту. И если мне что-то совсем не нравится, я оставляю какие-то эмоциональные кусочки из речи спикера, а остальную историю пересказываю своими словами.

Сейчас в подкастинге есть уже некий перегрев — много подкастов про популярную психологию, секс, успех, много выпусков в жанре «интервью с интересным человеком». Хочется чего-то новенького. Чтобы начать, нужно большое желание и, может быть, какой-то человек, который будет вас поддерживать. На ютуб-канале фестиваля «СЛЫШ» есть много полезных лекций для новичков в подкастинге: про микрофоны, монтаж, рекордеры и всё прочее.

Подкасты монетизируются двумя способами: либо продается реклама внутри подкаста, либо создается сообщество вокруг подкаста, которое донатит вам. Сотрудничать с брендами мы начали по запросу брендов. Первую рекламу в «НОРМ» разместили в 2019 году, это было издательство No Kidding Press. Сейчас мы делаем не только «НОРМ», но и коммерческие проекты для заказчиков. Консультируем, редактируем, помогаем придумать концепцию подкаста и докрутить ее, сдаем в аренду нашу студию. В общем, крутимся-вертимся по-разному.