Ах, Алиса, как бы нам встретиться? Как поболтать обо всем?
Привет.
На днях услышал грустную историю о том, как мой приятель мучается в отсутствие умного дома от Google в наших широтах. В городской квартире и за городом он настроил Алису от “Яндекса”, все возможности умных колонок полностью его устраивают, за исключением одной “мелочи”: его младшую дочь зовут Алиса. Пятилетний ребенок с удовольствием говорит со своей тезкой, но для родителей это превратилось в нескончаемый кошмар, любое обращение к дочери пробуждает колонки. Смена фразы активации на “Яндекс” привнесла другие проблемы, теперь каждая колонка пробуждается и пытается что-то сделать. Дети смотрят в гостиной фильм, родители на кухне что-то обсуждают и просят “Яндекс” найти ответ на вопрос — мультики отрубаются, и нужно их включать снова. Невозможность выбора имени в настройках Алисы – функция, скопированная у Google, причем скопированная механически и без особых размышлений (если вам нравится, то можно сказать, что копировали Alexa от Amazon, разницы тут нет).
В идеальном мире каждая колонка должна уметь определять, что обращаются именно к ней, и соответственно реагировать. К сожалению, у продуктов от “Яндекса” такая опция есть, но работает она не слишком хорошо. Решением могла бы стать возможность называть каждую колонку своим именем, но такой опции в силу ряда причин нет. И это то, что унаследовано от той же Google как идея, которая потерялась или не была понята правильно.
Лидером рынка голосовых ассистентов в мире сегодня является Google, компания изначально выстроила систему так, чтобы при обращении вам нужно было произносить имя корпорации. Кто-то скажет, что это выдумка маркетологов, чтобы повышать привязку к бренду, но на самом деле это не совсем так. За выбором фразы активации стоит красивая идея о том, что голосовые помощники должны эволюционировать, от младенчества, в котором они находятся сегодня, переходить к первым шагам, затем дорасти до школы и так далее.
Хорошим примером может служить фильм “Она”, он вышел в 2013 году, но отлично описывает то будущее, что нас ждет. Небольшой компьютер в виде беспроводной гарнитуры становится спутником Теодора, главный герой обретает в нем друга, любимую женщину. В фильме есть интересный момент, когда Теодор настраивает голосового помощника, и “она” пролистывает книгу с детскими именами, чтобы выбрать имя собственное, называет себя Самантой. Если пропустили фильм, то посмотрите, он откровенно хорош и пытается исследовать грань между человеком и технологией.
Идея Google в области голосовых ассистентов заключается в том, что они могут получать имя собственное в момент, когда их AI-алгоритмы станут неотличимы от живого человека и такой ассистент пройдет тест Тьюринга. Конкуренты, не имеющие столь сложных технологий и перспектив, напротив, используют имена собственные, чтобы придать своим продуктам налет человечности. Мы видим использование таких имен, как Siri, Alexa, Алиса и других, это попытка добавить человечности продуктам, в которых нет на данный момент чего-то сложного. Одушевление нематериальной материи, программных кодов дает дополнительные очки, словно человек начнет относиться к продукту иначе, перенесет на него отношение к живому человеку. Но этого не происходит в силу того, что голосовые ассистенты не очень сложны, они не умеют поддерживать диалоги, могут отвечать только на прямо поставленные вопросы, причем многие из них неверно их понимают в разном контексте.
Какие профессии наиболее популярны и высокооплачиваемы?
Налейте чашку бодрящего субботнего кофе и познакомьтесь с новостями недели. Apple представила новые процессоры, TECNO показала складной смартфон, в RuStore появились платные приложения, а HAVAL нарастил продажи…
Новый выпуск нашей рубрики, посвященной автомобилям. Сегодня немного новостей про новые кроссоверы в версии Coupe от Porsche и Mercedes-Benz, как «Яндекс» и Hyundai совместно будут разрабатывать беспилотники и, конечно, тест автомобиля Audi A4. Поехали!
Игровая гарнитура с фирменной настройкой Creative SXFI, которая потребует от вас предоставить фото ваших ушей и установить два приложения на смартфон. А еще у нее два микрофона в комплекте и обещание, что она сможет заменить обычную гарнитуру для смартфона.
Будущее за решениями, в которых мы сможем самостоятельно выбирать имена для своих устройств, для каждого из них. Поставили колонку на кухне, придумали для нее имя. В гостиной у колонки другое имя и так далее. При этом следующий шаг, который необходим для развития умных колонок, это распознавание индивидуальных голосов тех, кто живет в доме. В “Яндексе” пока не умеют этого делать, что приводит к тому, что ребенок может заказать такси, просто играя с колонкой. Задача, безусловно, сложная и требующая недюжинных технологических трюков, но та же Google с ней справляется. В “Яндексе” над распознаванием разных голосов работают, но за последние два года прогресс в этой области отсутствует, если судить по тому, что происходит в коммерческих продуктах.
В 2017 году, когда в “Яндексе” выбирали имя Алиса, в компании рассуждали, что оно должно быть уникальным и не самым распространенным. Выбирая между именами Майя и Алиса, предпочтение отдали второму, так как перепутать его с другими словами сложно. А вот Майя легко бы отзывалась на словосочетание “Девятое мая”.
Мне стало интересно посмотреть, как выбор имени “Яндексом” повлиял на то, как называют девочек в нашей стране. Пока такое влияние есть в больших городах, на примере Москвы видно, что имя Алиса постепенно становится все менее популярным, и это только начало пути.
Думаю, что родители не хотят называть девочек именем голосового ассистента, причем эта зависимость хорошо видна в Москве и в Петербурге. Можно наложить распространение умных домов на эти города, и тогда получим прямую зависимость. Как раз начиная с 2019 года есть определенный всплеск в использовании умных домов, их количество растет, а Алиса безусловно доминирует в этой области. Уверен, что имя полностью не исчезнет, но то, что стараниями “Яндекса” оно станет менее распространенным, не вызывает сомнений.
И в этом аспекте выбор выдуманных имен намного лучше, а ведь таковыми являются Google, Cortana, Bixby. Сказать, что имена собственные так же хороши, нельзя. Выходом становится возможность назначать другие имена (фразы активации) для продуктов. Изъяном для маркетологов выглядит то, что люди могут баловаться и называть своих помощников неблагозвучно: “Эй, дурень, включи мне любимую музыку”. Но изменить природу человека так, как этого хотят маркетологи, чтобы все было исключительно по брендбуку, невозможно. Будут менять, будут баловаться, и с этим просто нужно смириться.
В Америке и частично в Европе не первый год идут нешуточные баталии относительно голосов ассистентов. Почему это женские имена, почему они звучат как женщины? И это несмотря на то, что вы уже можете выбрать и мужские голоса, выбор всегда за вами. Пройдет совсем немного времени, и голосовые ассистенты научатся говорить голосами разных людей — звезд кино и просто известных людей, выдуманных персонажей. Выбор будет за вами, будет зависеть от того, кого вы захотите услышать. Огромный рынок имитации голосов еще ждет пробуждения, и он наверняка появится. Поэтому все крики о сексизме, о том, что ассистенты исключительно женщины, от дурости, и можно сказать, что люди бесятся с жиру. В конце концов, никто не обещал, что ассистент изначально должен быть любым и предоставлять выбор. Это всегда дополнительные деньги, которые компании тратят неохотно. И причина этого в том, что им нужно развивать голосовые ассистенты, доводить до нового уровня.
Технологии, что стоят за голосовыми ассистентами и их разумностью, обыденны. Алгоритмы не так уж сложны, но требуется наработка большого количества голосов, их распознавания. Поэтому Google и лидирует в этой области, объем обрабатываемых данных на разных языках огромен. Компания лидер в этой области и останется им.
Эмоция — это сложная штука. Эмуляция эмоций не так проста, в голосовом помощнике это заученные фразы, которые быстро приедаются, мы слышим в них фальшь. И это следующий рубеж, над которым работают компании, научить синтезированные голоса не только зачитывать текст, но и придавать ему эмоции. Тот же “Яндекс” пытается это сделать на массиве книг, в недавнем обновлении Алисы добавили возможность чтения любой бумажной книги, это та самая наработка базы, чтобы в дальнейшем преобразовать начитанное в подобие эмоций. Текст, в котором знаками препинания передается та или иная эмоция, оцифровывается и превращается в учебник для робота.
Бурное развитие голосовых помощников идет последние пять лет, они постепенно проникают в нашу повседневную жизнь. Сказать, что это направление затормозится, нельзя. Но от энтузиазма первых шагов мы перешли к зрелому рынку. Например, та же Siri замерла в развитии, она так и осталась младенцем, которым почти не пользуются, так как она сильно ограничена в своих возможностях. В Bixby от Samsung та же проблема, задачка оказалась не такой простой и требует нешуточных вложений, поэтому Bixby эволюционировал от голосового помощника к системе команд (собственно, так же, как и Siri). Сильнейшим игроком на этом поле является Google, второй с заметным отрывом от нее идет Amazon. В России в отсутствие этих двух компаний лидер только один, это наш “Яндекс”. И это дает компании возможность развиваться, защитить свой кусочек мира, лучше приготовиться к приходу конкурентов. Но скорость развития Алисы очень низка, за это время Google уходит далеко вперед и не удается не то что сохранить разрыв в технологиях, он постоянно увеличивается. С другой стороны, это лучше, чем ничего. Многие страны просто не имеют ничего подобного, и наличие собственного голосового ассистента — это хорошо. Тем более что в гонку вступили другие компании и тот же Сбер за счет финансовых вливаний может побороть технологии Алисы в среднесрочной перспективе. Для нас это хорошо, так как совсем скоро мы сможем переименовывать своих помощников и болтать с ними на отвлеченные темы. Хорошо это или плохо, не знаю, но будущее станет именно таким.
А вы пользуетесь умными колонками?
Обсуждаем голосового помощника от «МегаФона»: как будет развиваться Ева, получит ли брата или сестру, проблемы на рынке подобных технологий и пути развития.
Как смартфоны научились убирать языковой барьер и почему времена Star Trek неожиданно наступили здесь и сейчас.
Да, Сири из первого массово внедренного в потребительскую технику ассистента превратилась в самого отстающего. Эльдар Викторович тут абсолютно прав, текущее её состояние иначе как плачевным не назвать, в сравнении с тем же Гуглом.Добавлю только, что Эппл стала на данный момент единственной из зарубежных техгигантов, который внедрил поддержку русского языка в свои умные колонки. Для меня по сей день остаётся загадкой, почему Гугл убрал поддержку русского языка из своих динамиков
Думаю политика, демократия и что-то типа Крым наш. Хотя сейчас подумал, возможно тут товарищ майор замешан.
Надо было Виленой назвать
Могли бы в самом деле назвать "Да, Яндекс". Свободу человеческим Алисам!
Умных колонок нет и вообще голосовое управление не понимаю.Отец пользуется на телефоне — но у него со зрением плохо.
Напихать в каждую комнату умную колонку — зачем это?Зачем вообще нужны эти колонки?Ну и яндекс — филиал известно чего, будет постоянная слежка и запись всего происходящего. Кто как путена назвал и т.д.
Есть вариант "Яндекс"
Да, пользуюсь каждый день, прикольно.
Что мне не хватает в Алисе (я. станции)1.расширенная работа со сценариямина данном этапе все оооочень ущербно, причем до покупки я был уверен что все это ДОЛЖНО работать из коробки, т.к. это настолько очевидные вещиНет возможности выбрать в сценарии два последовательных действия.Например приветствие И включение музыки (выбор только ИЛИ) https://uploads.disquscdn.c… https://uploads.disquscdn.c… 2. нет возможности работы сценариев по таймеру. Например, ребенок говорит спокойной ночи. колонка должна включить ночник. прочесть сказку и через 30 минут все выключить.Реализовать можно, но через костыли, а не в рамках конкретного сценария.3. Нельзя выбрать/запрограммировать несколько "случайных" ответов.Например Я дома => Привет хозяин, Здравствуйте. ура, хозяин вернулся .. (просто примеры, но смысл ясен)4. Редактирование сценариев на ПК, ну это просто пожелание.5. Да, тоже думал о изменении имени, а то у всех алиса
Задача, безусловно, сложная и требующая недюжинных технологических трюков, но та же Google с ней справляется.Как верно замечено в соседней статье гугл способен производить миллионы строк кода в ограниченные промежутки времени. Потому камень на камень, костыль на костыль и вот уже что-то отдаленно напоминающее интеллект уже типа работает. Яндекс так не может. Огромный рынок имитации голосов еще ждет пробужденияТелефонные мошенники радостно потирают руки в предвкушении. А кое-кто уже собирает образцы голосов недалеких весельчаков развлекающихся тем, что болтают с жуликами, тем самым отдавая им свою биометрию.Например, та же Siri замерла в развитии, она так и осталась младенцем, которым почти не пользуются, так как она сильно ограничена в своих возможностях. В Bixby от Samsung та же проблема, задачка оказалась не такой простой и требует нешуточных вложений, поэтому Bixby эволюционировал от голосового помощника к системе команд (собственно, так же, как и Siri).Эппл и самсунг вовремя сообразили что попытки мимикрировать под интеллект, еще толком не понимая что это такое, это тупик. Здесь каждый последующий шаг будет даваться тяжелее чем предыдущий, а затраты на каждый новый костыль будут возрастать в геометрической прогрессии.Поэтому позиционирование своих помощников как системы команд, чем они на самом деле и являются, это самая правильная позиция на текущий момент. Остальные пусть надувают щеки и выдают желаемое за действительное, рано или поздно за обман придется заплатить, кому деньгами, кому репутацией, а кому и своим существованием.
А как можно воспринимать эту здоровую табличку в середине текста, в отрыве от, как минимум, рождаемости?И очевидно, что в 2021 будет больше, чем в 2020, это значит, если следовать логике поста, что люди в 21 году стали ЧАЩЕ называть ребёнка именем голосового ассистента?
учитывая отсутствие у нас AW с сотовой связью, функциональности чипа, отвечающего за точную геопозицию устройств и самого 5G, склонен с вами согласиться
Возможно. Вот только Ассистент уже понимает контекст, а деньги у Гугла и не думают заканчиваться. А для Сири придумали ярлыки и успокоились, что иначе чем завуалированным отказом от развития своего голосового ассистента и не назвать.А может быть, Эппл уперлась в другое – в отсутствие специалистов, ведь в такой сфере нет бесконечного их количества. А гугл всех их запылесосил
Возможно, но думаю это не главная причина. Мужские голоса банально хуже звучат. Возьмите любого производителя, у которого есть оба. Женский всегда мелодичней.
3. Чтобы добавить жизненности.
есть станция мини в тандеме с модулем новым.работают, часто кое-как.Модуль уж вышел пару месяцев как, а кривь все не исправляют: 1. раз в неделю минимум пульт перестает реагировать на голосовые команды. приходится пепеспаривать.2. в приложении Окко для модуля нет звука при проигрывании фильмов, при этом в трейлерах и на заглавной странице звук есть. Поддержка Окко говорит проблема известна и она на стороне яндекса, яндекс пишут стандартную фигню про "попробуйте переустановить".3. нельзя командами открывать приложения, ютуб, например.4. результаты поиска, серии в сериалах выводятся в виде горизонтальной полоски вверху экрана, 3/4 экрана пустая, проматывать вдаль вправо по полчаса приходится5. во время проигрывания титров (пока горит табличка "пропустить") невозможно сделать ничего, кроме как выйти на домашний экран.6. прерывается проигрывание если колонка среагирует на что-то. Например, как она часто делает, на имя Эльза. Если ребенок смотрит Холодное сердце (там есть такая Эльза) — приходится кнопкой выключать микрофон на колонке.на фоне этого смешно было смотреть хвалебный фильм яндекса о самом себе, кот. появился недавно на заглавной странице)
Вроде в настройках Алисы можно указать распознавание детского голоса, чтобы настроить сценарии исключающие случайный вызов такси ребенком 🙂
Вот я и обозначил возможную причину – отсутствие спецов. Ну или поняли, что их бизенс-модели не требует развитие их ассистентов в направлении ИИ
А вот если бы не бросили развивать Yandex Phone..,
Ну да для начала надо дать выбор своего имени колонки а то иногда не удобно
Да нет, говорим об одном и том же. И не совсем понимаем друг друга. Вот оно — разум! )))) Колонки поняли бы друг друга с полуслова."Метанейросеть", умеющая обобщать и подстраиваться под каждого конкретного абонента, со знанием технологий межличностного общения, как мне кажется, может в значительной мере "убить" обычное общение между людьми. Зачем общаться с живым человеком, если есть ассистент, который и подскажет так, как нужно и послать может в нужный момент и вообще будет идеально подстраиваться под настроение.
Поворот прохлопать можно или зад авто спереди, тоже прохлопать по причине отвлечения на навигатор 🙂
Левитана зачем использовали в своё время? ;-)Использовали бы какую-нибудь молодую профурсетку.
Пока что все эти ассистенты невероятно тупые.Что то спрашиваешь, они заглыхают.Быстро «наигрываешься» с ними.То есть погоду и пробки можно посмотреть на телефоне на одном экране.Некоторые извращуги вешают включение света на голосовую команду, но это очень похоже на неоднократное повторение в телефон «позвонить жене» — когда можно просто ткнуть на иконку вызова. https://uploads.disquscdn.c…
Чем вам поможет "через 500 метров возьмите немного левее"? Насколько немного мипая? И как я на ходу эти 500 метров отсчитаю. Ты только скажи. Я возьму, если не промажу :)Или это приглашение посмотреть на экран где опять сменилась реклама в плашке.
Считаю, что корреляция выбора имени Алиса с распространением ассистента в статье не доказана. "Думаю" это не доказательство. Такие утверждения надо обосновывать даже в курсовой работе, не говоря уже о более серьезном уровне.
Вы не поняли! Компьютерные голоса, а не человечьи!
С точки зрения возможностей, Алиса действительно уступает Google, но это вопрос времени. А вот с точки зрения самой речи, Алиса на порядок лучше, и скорее всего такое лидерство у неё будет ещё долго. Даже если опустить язык, Алиса разговаривает куда более естественно, чем любой другой ассистент в мире. У Алисы есть чёткие эмоции, настроения, тональность, и её воспринимаешь как живого помощника. Ассистента Google воспринимаешь исключительно как бездушную машину без имени. Если Google и соберётся активно развивать в России это направление, он всё равно будет на втором плане, так как не достигнет такого же уровня построения речи (раз уж на английском этого не достиг, на русском тем более они этим заниматься не будут).
Наличие некоторых спорных указаний, не исключает множество полезных. Да и в данном случае, мозг отлично поймет — через 500 метров внимание на лево. То есть направо смотреть не надо, вот прямо сейчас тоже никаких действий, но и расслабляться нельзя, скоро поворот. И в отличии от пешеходных маршрутов, где тропинки могут пересекаться и поворачивать под неимоверными углами в неимоверных сочетаниях, асфальт на порядок предсказуемее.
Яндекс отнял у маленьких девочек шансы быть названными Алисами. Ну после этого обвинения кровожадная корпорация уж точно должна обратить внимание на правильную аналитику! ))))
Я, кстати, не пользовался Google-ассистентом именно из-за его деперсонифицированности. Siri пользуюсь регулярно, когда руки заняты. Классический сценарий — для управления музыкой в наушниках, она же мне уведомления зачитывает, когда телефон в кармане. Но именно "Алиса" мне нравится больше всего тем, что она почти живая. А за Google-ассистентом — там за ним ничего нет, что наш человеческий мозг может воспринять как личность. Это именно как говорить с телефоном.
А разве в навигаторах у примеру не человечьи голоса, — чистый синтез (прямо абсолютно, вне семплов человечьего голоса) вроде нигде не встречается.
Ну как только навигатор начинает говорить — смотришь на него и готовишься к маневру.Это в телефонах, их большинство и использует.Встроенный навигатор с проекцией все таки очень редко встречаются, как раз 10% дай боже.
Раньше, во времена WinCE, да, сэмпловый. Причем для каждой программы свой. А сейчас, когда синтез является системным компонентом почти любой ОСи, фиг его знает. От модели наверное зависит.
Алису можно настроить, чтобы она реагировала на "Слушай Яндекс" вместо "Алиса". И это делается простым нажатием кнопки в настройках. Более того, команда "Слушай Яндекс" появилась ещё ДО "Алисы".Невозможность выбора имени в настройках Алисы – функция, скопированная у GoogleДальше, собственно, можно и не читать статью. Раньше таких ляпов от ЭМ не наблюдал. ((((((
"Смена фразы активации на “Яндекс” привнесла другие проблемы…"
>>Почему это женские именаМужской вариант Алисы мог бы быть Алескеем.
Тогда уж лучше кошку завести )))Или робот-пылесос!
Чтобы возить кошку ? :))
Кстати да ))))
Зачем что-то улучшать, если всё и так "хавают".)
насчет русификации в iOS намного хуже. Даже магазин приложений и эпл тв перевести не могут — при этом контент там русский есть.
Почему? Вполне подтверждает. Может не настолько ярко как с ошибкой в итого, но каждая десятая семья Москвы из потенциально желавших назвать ребенка Алисой, _резко_ передумала. Вполне аргумент.
Олег
Очень субъективное мнение. У вас вероятно просто нет внятных usecase. Мне лёжа в постели гораздо проще сказать — "выключи свет" чем тыкать в телефон или идти к выключателю. Гораздо проще уходя из квартиры сказать — "выключи свет везде" чем последовательно оббежать все свои многочисленные помещения. Когда я сажусь смотреть фильм по фразе — "давай смотреть кино" гаснет верхний свет, включается с минимальной яркостью подсветка на торшере и подаётся питание на саудвуфер в аудисистеме. Узнать прогноз погоды когда только начал одеваться утром, тоже проще голосом не отвлекаясь на телефон.На кухне, когда готовишь и у тебя грязные руки. Переключить радио, поставить таймер. Всё это гораздо удобнее делать голосом.
Мне кажется это все надуманно, проще пару виджетов на одном экране посмотреть, (а, я понял — у вас айфон), в какое направление из ЖК выехать, плюс сколько градусов на улице, да и в окно банально выглянуть.Да и вообще, жениться вам надо, баринъ ;-)Настоящая живая мясистая Алиса намного больше умеет и реагирует на команды.Может машину водить, ее же откапывать, включать музыку, выклбчать свет, платить по счетам, вызывать такси.. ну и все остальное.
Полный синтез голоса все еще деревянный.Поэтому используют смешанные модели.Ну, тот же Яндекс навигатор женщина есть же какая-то, периодически мелькает в новостях.
ну разве нельзя переименовать ребенка??? Алиса — это же полное имя. У нас никто полным именем дома не называет. Леонид, Анна, Светлана. Так разве говорят дома???? Называйте ребенка Аля и все.
Mobile-Review.com простым языком рассказывает о технологиях, гаджетах, устройстве бизнеса электроники изнутри и интересных событиях в мире IT. На сайте представлены как статьи для широкого круга читателей, так и профильные материалы для игроков рынка.
Mobile-Review.com – ресурс для думающей аудитории, желающей знать сегодня, что произойдёт на рынке высоких технологий завтра.