Форум на Kuban.ru (http://forums.kuban.ru/)
-   Разработка программ (http://forums.kuban.ru/f1024/)
-   -   Где можно применить управление голосом? (http://forums.kuban.ru/f1024/gde_mozhno_primenit-_upravlenie_golosom-6112181.html)

135 рублей за доллар 20.09.2014 21:08

Где можно применить управление голосом?
 
Здравствуйте. Возможно, я уже отстал от технологий, тем не менее...
Есть у гугла распознаватель речи, есть возможность этот распознаватель использовать в сторонних приложениях. Ставим в квартире микрофон с радиусом действия 20 метров, делаем управление голосом.
Вопрос: чем можно управлять голосом? Например, включать/выключать свет в определённой комнате. А где ещё такое можно применить?

40KHYTbIU 20.09.2014 23:55

0-135 рублей за доллар >В рамках умного дома?

D_Link 21.09.2014 12:10

Слив в сортире, шторы, свет, у кого разноцветная подсветка смена фона. С газом лучше не шутить, как и с водой в ванне. Температуру на улице проверить. Трек любимый на компе включить.

Девочек вызвать. :)

SheLLest 22.09.2014 07:36

Ну первое, что на ум приходит - это конечно система "умный дом", где в принципе полет фантазии богатый.
Я себе когда-то делал управление Windows, с возможностью расширения команд.
В каких-то более серьёзных вещах - я бы побоялся, любой человек, который занят в этой сфере, скажет, что технология ещё не очень совершенна и есть большой процент погрешности (особенно для русского языка).

tdvt 01.10.2014 11:32

Места, где можно применить:
Справочные системы/доступ к базам знаний, call-центры, автоматизация склада,логистика, системы "заказ по телефону" и т.д. и т.п. Основная идея, использовать для замены низкоквалифицированного персонала, работа которого допускает автоматизацию с существующими технологиями.
Однако, всё-таки распознавание речи в реальных промышленных применениях далеко от человека по качеству. Т.е. применять можно, но очень осторожно, и только там, где использование классического call-центра - слишком дорого/не эффективно.

LostDaemon 29.10.2014 17:11

Что касается надежности распознавания, то это зависит от используемого принципа.
Различают командное и фонемное распознавание речи.
При командном распознавании записанный фрагмент сопоставляется набору заранее определенных голосовых команд. Точность распознавания при этом даже в русском языке достигает 98%. Такая надежность не позволяет использовать голосовое управление для управления опасными производственными или скоротечными процессами, однако с легкостью может заменить ручной ввод в таких некритичных приложениях как управление лифтами, домашним освещением, бытовым кондиционированием, аудиосистемами и бытовой электроникой.

Потоковое пофонемное распознавание речи (это то что предлагает Google и Apple) - это задача на порядок более сложная и, соответственно, процент ошибок там выше. Хотя при желании, деньгах и arduino можно например можно заказывать голосом трек с yandex music, справку о термине с Wikipedia, информацию о погоде, курсе валют и т д.

ipp 29.10.2014 19:36

0-135 рублей за доллар >та нафиг, интернет отвалился или гугл решит изменить условия использования или вообще все это прикроет и тогда что.
Есть отдельные чипы которые можно обучить, но и это имхо баловство. Запаришься каждый раз говорить.

LostDaemon 30.10.2014 08:47

В фонемном распознавании речи от сторонних сервисов к сожалению не уйти.
Распознавание потоковой речи алгоритмически значительно более сложная задача, чем, например, распознавание графических образов. В отличие от большинства других видов распознавания для потоковой речи до сих пор не сложилось "универсальных рецептов" создания. К тому же хранение образов для распознавания, обеспечение работы отдельной для каждого естественного языка нейросети - все это предъявляет высокие требования к аппаратному обеспечению и каналам связи.

Все API онлайновых системы распознавания речи доступны за деньги по договору, а бесплатные версии этих API имеют ограничения. И я скорее поверю что у вас банально отключат электричество, чем Google, Apple и Yandex в ущерб репутации станут менять принципы взаимодействия с их системами.

ipp 30.10.2014 10:51

7-LostDaemon >чем Google, Apple и Yandex в ущерб репутации станут

А то до этого тот-же гугл не закрывал свои сервисы, или тот же гугл с яндексом не меняли API для работы с сервисами.
А модули есть, например, вот такие
[url]http://www.veear.eu/products/easyvr/[/url]
Сам пока их не использовал, так как не возникало таких задач, да и вряд ли они возникнут.

LostDaemon 30.10.2014 10:56

8- меняют меняли и будут менять, но обратная совместимость то остается, что позволяет ранее созданному ПО не терять функциональность.

Модули интересные, спасибо за ссылку, правда они для командного распознавания и не поддерживают русский язык.

40KHYTbIU 30.10.2014 11:13

Ток шо Яндекс презентовал свои сервисы для разработчиков по работе с голосом. Вроде бесплатно и всем.

fanatnascar 05.11.2014 21:53

10-40KHYTbIU >ну, во первых, не бесплатно. Чуть нагрузки - и отвалится, разве что в пару рыл домом командовать.
Работаю с ними в плане распознавалок голоса для ивр и телефонных роботов. Такса 5$ 1000 запросов, минимум штука баксов месяц. Я договорился чуть дороже, но без минимума.

Если что подсказать по ним - спрашивайте. Распознает шикарно!

40KHYTbIU 09.11.2014 11:25

Амазон предлагает автономную Siri
[url]http://www.amazon.com/oc/echo[/url]

usli1711 02.03.2015 23:10

Ну может...

fanatnascar 03.03.2015 05:47

12-40KHYTbIU >не автономную
When Echo detects the wake word, it lights up and streams audio to the cloud, where we leverage the power of Amazon Web Services to recognize and respond to your request.


Текущее время: 07:26. Часовой пояс GMT +3.