Форум на Kuban.ru (http://forums.kuban.ru/)
-   Веб-дизайн и программирование (http://forums.kuban.ru/f1030/)
-   -   В гугле добавился сервис распознавания речи (http://forums.kuban.ru/f1030/v_gugle_dobavilsya_servis_raspoznavaniya_rechi-6416155.html)

Dude 12.01.2015 18:20

В гугле добавился сервис распознавания речи
 
и довольно неплохо распознает
translate.google.com

внизу слева микрофон. Включить и диктовать.

Помню, когда-то задумался над таким сервисом, но конечно же гугль обогнал. Молодец, что тут еще сказать.

fanatnascar 12.01.2015 18:50

[img]http://animatika.ru/netcat_files/userfiles/3/facepalm.jpg[/img]
откуда они берутся?

Dude 12.01.2015 19:24

[quote=Фанат NASCAR;37710426] откуда они берутся? [/quote]
чем недоволен?

kservice 12.01.2015 20:39

2-Dude >дык этой новости уже не помню сколько лет

fanatnascar 12.01.2015 20:42

[quote=Dude;37710120]Помню, когда-то задумался над таким сервисом[/quote]
этим )
но не то что недоволен.. в общем, фейспалм.
Десятки специалистов десятки лет реализовывали терабайты математических данных, разрабатывали и сводили в кучу десятки и сотни алгоритмов, в общем - потрачены миллионы долларов.

Хотел..

fanatnascar 12.01.2015 20:47

и кстати - это не сервис распознавания речи. Это переводчик.
Сервис по другой ссылке, он платный.

Искусственный Интеллект1 13.01.2015 00:02

0-Dude > Сервис распознавания речи - это получение текста из речи (файла с аудиозаписью). А сервис, который вы указали действует как раз на оборот. :) Да и лет ему уже много. :)

Dude 13.01.2015 00:56

4-Фанат NASCAR >
"мечтал" устроит? =)

Dude 13.01.2015 00:57

[quote=Фанат NASCAR;37711661]и кстати - это не сервис распознавания речи[/quote]

и

[quote=Искусственный Интеллект1;37713757]А сервис, который вы указали действует как раз на оборот[/quote]

"внизу слева микрофон. Включить и диктовать."

Dude 13.01.2015 00:58

+8
безплатно

40KHYTbIU 13.01.2015 10:34

0-Dude > Неверная формулировка, под сервисом тут понимают google speech api, т.е. то что можно использовать в своих приложения.
То о чем вы говорите - это добавление на сайте переводчика возможности speech2text, сам не смотрел и не проверял, но если они распознают хотя бы половину представленных у них в переводчике языков, то это очень круто!

40KHYTbIU 13.01.2015 10:48

Полистал, поддерживается только в Хроме, следовательно, это google speech api (если у кого-то были сомнения).

7-Dude > Есть идея для стартапа, сделать speech2text для таджикского языка, такого в гугл нет! Для него они не в приоритете, но приложение которое будет переводидь на русский, в маскве полетит! Срубите бабла и осуществите мечту! =)

fanatnascar 13.01.2015 12:04

7-Dude >полностью)
Распознавалка речи лучшая - у яндекса. Только узнай условия, цены)
Не понравятся - стучи, предложу вариант.

fanatnascar 13.01.2015 12:05

8-Dude >и все таки это переводчик. То есть - для коммерческого использования не подойдёт. Ограничения.

Искусственный Интеллект1 13.01.2015 14:29

8-Dude > а да, есть такая вещь, забыл про нее. Но такое распознавание я видел не только в гугле, но и еще где-то (не помню где) и уже давно.

Dude 13.01.2015 18:49

13-Фанат NASCAR >
да, но фича классная. И, главное, что она безплатная.

14-Искусственный Интеллект1 >
dictation.io?

Искусственный Интеллект1 13.01.2015 23:08

15-Dude > нет. Вроде это было вообще в телефоне.

Dude 14.01.2015 00:35

Имею подозрение, что распознавание речи не программное.
Во всяком случает не на сто процентов.

fanatnascar 16.01.2015 17:44

15-Dude >вам её отрубят, если:
Заподозрят, что вызов сервиса идёт не из скриптов гуглопереводчика

Если будет запросов чуть более, чем минимум

Просто так, когда им захочется (будете обращаться curlом с адреса, который в пуле vds-хостера)

Я бы не стал делать никакие ставки на сервис в таких условиях.

Представьте. Я занимаюсь телефонными роботами. Многое построено на распознавании. Стал бы я использовать это?

fanatnascar 16.01.2015 17:44

17-Dude >конечно, там тысячи китайцев этим занимаются онлайн. И индусов.

kservice 16.01.2015 22:53

[quote=Фанат NASCAR;37754897]Я занимаюсь телефонными роботами[/quote] - это круто, но думаю опечатка :)
если [quote=Dude;37724933]что распознавание речи не программное.[/quote] то
[quote=Фанат NASCAR;37754897] тысячи китайцев этим занимаются онлайн[/quote]в живую, поэтому наверное все-таки программное.

fanatnascar 17.01.2015 22:59

20-kservice >можно просто программировать китайцев, у них разъём у всех имеется)
Очепяток нет, робот ныне скорее самостоятельная сущность, чем железо с сервами.

Dude 18.01.2015 02:57

[quote=Фанат NASCAR;37754897]конечно, там тысячи китайцев этим занимаются онлайн. И индусов.[/quote]
где-то читал, как админ сделал, чтоб посетители порносайта распознавали скан текстов, вводя капчи.

То же самое можно сделать и с аудио.
первая ступень: определение языка.
вторая ступень: распознать одно слово из нескольких в фрагменте.
Где-то-так.

fanatnascar 18.01.2015 13:06

Приемлимая скорость распознавания аудио для телефонных роботов - две секунды. Лучше одна.
Текущая система, с которой я работаю, укладывается. При этом, например, числа распознает безошибочно. Слова также великолепно.
Индусы - была шутка)

Dude 18.01.2015 17:25

может и так.
Просто заметил, что перевод двух-трех слов может длиться до десяти секунд.

Dude 18.01.2015 17:26

не перевод, а распознание

fanatnascar 19.01.2015 16:21

25-Dude >это скорее из за слабого канала или проблем с ним. Я строю только на нормальных vds в датацентрах, предварительно обрабатывая файлы, записанные с канала. Проблем нет с длительностью обработки.
Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса.

Dude 19.01.2015 18:31

[quote=Фанат NASCAR;37780853] Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса. [/quote]
наверно там тоже есть человеческий фактор.
Подозреваю так, по кр. мере

fanatnascar 20.01.2015 07:49

27-Dude >в смысле - люди распознают?)) нет, нигде такого нет)
Нельзя тут шутить.. Ох нельзя

Dude 20.01.2015 18:32

ну нельзя так нельзя.
тогда и обсуждать больше нечего


Текущее время: 13:51. Часовой пояс GMT +3.