К списку форумов К списку тем
Регистрация    Правила    Главная форума    Поиск   
Имя: Пароль:
Рекомендовать в новости

В гугле добавился сервис распознавания речи

Гость
0 - 12.01.2015 - 18:20
и довольно неплохо распознает
translate.google.com

внизу слева микрофон. Включить и диктовать.

Помню, когда-то задумался над таким сервисом, но конечно же гугль обогнал. Молодец, что тут еще сказать.



Гость
1 - 12.01.2015 - 18:50

откуда они берутся?
Гость
2 - 12.01.2015 - 19:24
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
откуда они берутся?
чем недоволен?
Гость
3 - 12.01.2015 - 20:39
2-Dude >дык этой новости уже не помню сколько лет
Гость
4 - 12.01.2015 - 20:42
Цитата:
Сообщение от Dude Посмотреть сообщение
Помню, когда-то задумался над таким сервисом
этим )
но не то что недоволен.. в общем, фейспалм.
Десятки специалистов десятки лет реализовывали терабайты математических данных, разрабатывали и сводили в кучу десятки и сотни алгоритмов, в общем - потрачены миллионы долларов.

Хотел..
Гость
5 - 12.01.2015 - 20:47
и кстати - это не сервис распознавания речи. Это переводчик.
Сервис по другой ссылке, он платный.
6 - 13.01.2015 - 00:02
0-Dude > Сервис распознавания речи - это получение текста из речи (файла с аудиозаписью). А сервис, который вы указали действует как раз на оборот. :) Да и лет ему уже много. :)
Гость
7 - 13.01.2015 - 00:56
4-Фанат NASCAR >
"мечтал" устроит? =)
Гость
8 - 13.01.2015 - 00:57
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
и кстати - это не сервис распознавания речи
и

Цитата:
Сообщение от Искусственный Интеллект1 Посмотреть сообщение
А сервис, который вы указали действует как раз на оборот
"внизу слева микрофон. Включить и диктовать."
Гость
9 - 13.01.2015 - 00:58
+8
безплатно
Гость
10 - 13.01.2015 - 10:34
0-Dude > Неверная формулировка, под сервисом тут понимают google speech api, т.е. то что можно использовать в своих приложения.
То о чем вы говорите - это добавление на сайте переводчика возможности speech2text, сам не смотрел и не проверял, но если они распознают хотя бы половину представленных у них в переводчике языков, то это очень круто!
Гость
11 - 13.01.2015 - 10:48
Полистал, поддерживается только в Хроме, следовательно, это google speech api (если у кого-то были сомнения).

7-Dude > Есть идея для стартапа, сделать speech2text для таджикского языка, такого в гугл нет! Для него они не в приоритете, но приложение которое будет переводидь на русский, в маскве полетит! Срубите бабла и осуществите мечту! =)
Гость
12 - 13.01.2015 - 12:04
7-Dude >полностью)
Распознавалка речи лучшая - у яндекса. Только узнай условия, цены)
Не понравятся - стучи, предложу вариант.
Гость
13 - 13.01.2015 - 12:05
8-Dude >и все таки это переводчик. То есть - для коммерческого использования не подойдёт. Ограничения.
14 - 13.01.2015 - 14:29
8-Dude > а да, есть такая вещь, забыл про нее. Но такое распознавание я видел не только в гугле, но и еще где-то (не помню где) и уже давно.
Гость
15 - 13.01.2015 - 18:49
13-Фанат NASCAR >
да, но фича классная. И, главное, что она безплатная.

14-Искусственный Интеллект1 >
dictation.io?
16 - 13.01.2015 - 23:08
15-Dude > нет. Вроде это было вообще в телефоне.
Гость
17 - 14.01.2015 - 00:35
Имею подозрение, что распознавание речи не программное.
Во всяком случает не на сто процентов.
Гость
18 - 16.01.2015 - 17:44
15-Dude >вам её отрубят, если:
Заподозрят, что вызов сервиса идёт не из скриптов гуглопереводчика

Если будет запросов чуть более, чем минимум

Просто так, когда им захочется (будете обращаться curlом с адреса, который в пуле vds-хостера)

Я бы не стал делать никакие ставки на сервис в таких условиях.

Представьте. Я занимаюсь телефонными роботами. Многое построено на распознавании. Стал бы я использовать это?
Гость
19 - 16.01.2015 - 17:44
17-Dude >конечно, там тысячи китайцев этим занимаются онлайн. И индусов.
Гость
20 - 16.01.2015 - 22:53
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
Я занимаюсь телефонными роботами
- это круто, но думаю опечатка :)
если
Цитата:
Сообщение от Dude Посмотреть сообщение
что распознавание речи не программное.
то
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
тысячи китайцев этим занимаются онлайн
в живую, поэтому наверное все-таки программное.
Гость
21 - 17.01.2015 - 22:59
20-kservice >можно просто программировать китайцев, у них разъём у всех имеется)
Очепяток нет, робот ныне скорее самостоятельная сущность, чем железо с сервами.
Гость
22 - 18.01.2015 - 02:57
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
конечно, там тысячи китайцев этим занимаются онлайн. И индусов.
где-то читал, как админ сделал, чтоб посетители порносайта распознавали скан текстов, вводя капчи.

То же самое можно сделать и с аудио.
первая ступень: определение языка.
вторая ступень: распознать одно слово из нескольких в фрагменте.
Где-то-так.
Гость
23 - 18.01.2015 - 13:06
Приемлимая скорость распознавания аудио для телефонных роботов - две секунды. Лучше одна.
Текущая система, с которой я работаю, укладывается. При этом, например, числа распознает безошибочно. Слова также великолепно.
Индусы - была шутка)
Гость
24 - 18.01.2015 - 17:25
может и так.
Просто заметил, что перевод двух-трех слов может длиться до десяти секунд.
Гость
25 - 18.01.2015 - 17:26
не перевод, а распознание
Гость
26 - 19.01.2015 - 16:21
25-Dude >это скорее из за слабого канала или проблем с ним. Я строю только на нормальных vds в датацентрах, предварительно обрабатывая файлы, записанные с канала. Проблем нет с длительностью обработки.
Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса.
Гость
27 - 19.01.2015 - 18:31
Цитата:
Сообщение от Фанат NASCAR Посмотреть сообщение
Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса.
наверно там тоже есть человеческий фактор.
Подозреваю так, по кр. мере
Гость
28 - 20.01.2015 - 07:49
27-Dude >в смысле - люди распознают?)) нет, нигде такого нет)
Нельзя тут шутить.. Ох нельзя
Гость
29 - 20.01.2015 - 18:32
ну нельзя так нельзя.
тогда и обсуждать больше нечего


К списку вопросов






Copyright ©, Все права защищены