![]() |
В гугле добавился сервис распознавания речи и довольно неплохо распознает translate.google.com внизу слева микрофон. Включить и диктовать. Помню, когда-то задумался над таким сервисом, но конечно же гугль обогнал. Молодец, что тут еще сказать. |
[img]http://animatika.ru/netcat_files/userfiles/3/facepalm.jpg[/img] откуда они берутся? |
[quote=Фанат NASCAR;37710426] откуда они берутся? [/quote] чем недоволен? |
2-Dude >дык этой новости уже не помню сколько лет |
[quote=Dude;37710120]Помню, когда-то задумался над таким сервисом[/quote] этим ) но не то что недоволен.. в общем, фейспалм. Десятки специалистов десятки лет реализовывали терабайты математических данных, разрабатывали и сводили в кучу десятки и сотни алгоритмов, в общем - потрачены миллионы долларов. Хотел.. |
и кстати - это не сервис распознавания речи. Это переводчик. Сервис по другой ссылке, он платный. |
0-Dude > Сервис распознавания речи - это получение текста из речи (файла с аудиозаписью). А сервис, который вы указали действует как раз на оборот. :) Да и лет ему уже много. :) |
4-Фанат NASCAR > "мечтал" устроит? =) |
[quote=Фанат NASCAR;37711661]и кстати - это не сервис распознавания речи[/quote] и [quote=Искусственный Интеллект1;37713757]А сервис, который вы указали действует как раз на оборот[/quote] "внизу слева микрофон. Включить и диктовать." |
+8 безплатно |
0-Dude > Неверная формулировка, под сервисом тут понимают google speech api, т.е. то что можно использовать в своих приложения. То о чем вы говорите - это добавление на сайте переводчика возможности speech2text, сам не смотрел и не проверял, но если они распознают хотя бы половину представленных у них в переводчике языков, то это очень круто! |
Полистал, поддерживается только в Хроме, следовательно, это google speech api (если у кого-то были сомнения). 7-Dude > Есть идея для стартапа, сделать speech2text для таджикского языка, такого в гугл нет! Для него они не в приоритете, но приложение которое будет переводидь на русский, в маскве полетит! Срубите бабла и осуществите мечту! =) |
7-Dude >полностью) Распознавалка речи лучшая - у яндекса. Только узнай условия, цены) Не понравятся - стучи, предложу вариант. |
8-Dude >и все таки это переводчик. То есть - для коммерческого использования не подойдёт. Ограничения. |
8-Dude > а да, есть такая вещь, забыл про нее. Но такое распознавание я видел не только в гугле, но и еще где-то (не помню где) и уже давно. |
13-Фанат NASCAR > да, но фича классная. И, главное, что она безплатная. 14-Искусственный Интеллект1 > dictation.io? |
15-Dude > нет. Вроде это было вообще в телефоне. |
Имею подозрение, что распознавание речи не программное. Во всяком случает не на сто процентов. |
15-Dude >вам её отрубят, если: Заподозрят, что вызов сервиса идёт не из скриптов гуглопереводчика Если будет запросов чуть более, чем минимум Просто так, когда им захочется (будете обращаться curlом с адреса, который в пуле vds-хостера) Я бы не стал делать никакие ставки на сервис в таких условиях. Представьте. Я занимаюсь телефонными роботами. Многое построено на распознавании. Стал бы я использовать это? |
17-Dude >конечно, там тысячи китайцев этим занимаются онлайн. И индусов. |
[quote=Фанат NASCAR;37754897]Я занимаюсь телефонными роботами[/quote] - это круто, но думаю опечатка :) если [quote=Dude;37724933]что распознавание речи не программное.[/quote] то [quote=Фанат NASCAR;37754897] тысячи китайцев этим занимаются онлайн[/quote]в живую, поэтому наверное все-таки программное. |
20-kservice >можно просто программировать китайцев, у них разъём у всех имеется) Очепяток нет, робот ныне скорее самостоятельная сущность, чем железо с сервами. |
[quote=Фанат NASCAR;37754897]конечно, там тысячи китайцев этим занимаются онлайн. И индусов.[/quote] где-то читал, как админ сделал, чтоб посетители порносайта распознавали скан текстов, вводя капчи. То же самое можно сделать и с аудио. первая ступень: определение языка. вторая ступень: распознать одно слово из нескольких в фрагменте. Где-то-так. |
Приемлимая скорость распознавания аудио для телефонных роботов - две секунды. Лучше одна. Текущая система, с которой я работаю, укладывается. При этом, например, числа распознает безошибочно. Слова также великолепно. Индусы - была шутка) |
может и так. Просто заметил, что перевод двух-трех слов может длиться до десяти секунд. |
не перевод, а распознание |
25-Dude >это скорее из за слабого канала или проблем с ним. Я строю только на нормальных vds в датацентрах, предварительно обрабатывая файлы, записанные с канала. Проблем нет с длительностью обработки. Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса. |
[quote=Фанат NASCAR;37780853] Но я на платных началах работаю с сервисом. Сервис, кстати, от Яндекса. [/quote] наверно там тоже есть человеческий фактор. Подозреваю так, по кр. мере |
27-Dude >в смысле - люди распознают?)) нет, нигде такого нет) Нельзя тут шутить.. Ох нельзя |
ну нельзя так нельзя. тогда и обсуждать больше нечего |
Текущее время: 13:51. Часовой пояс GMT +3. |