Показать сообщение отдельно
Гость
- 07.06.2014 - 11:13
Собственно, главная идея моей модели, что она непрерывно актуализирует контекст и накапливает опыт. Если что-то на что-то похоже - это обобщается. Так же как в уме человека. Слова, кстати, распознаются достаточно эффективным паттерном - сначала находятся терминальные символы (пробелы и знаки пунктуации), затем первая и последняя буква, затем буква в середине, отсекающая как можно больше неправильных вариантов, затем, при необходимости еще одна или две. Количество букв между пробелами, затем две буквы в начале и в конце уже из сотен тысяч слов оставляют единицы. Поэтому модель вполне способна разбирать слова с ошибками. А учитывая сочетания слов (которые тоже обобщаются) модель вообще ожидает, какие слова могут встретиться в сочетании с уже распознанным. То есть в предложении из 500 знаков алгоритму для понимания смысла придется "взглянуть" лишь на 150-200, остальные в большинстве ситуаций даже не будут моделью прочитаны.