К списку форумов К списку тем
Регистрация    Правила    Главная форума    Поиск   
Имя: Пароль:
Рекомендовать в новости

Работа с адресами

Гость
0 - 19.02.2015 - 18:18
Есть данные, где в строке задана улица и номер дома.
Данные вводятся, видимо, вручную, есть орфографические ошибки и нет конкретного формата(шаблона).

Какие есть средтсва для приведения строки с адресом к единому виду и с проверкой на корректность?



1 - 19.02.2015 - 18:58
(0) Откройте для себя КЛАДР.
Гость
2 - 19.02.2015 - 21:01
1-Ткачик > Открыл, ..., закрыл - не помогло. Еще есть?

Данные приходят из вне, влиять на них не могу.

Необходимо как на картографических сервисах, если пользователь ввел не верно с опечаткой адрес, понимать что пользователь подразумевал. Есть такое в виде либы или сервиса? Желательно бесплатно, так как проект не коммерческий для фана.
3 - 19.02.2015 - 21:41
(2) Фантазия пользователей в написании (особенно - в сокращениях) адресов, помноженная на их (не)грамотность делает задачу труднорешаемой. Но все-таки более реальной, чем задача "понимать" для компьютера.

Гуглите "нечеткий поиск адресов", а я - пас.
Гость
4 - 19.02.2015 - 21:52
Это не гарантирует корректность. Введенный с клавиатуры адрес в компьютер ещё не гарантирует соответствие прописке по паспорту. Подводных камней и без этого будет много. Иногда нужно смириться с ситуацией и принять входные данные "как есть", либо заставить вводить по шаблону. Пользователь кстати часто предпочитает выбрать из списка, если этот сервис предоставлять ненавязчиво.
Гость
5 - 20.02.2015 - 09:22
0-40KHYTbIU > есть такая хорошая вещь под названием "идентификация". Режем КЛАДР до уровня улицы, далее пишем формочку в которой посекторно будет анализироваться присланный адрес и выдаваться предполагаемый правильный адрес, при правильной идентификации неверные данные заменяются.
Гость
6 - 20.02.2015 - 09:35
Вот интересные мысли с хабра по этому поводу. Разбор адреса с помощью "нечётких регулярных выражений"
http://habrahabr.ru/post/192518/
Там есть библиотека под яву и си.
Гость
7 - 20.02.2015 - 10:11
Спасибо Ткачику за наводку на "нечеткий поиск адресов".

5-1isadmin > Примерно так и предполагаю.
6-SheLLest > Ок, посмотрю.
Гость
8 - 20.02.2015 - 10:40
7-40KHYTbIU >Там кстати ещё немало интересных комментариев к статье. Может тоже поможет.
Гость
9 - 22.02.2015 - 11:51
Сервисы яндекса не помогут?
Гость
10 - 24.02.2015 - 12:55
КЛАДР уже упразднен, теперь это ОКТМО. В 1С-овских базах есть файлы DBF, которые его реализуют. Как-то решал такую задачу, вот что вышло:

- прямой парсинг и поиск по регуляркам (библа re для Python) нашли 30% точных совпадений

- оставшиеся 12 тыс. строк были обработаны 4-мя операторами вручную в Excel в режиме общего доступа к одному файлу через автофильтр и Ctrl+H за 3 дня.

Да, реальность адресов проверялась по наличию в КЛАДР-е, геосервисы использовать было нереально из-за их ограничений.
Гость
11 - 24.02.2015 - 13:16
9-Фанат NASCAR > какой конкретно?
10-economist > спасибо за мнение ексель не вариант.

Уже вытащил название улиц из ФИАСа и нашел либу по нечеткому поиску, осталось собрать воедино и посмотреть что получится.
Гость
12 - 25.02.2015 - 15:52
11-40KHYTbIU >апи карт, что то такое вспоминаю, делал.. Очень давно


К списку вопросов






Copyright ©, Все права защищены