К списку форумов К списку тем
Регистрация    Правила    Главная форума    Поиск   
Имя: Пароль:
Рекомендовать в новости

Недостатки полнотекстового поиска

Гость
0 - 19.12.2013 - 15:26
Всем привет!
Для реализации сложного поиска по наименованию справочника номенклатуры в 1С 8.1. думаю об использовании встроенных средств полнотекстового поиска.
Никогда ранее данный механизм не использовал.
По хэлпу всё в общем-то понятно, но интересует опыт тех, кто использовал механизм, какие у него недостатки.
Я понял, что придется делать обновление индекса. Но это можно сделать регламентным заданием по ночам, причем делать слияние основного и дополнительного каждую ночь. А в течении дня периодически делать обновление только дополнительного индекса. Приход новых товаров за день не особо большой, поэтому не должно быть критично.
База пока маленькая, файловая. Попробовал на копии, при наших размерах и индекс быстро создается, и тем более быстро обновляется. И файлы индекса по размеру смешные. Но база расти будет и будем переходить на SQL. Как бы через год не поасть втупик с этим полнотекстовым поиском.
В общем просьба, у кого есть опыт использования, какие недостатки мезанизма, насколько тормозит на больших объемах, ну и т.п.?
P.S. Сейчас проблема пока только с поиском по наименованию в справочнике номенклатуры. Поэтому если я в конфигуратре отключу у всего остального полнотекстовый поиск, то наверное индекс и его обновление будут создавать меньше проблем?



Uho
1 - 19.12.2013 - 15:30
в чем преимущества полнотекстового поиска перед простым запросом при поиске по наименованию?
Гость
2 - 19.12.2013 - 16:22
(1) Номенклатура будет загружаться из файлов поставщиков. Естественно наименования товаров поставщиков и наших товаров не будут совпадать. Могут быть поменяны местами слова, могут быть разные сокращения, может часть наименования выглядеть по-другому, и т.д. и т.п.
В этом случае простой запрос поможет, только если каждое слово из наименования поставщика искать в своем справочнике с конструкцией "ПОДОБНО" и выбирать товары, где наибольшее число совпадений. Это тормоза не малые при большом кол-ве товаров.
Полнотекстовый поиск должен сделать это достаточно быстро.
Гость
3 - 19.12.2013 - 16:28
1-Uho > преимущества полнотекстового поиска перед простым запросом в понимании синонимичности и расстояния между словами (словоформы, вроде, 1це не понимает). На личном опыте в базах 1це потребности не встречал, но для web, например, может оказаться приятным.
Потребность для маленькой файловой базы - ... ХЗ.
[em]Как бы через год не поасть втупик с этим полнотекстовым поиском[/em] - надоест, отключишь: метод УстановитьРежимПолнотекстовогоПоиска отработает мгновенно ;)
Гость
4 - 19.12.2013 - 16:39
2-Antikvar > [em]Номенклатура будет загружаться из файлов поставщиков.[/em] Максимум где это можно использовать - в качестве сервиса при первом упоминании об уникальной позиции для упрощения работы оператора по сопоставлению с уже существующими вариантами. Для последующей идентификации связь нужно пожестче...
Гость
5 - 19.12.2013 - 16:44
(3) Маленькая файловая база - это пока. Справочник номенклатуры будет очень большой.
В общем думаю буду делать поиск обычным запросом через "ПОДОБНО", а там посмотрим. Будут сильные тормоза - попробую полнотекстовый поиск. Но пока недостатков последнего так и не услышал нигде :)
Гость
6 - 19.12.2013 - 16:54
5-Antikvar > потребность в периодическом индексировании при активном наполнении таблиц это может стать проблемой - это первое. Второе,- следить за объёмом индекса и осмотрительно включать в него поля.
ЗЫ [em]Справочник номенклатуры будет очень большой[/em] - сколько позиций планируется? от какого количества поставщиков?
ЗЗЫ к слову... инфрмацию из прайсов поставщиков (без совершения хозоперации) тащить в справочник номенклатуры не следует
Uho
7 - 19.12.2013 - 17:44
имхо, полнотекстовый поиск следует использовать, только если не знаешь, где искать, а тут один реквизит...
минусы ПП:
- данные полнотекстового поиска хранятся вроде как вне базы, что само по себе нехорошо
- данные могут быть неактуальны (до очередного обновления)
- 99% пользователей не будут использовать язык запросов ПП
Гость
8 - 19.12.2013 - 20:07
(6) Посмотрел в старой базе - там около 150 тысяч позиций. Т.е. такой порядок примерно. Да и новые позиции постоянно появляются.
Информация будет тащиться не из прайсов, а из документов поступления, счета, счет-фактуры,... т.е. только нужная.

(7) не понял про 99% пользователей, в чем тут минус? Предполагалось, что пользователи вообще не будут им пользоваться как таковым (через стандартный интерфейс). Методы ПП предполагалось вызывать программно при подгрузке номенклатуры из внешних источников для поиска позиций в справочнике номенклатуры по неточному совпадению.
Uho
9 - 20.12.2013 - 10:04
8-Antikvar > 150 тыщ позиций - это мизер

[quote=Antikvar;33404197]Методы ПП предполагалось вызывать программно при подгрузке номенклатуры из внешних источников для поиска позиций в справочнике номенклатуры по неточному совпадению. [/quote]
это другое дело, но если алгоритм поиска можно заменить запросом с ПОДОБНО, я бы использовал запрос, если суперкрутой интеллектуальный поиск забацать - то да, возможно, ПП лучше.
Гость
10 - 20.12.2013 - 13:40
(10) Спасибо за советы. Сначала попробую через ПОДОБНО. А там видно будет. Понял, что ПП без сильной надобности лучше не включать :)


К списку вопросов






Copyright ©, Все права защищены