![]() | |
280-economist > под "правильной настройкой" имеется в виду разрешение/глубина цвета/сжатие/etc или какие-то хитрые настройки USB/сканера? |
> Естественно, народ на Сетях резкий и в это не поверил, т.к. не делал этого сам. я бы подобрал другой эпитет. Из всех кто кривлялся и упражнялся в остроумии вряд ли кто способен извиниться и признать что был неправ. |
Эээ, пан директор, спич, если я правильно помню, был не совсем только про скорость сканирования (я почти поверил в видео, хотя закрадывается сомнение, что запущено копирование, а не сканирование), а про одновременное распознавание. Вот хотелось бы на видео рядом с мфу увидеть экран компьютера с открытой папкой, в которой бы на глазах появлялись новые файлы. |
Вот тогда поверю |
следующим требованием будет чтобы это все сжимал 7-zip в реалтайме с максимальной компрессией на 486 процессоре? |
280-economist >У нормальных МФУ сканирование в pdf идет в базе, скорость сканирования несравнима. У нас секретарша пихает пачку листов в МФУ, жмет пимпу, через минуту или меньше забирает пачку и идет на рабочее место. А там просто с расшаренного диска забирает многостраничный оптимизированный pdf. Цвет или ч/б - решает сам аппарат по оригиналу. Можно принудительно выставить нужный режим. При желании файнридер (который не так уж и дорого стоит) может автоматом распознавать появившиеся в папке pdf'ы в doc (да, о боже, в DOC!). Зачем городить огород? holywar mode on :) |
285-lithium >Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование. Насчет извинений и признания неправоты - сколько раз ты это делал? |
[quote=economist;24545422]Я же утверждал что бюджетный сетевой МФУ за 7,5 тыс. руб. с правильной настройкой и бесплатным ПО может сканить со скоростью 4 сек. на страницу[/quote] Непонятно, что тут такого невероятного в этом факте нашли оппоненты, если характеристики копирования у этого устройства заявлены 24стр.м., соответственно просканировать 4 стр.м. для него не будет фантастикой. |
[quote=Flukostat;24547470]а про одновременное распознавание.[/quote] Я вааще не понимаю - зачем нужно какое-то распознавание, если у economist-a люди набивают страницу с помощью PS всего за одну минуту, можно с'экономить кучу денег на сканере, встать за спиной у секретарши - и пускай она шпарит, а ты сморти на ее округлые формы и контролируй, что бы она не дай Бог чай не начала пить или в туалет не побежала... |
287-LeXX > сколько раз ты это делал? помню два раза. а ты? |
> Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование. мне помнятся именно разговоры про сканирование, и даже если это и не так, то распознавание вполне можно сделать пакетной операцией, не требующей вмешательства, т.о. требования в общем случае к жестким рамкам времени распознавания лишены смысла. |
Сейчас тему найти не могу, но сколько помню, началось с того, что за рабочий день было отсканировано и распознано что-то порядка 10 тыс. страниц |
Flukostat - да по моему как раз с этого, только речь шла "за сутки", т.к. документы после этого нужно было сразу вернуть, и работа шла часов 20. ... LeXX - да так и есть, правда не знаю считается ли данный МФУ "нормальным". Кстати, штатный софт от Samsung содержит пакет OCR IRIS, он распознает папку с PDF и вставляет невидимый searchable - текстовый слой, причем качество его работы вполне приличное (на распознавание 1 стр уходит что-то около 20 секунд). ... А вот CuneiForm на бухгалтерских документах тратит около 7 секунд на страницу, но бывают малозаполненные доки, там еще быстрее. Распознавание нужно в 99% именно для индексации документа поисковиками типа GoogleDesktop или YandexDesktop. Или внутренними индексаторами систем документооборота. ... BigHarry - главное ей до предела ускорить опрос клавиатуры и интервал между нажатиями ~;-) Но это качается только "наших" документов, а "входящие" приходится таки распознавать, чтобы потом искать их не глазами, а по индексу. |
BigHarry - характеристика копирования того МФУ относится к скорости печати, а не к скорости сканирования. 24 стр в минуту появляется только при копировании одного и того же листа (мультикопия). |
факт, речь шла о выполненой рабте, т.е. о качественном, безошибочном переводе 10тыс листов в электронный вид в редактируемом формате за одни сутки. К чему видио копирующего листы агрегата, так и не осознал. |
когда economist выложит ролик как он ходит по воде комментарии будут в стиле "он даже плавать не умеет" |
Найдите lithium'у тему. Глядишь - третий раз придется извиниться и признать неправоту. |
речь шла о выполненой за сутки работе, о которой я писал выше, а не о скорости сканирования/копирования, эти характеристики без всякого видео можно посмотреть в документации к аппарату. Но спорить бесполезно, т.к. тему действительно не найти, тюнеры forums.kuban.ru потрудились на славу. Даже гугль не ищит. economist может выкладывать все что угодно. но так как он засветился как знатный звездобол, я лично не поверю ни одному его слову. Из последнего безбашенного nuздeжа -- [em]"Не думаю, что IBM на своих 300 тыс. рабочих мест "перешла" на OO "[/em] |
krotov речь НЕ шла о качественном, безошибочном переводе 10 тыс листов в электронный вид в редактируемом формате за одни сутки - так как это невозможно. Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов бюджетным устройством, а не досканером в 20 раз более дорогим. ... Я вот тоже не могу найти ссылку на замену MSO на Lotus Symphony в IBM. Возможно это проделки тех же самых людей. |
[em]Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов[/em] Т.е. все же 10 тыс страниц распознавались? Нэ ? |
5 тыс. точно имеют текстовый слой в PDF. Про десять тыс. не помню - может была интерполяция на сутки. Другое дело что оппоненты называли 2 минуты на страницу, то есть 240 страниц за рабочий день. Возможно они так и работают, но меня это не устраивает никак. |
мне до сих пор сомнительно, видео не смотрел, просто трезвые мысли, разве качество исходных документов идентичное на 100%? вряд-ли, требуется настройка профилей 2-3-4 типов, кто-то это делал? вряд ли, "бледные" документы нуждаются в повторном сканировании, или неоднократном распознавании как-то так |
gloomymen - на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня. Потом еще три дня тихо окуевал от возможностей ImageMagick. Результатом стали десяток bat скриптов, некоторые позволяют делать форменные чудеса (в глазах секретарей). Например, книга из проекта с двусторонней печатью - как быстро ее отсканить? Очень просто - сканим стопкой нечетные, потом четные страниц, два итоговых PDF перетаскиваем на батник - и через пять минут у нас готов файл PDF со спущенными полосами, как надо. |
[em]на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня[/em] как-то не стыкуется с декларацией реактивности, у меня минут 30 ушло |
gloomymen - насчет бледности - есть куча опций у того же сканера типа AutoLevel, и потом 90% доков всегда сканируются "чтобы было", значит сразу их бодрить не надо, лишь бы сохранилась информация для пост-обработки. ... Для любых факсов/фото/серятины/бледнятины/лицензий итп на сканере просто выбирается 2-й профиль - grey scale. Т.к. при сканировании стопкой такое попадается нередко - пришлось наваять скрипт на Python, который следит за папкой, burst-ит свежак с помощью pdftk PDF-файл постранично, с помощью ImageMagick генерит уровни в list-файл, и в случае чего - применяет соотв. алгоритм обработки, а затем сливает файлы в один, обратно. Причем все это делается только в формате PDF - очень предсказуемым в части печатных результатов, поддерживающим теги и текстовые слои, ну и компактном при этом. |
gloomymen - реактивность нужна от подчиненных, ну и потом я много поработал в типографии и РА, увлекаюсь фото и люблю повозиться с графикой. Мои PDF-сканы при распечатки неотличимы от хорошей ксерокопии, проиндексированы и компактны (50кБ/стр). Плюс на них еще стоит самоподписанный сертификат ЦП, так что я в ЛВС точно знаю что их не правили ничем. |
[em]реактивность нужна от подчиненных[/em] тов. директор, вы мне более не интересны как явление) удачи вам в поисках благодарных ущей |
мда-ааа...как много слов, ктр я не знаю...Да ладно. Суть в другом. Ежели выбран грейскейл, то даже файнридер глючит на распозновании, что уж говорить о кунейформ. |
сорри, ессно, распознАвании :) |
gloomymen - адьос, ничего страшного - у людей разные мнения. Замечу лишь что руководители как раз существуют для того, чтобы подчиненные не спали на работе. Брошенный в одиночку на борьбу со сканером пользователь будет реально мучиться, пыхтеть, но саму работу толком не сделает. Об этом свидетельствуют чудовищные скан-архивы, виденные даже в приличных конторах. Сканер, имхо, САМЫЙ сложный элемент оргтехники в офисе. Он требует много ручной, ножной и умственной работы, а также знания базовых графических понятий, особенностей контрагентов и их стандартов итп. Скажем, многостраничный TIFF не станет стандартом в стране - не смотря на то что в Сбербанке, Роснефти, ВТБ, Газпроме, администрации итд его активно используют. Просто потому что он неудобен, у него нет привязки к "холсту", мало свободных и удобных программ для просмотра итп. ... Flukostat - при распознавании любая OCR делает преобразование цвета до 0 и 1 и строит графические примитивы - прямые, дуги, эллипсы итп. Если серый читается глазами нормально - то и нормально распознается. У меня выработалась такая привычка - яркость серого нужно при сканировании в профиле сделать яркость чуть меньше (зависит от драйвера, ну ступенек на 20%). Тогда распознавание идет точнее и даже на глаз быстрее. Во-вторых - что сканируется в GS? - Всевозможные "сертификаты", и что в них распознавать-то? Две строки, впечатанные туда принтером. Так вот с этой задачей FR/CI справляются сопоставимо сносно. |
Нет, речь шла как раз о готовой работе, кому интересно спорить про скорость чего либо, если есть технические характеристики на оборудование? А там было, что-то типа -- людям загибали немереные деньги за перевод 10 тыс. листов чего-то там в электронный. И всякие злые фирмы загибали за это большие деньги и и длинный срок на выполнение работ, но тут въехал economist на белом ишаке и сделал все за сутки, то ли за 7, то ли за 20 тыров. Как-то так. ЗЫ: Но ладно, это не проверить сейчас. |
А давайте спросим - почем нынче перевод 10000 листов в EDM? ... Я, с молчаливого согласия большинства - в голосовании не участвую... |
Вот сию секунду ответила одна из ведущих в этом смысле контор в РФ - 42,38 руб. - лист - без НДС. |
Блин, поучаствовал... Лишаю себя права 300 последующих постов на этой ветке. |
так и знал, что пан директор найдет предлог слиться из ветки :) |
чо пан-директор - вкурсе конечно чем обусловлены падения даже 3.5 ? |
Да... эдак однострочно мы до 600-го поста не дойдем. ... Гинзбург - нет не в курсе. Падений не наблюдал. В какой ситуации происходит крэш? ... А вот MSO Excel 2010, несмотря на все обновления, падает регулярно (1-2 раза в день) на 3-х разных мощных машинах, во время выполнения относительно ресурсоемких файловых операций, пересчета, переформатирования и даже во время просто ничего неделания. Выбешивает персонал капитально. Отправлял багрепорт и писал - пока тишина. ... Что-то мне подсказывает, что за деньги я должен гавкаться с MS сильнее. Однако большинство поймает себя на мысли, что LO с его падениями раздражает больше. Что халявный уксус обязан быть крепче платного. К чему бы это? ... Только мы с Flukostat достаточно много поливали грязью оба пакета, поэтому нам проще :-)) |
Падения и глюки ЛО выбешивают гораздо больше, чем все остальное вместе взятое. Вчера пара товарищей дошла с ЛО до белого каления, они пытались из одного doc-файла вставить в другой doc-файл обычной процедурой [em]пкм-копировать - пкм-вставить[/em]. Результат операции - нулевой. [em]Вставить как [/em]выдавало список возможных вариантов, причем если выбирать первый пункт (пустая строка), то ничего не вставлялось. Нормально вставлялся только пункт [em]неформатированный текст[/em]. После выбора этого пункта снова работало [em]пкм-копировать - пкм-вставить[/em], а потом снова переставало. Я выслушал много чего ласкового. |
LO 3.5.2. у меня лично падает регулярно. Кстати, юзвери как-то молчат, а меня уже достало вконец. Простенький xls-файл может только попытки с третьей открыться - постоянно предлагает восстановить. |
Damnien - "...юзвери как-то молчат..." - так радоваться надо. Прежде всего за них, возможно они используют формат ODT в котором ничего из вышеописанного не происходит. А себе купите MSO :-) |
| Текущее время: 11:24. Часовой пояс GMT +3. | |