Модератор 0
- 15.02.2012 - 17:17
| http://www.opennet.ru/opennews/art.shtml?num=33084 Подробности (что нового) по ссылке. Следует иметь в виду, что: "Ветка 3.5 содержит большую порцию новшеств, но пока окончательно не стабилизирована. Выпуск 3.5.0 позиционируется как ознакомительный, пригодный для использования продвинутыми пользователями и энтузиастами. О готовности к промышленному использованию будет объявлено дополнительно, одновременно с выходом одного из корректирующих релизов (3.5.1 или 3.5.2)." | |
Модератор 281
- 13.04.2012 - 12:03
| 280-economist > под "правильной настройкой" имеется в виду разрешение/глубина цвета/сжатие/etc или какие-то хитрые настройки USB/сканера? | |
Модератор 282
- 13.04.2012 - 12:05
|
> Естественно, народ на Сетях резкий и в это не поверил, т.к. не делал этого сам. я бы подобрал другой эпитет. Из всех кто кривлялся и упражнялся в остроумии вряд ли кто способен извиниться и признать что был неправ. | |
283
- 13.04.2012 - 12:20
| Эээ, пан директор, спич, если я правильно помню, был не совсем только про скорость сканирования (я почти поверил в видео, хотя закрадывается сомнение, что запущено копирование, а не сканирование), а про одновременное распознавание. Вот хотелось бы на видео рядом с мфу увидеть экран компьютера с открытой папкой, в которой бы на глазах появлялись новые файлы. | |
284
- 13.04.2012 - 12:20
| Вот тогда поверю | |
Модератор 285
- 13.04.2012 - 12:27
| следующим требованием будет чтобы это все сжимал 7-zip в реалтайме с максимальной компрессией на 486 процессоре? | |
286
- 13.04.2012 - 12:29
|
280-economist >У нормальных МФУ сканирование в pdf идет в базе, скорость сканирования несравнима. У нас секретарша пихает пачку листов в МФУ, жмет пимпу, через минуту или меньше забирает пачку и идет на рабочее место. А там просто с расшаренного диска забирает многостраничный оптимизированный pdf. Цвет или ч/б - решает сам аппарат по оригиналу. Можно принудительно выставить нужный режим. При желании файнридер (который не так уж и дорого стоит) может автоматом распознавать появившиеся в папке pdf'ы в doc (да, о боже, в DOC!). Зачем городить огород? holywar mode on :) | |
287
- 13.04.2012 - 12:30
| 285-lithium >Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование. Насчет извинений и признания неправоты - сколько раз ты это делал? | |
288
- 13.04.2012 - 12:31
| Непонятно, что тут такого невероятного в этом факте нашли оппоненты, если характеристики копирования у этого устройства заявлены 24стр.м., соответственно просканировать 4 стр.м. для него не будет фантастикой. | |
289
- 13.04.2012 - 12:36
| Я вааще не понимаю - зачем нужно какое-то распознавание, если у economist-a люди набивают страницу с помощью PS всего за одну минуту, можно с'экономить кучу денег на сканере, встать за спиной у секретарши - и пускай она шпарит, а ты сморти на ее округлые формы и контролируй, что бы она не дай Бог чай не начала пить или в туалет не побежала... | |
Модератор 290
- 13.04.2012 - 13:04
|
287-LeXX > сколько раз ты это делал? помню два раза. а ты? | |
Модератор 291
- 13.04.2012 - 13:13
|
> Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование. мне помнятся именно разговоры про сканирование, и даже если это и не так, то распознавание вполне можно сделать пакетной операцией, не требующей вмешательства, т.о. требования в общем случае к жестким рамкам времени распознавания лишены смысла. | |
292
- 13.04.2012 - 13:26
| Сейчас тему найти не могу, но сколько помню, началось с того, что за рабочий день было отсканировано и распознано что-то порядка 10 тыс. страниц | |
293
- 13.04.2012 - 14:16
|
Flukostat - да по моему как раз с этого, только речь шла "за сутки", т.к. документы после этого нужно было сразу вернуть, и работа шла часов 20. ... LeXX - да так и есть, правда не знаю считается ли данный МФУ "нормальным". Кстати, штатный софт от Samsung содержит пакет OCR IRIS, он распознает папку с PDF и вставляет невидимый searchable - текстовый слой, причем качество его работы вполне приличное (на распознавание 1 стр уходит что-то около 20 секунд). ... А вот CuneiForm на бухгалтерских документах тратит около 7 секунд на страницу, но бывают малозаполненные доки, там еще быстрее. Распознавание нужно в 99% именно для индексации документа поисковиками типа GoogleDesktop или YandexDesktop. Или внутренними индексаторами систем документооборота. ... BigHarry - главное ей до предела ускорить опрос клавиатуры и интервал между нажатиями ~;-) Но это качается только "наших" документов, а "входящие" приходится таки распознавать, чтобы потом искать их не глазами, а по индексу. | |
294
- 13.04.2012 - 14:20
| BigHarry - характеристика копирования того МФУ относится к скорости печати, а не к скорости сканирования. 24 стр в минуту появляется только при копировании одного и того же листа (мультикопия). | |
295
- 13.04.2012 - 14:46
| факт, речь шла о выполненой рабте, т.е. о качественном, безошибочном переводе 10тыс листов в электронный вид в редактируемом формате за одни сутки. К чему видио копирующего листы агрегата, так и не осознал. | |
Модератор 296
- 13.04.2012 - 16:15
| когда economist выложит ролик как он ходит по воде комментарии будут в стиле "он даже плавать не умеет" | |
297
- 13.04.2012 - 16:50
| Найдите lithium'у тему. Глядишь - третий раз придется извиниться и признать неправоту. | |
298
- 13.04.2012 - 17:35
|
речь шла о выполненой за сутки работе, о которой я писал выше, а не о скорости сканирования/копирования, эти характеристики без всякого видео можно посмотреть в документации к аппарату. Но спорить бесполезно, т.к. тему действительно не найти, тюнеры forums.kuban.ru потрудились на славу. Даже гугль не ищит. economist может выкладывать все что угодно. но так как он засветился как знатный звездобол, я лично не поверю ни одному его слову. Из последнего безбашенного nuздeжа -- "Не думаю, что IBM на своих 300 тыс. рабочих мест "перешла" на OO " | |
299
- 13.04.2012 - 18:03
|
krotov речь НЕ шла о качественном, безошибочном переводе 10 тыс листов в электронный вид в редактируемом формате за одни сутки - так как это невозможно. Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов бюджетным устройством, а не досканером в 20 раз более дорогим. ... Я вот тоже не могу найти ссылку на замену MSO на Lotus Symphony в IBM. Возможно это проделки тех же самых людей. | |
300
- 13.04.2012 - 18:18
| Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов Т.е. все же 10 тыс страниц распознавались? Нэ ? | |
301
- 13.04.2012 - 18:38
| 5 тыс. точно имеют текстовый слой в PDF. Про десять тыс. не помню - может была интерполяция на сутки. Другое дело что оппоненты называли 2 минуты на страницу, то есть 240 страниц за рабочий день. Возможно они так и работают, но меня это не устраивает никак. | |
302
- 13.04.2012 - 19:21
|
мне до сих пор сомнительно, видео не смотрел, просто трезвые мысли, разве качество исходных документов идентичное на 100%? вряд-ли, требуется настройка профилей 2-3-4 типов, кто-то это делал? вряд ли, "бледные" документы нуждаются в повторном сканировании, или неоднократном распознавании как-то так | |
303
- 13.04.2012 - 20:41
| gloomymen - на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня. Потом еще три дня тихо окуевал от возможностей ImageMagick. Результатом стали десяток bat скриптов, некоторые позволяют делать форменные чудеса (в глазах секретарей). Например, книга из проекта с двусторонней печатью - как быстро ее отсканить? Очень просто - сканим стопкой нечетные, потом четные страниц, два итоговых PDF перетаскиваем на батник - и через пять минут у нас готов файл PDF со спущенными полосами, как надо. | |
304
- 13.04.2012 - 21:00
| на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня как-то не стыкуется с декларацией реактивности, у меня минут 30 ушло | |
305
- 13.04.2012 - 21:04
|
gloomymen - насчет бледности - есть куча опций у того же сканера типа AutoLevel, и потом 90% доков всегда сканируются "чтобы было", значит сразу их бодрить не надо, лишь бы сохранилась информация для пост-обработки. ... Для любых факсов/фото/серятины/бледнятины/лицензий итп на сканере просто выбирается 2-й профиль - grey scale. Т.к. при сканировании стопкой такое попадается нередко - пришлось наваять скрипт на Python, который следит за папкой, burst-ит свежак с помощью pdftk PDF-файл постранично, с помощью ImageMagick генерит уровни в list-файл, и в случае чего - применяет соотв. алгоритм обработки, а затем сливает файлы в один, обратно. Причем все это делается только в формате PDF - очень предсказуемым в части печатных результатов, поддерживающим теги и текстовые слои, ну и компактном при этом. | |
306
- 13.04.2012 - 21:09
| gloomymen - реактивность нужна от подчиненных, ну и потом я много поработал в типографии и РА, увлекаюсь фото и люблю повозиться с графикой. Мои PDF-сканы при распечатки неотличимы от хорошей ксерокопии, проиндексированы и компактны (50кБ/стр). Плюс на них еще стоит самоподписанный сертификат ЦП, так что я в ЛВС точно знаю что их не правили ничем. | |
307
- 13.04.2012 - 22:44
| реактивность нужна от подчиненных тов. директор, вы мне более не интересны как явление) удачи вам в поисках благодарных ущей | |
308
- 13.04.2012 - 22:50
| мда-ааа...как много слов, ктр я не знаю...Да ладно. Суть в другом. Ежели выбран грейскейл, то даже файнридер глючит на распозновании, что уж говорить о кунейформ. | |
309
- 13.04.2012 - 22:52
| сорри, ессно, распознАвании :) | |
310
- 14.04.2012 - 09:34
|
gloomymen - адьос, ничего страшного - у людей разные мнения. Замечу лишь что руководители как раз существуют для того, чтобы подчиненные не спали на работе. Брошенный в одиночку на борьбу со сканером пользователь будет реально мучиться, пыхтеть, но саму работу толком не сделает. Об этом свидетельствуют чудовищные скан-архивы, виденные даже в приличных конторах. Сканер, имхо, САМЫЙ сложный элемент оргтехники в офисе. Он требует много ручной, ножной и умственной работы, а также знания базовых графических понятий, особенностей контрагентов и их стандартов итп. Скажем, многостраничный TIFF не станет стандартом в стране - не смотря на то что в Сбербанке, Роснефти, ВТБ, Газпроме, администрации итд его активно используют. Просто потому что он неудобен, у него нет привязки к "холсту", мало свободных и удобных программ для просмотра итп. ... Flukostat - при распознавании любая OCR делает преобразование цвета до 0 и 1 и строит графические примитивы - прямые, дуги, эллипсы итп. Если серый читается глазами нормально - то и нормально распознается. У меня выработалась такая привычка - яркость серого нужно при сканировании в профиле сделать яркость чуть меньше (зависит от драйвера, ну ступенек на 20%). Тогда распознавание идет точнее и даже на глаз быстрее. Во-вторых - что сканируется в GS? - Всевозможные "сертификаты", и что в них распознавать-то? Две строки, впечатанные туда принтером. Так вот с этой задачей FR/CI справляются сопоставимо сносно. | |
311
- 14.04.2012 - 10:20
|
Нет, речь шла как раз о готовой работе, кому интересно спорить про скорость чего либо, если есть технические характеристики на оборудование? А там было, что-то типа -- людям загибали немереные деньги за перевод 10 тыс. листов чего-то там в электронный. И всякие злые фирмы загибали за это большие деньги и и длинный срок на выполнение работ, но тут въехал economist на белом ишаке и сделал все за сутки, то ли за 7, то ли за 20 тыров. Как-то так. ЗЫ: Но ладно, это не проверить сейчас. | |
312
- 14.04.2012 - 20:24
|
А давайте спросим - почем нынче перевод 10000 листов в EDM? ... Я, с молчаливого согласия большинства - в голосовании не участвую... | |
313
- 14.04.2012 - 20:29
| Вот сию секунду ответила одна из ведущих в этом смысле контор в РФ - 42,38 руб. - лист - без НДС. | |
314
- 14.04.2012 - 20:31
| Блин, поучаствовал... Лишаю себя права 300 последующих постов на этой ветке. | |
315
- 16.04.2012 - 10:16
| так и знал, что пан директор найдет предлог слиться из ветки :) | |
316
- 17.04.2012 - 21:20
| чо пан-директор - вкурсе конечно чем обусловлены падения даже 3.5 ? | |
317
- 18.04.2012 - 09:51
|
Да... эдак однострочно мы до 600-го поста не дойдем. ... Гинзбург - нет не в курсе. Падений не наблюдал. В какой ситуации происходит крэш? ... А вот MSO Excel 2010, несмотря на все обновления, падает регулярно (1-2 раза в день) на 3-х разных мощных машинах, во время выполнения относительно ресурсоемких файловых операций, пересчета, переформатирования и даже во время просто ничего неделания. Выбешивает персонал капитально. Отправлял багрепорт и писал - пока тишина. ... Что-то мне подсказывает, что за деньги я должен гавкаться с MS сильнее. Однако большинство поймает себя на мысли, что LO с его падениями раздражает больше. Что халявный уксус обязан быть крепче платного. К чему бы это? ... Только мы с Flukostat достаточно много поливали грязью оба пакета, поэтому нам проще :-)) | |
318
- 18.04.2012 - 10:28
| Падения и глюки ЛО выбешивают гораздо больше, чем все остальное вместе взятое. Вчера пара товарищей дошла с ЛО до белого каления, они пытались из одного doc-файла вставить в другой doc-файл обычной процедурой пкм-копировать - пкм-вставить. Результат операции - нулевой. Вставить как выдавало список возможных вариантов, причем если выбирать первый пункт (пустая строка), то ничего не вставлялось. Нормально вставлялся только пункт неформатированный текст. После выбора этого пункта снова работало пкм-копировать - пкм-вставить, а потом снова переставало. Я выслушал много чего ласкового. | |
319
- 18.04.2012 - 14:15
| LO 3.5.2. у меня лично падает регулярно. Кстати, юзвери как-то молчат, а меня уже достало вконец. Простенький xls-файл может только попытки с третьей открыться - постоянно предлагает восстановить. | |
320
- 19.04.2012 - 10:53
| Damnien - "...юзвери как-то молчат..." - так радоваться надо. Прежде всего за них, возможно они используют формат ODT в котором ничего из вышеописанного не происходит. А себе купите MSO :-) | |
|
| Интернет-форум Краснодарского края и Краснодара |