Форум на Kuban.ru - Off: Релиз офисного пакета LibreOffice 3.5.0

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] Последняя >>

Показывать 40 сообщений этой темы на одной странице

Форум на Kuban.ru (http://forums.kuban.ru/)

- Сети и их администрирование (http://forums.kuban.ru/f1029/)

- - Off: Релиз офисного пакета LibreOffice 3.5.0 (http://forums.kuban.ru/f1029/off_reliz_ofisnogo_paketa_libreoffice_3_5_0_a-2208261.html)

lithium

13.04.2012 12:03

280-economist > под "правильной настройкой" имеется в виду разрешение/глубина цвета/сжатие/etc или какие-то хитрые настройки USB/сканера?

lithium

13.04.2012 12:05

> Естественно, народ на Сетях резкий и в это не поверил, т.к. не делал этого сам.
я бы подобрал другой эпитет. Из всех кто кривлялся и упражнялся в остроумии вряд ли кто способен извиниться и признать что был неправ.

Flukostat

13.04.2012 12:20

Эээ, пан директор, спич, если я правильно помню, был не совсем только про скорость сканирования (я почти поверил в видео, хотя закрадывается сомнение, что запущено копирование, а не сканирование), а про одновременное распознавание. Вот хотелось бы на видео рядом с мфу увидеть экран компьютера с открытой папкой, в которой бы на глазах появлялись новые файлы.

Flukostat

13.04.2012 12:20

Вот тогда поверю

lithium

13.04.2012 12:27

следующим требованием будет чтобы это все сжимал 7-zip в реалтайме с максимальной компрессией на 486 процессоре?

LeXX	13.04.2012 12:29

280-economist >У нормальных МФУ сканирование в pdf идет в базе, скорость сканирования несравнима. У нас секретарша пихает пачку листов в МФУ, жмет пимпу, через минуту или меньше забирает пачку и идет на рабочее место. А там просто с расшаренного диска забирает многостраничный оптимизированный pdf. Цвет или ч/б - решает сам аппарат по оригиналу. Можно принудительно выставить нужный режим. При желании файнридер (который не так уж и дорого стоит) может автоматом распознавать появившиеся в папке pdf'ы в doc (да, о боже, в DOC!). Зачем городить огород?
holywar mode on :)

LeXX	13.04.2012 12:30

285-lithium >Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование. Насчет извинений и признания неправоты - сколько раз ты это делал?

BigHarry

13.04.2012 12:31

[quote=economist;24545422]Я же утверждал что бюджетный сетевой МФУ за 7,5 тыс. руб. с правильной настройкой и бесплатным ПО может сканить со скоростью 4 сек. на страницу[/quote]
Непонятно, что тут такого невероятного в этом факте нашли оппоненты, если характеристики копирования у этого устройства заявлены 24стр.м., соответственно просканировать 4 стр.м. для него не будет фантастикой.

BigHarry

13.04.2012 12:36

[quote=Flukostat;24547470]а про одновременное распознавание.[/quote]
Я вааще не понимаю - зачем нужно какое-то распознавание, если у economist-a люди набивают страницу с помощью PS всего за одну минуту, можно с'экономить кучу денег на сканере, встать за спиной у секретарши - и пускай она шпарит, а ты сморти на ее округлые формы и контролируй, что бы она не дай Бог чай не начала пить или в туалет не побежала...

lithium

13.04.2012 13:04

287-LeXX > сколько раз ты это делал?
помню два раза.
а ты?

lithium

13.04.2012 13:13

> Если ты следил за историей, то разговор был больше именно про распознавание, а не про сканирование.

мне помнятся именно разговоры про сканирование, и даже если это и не так, то распознавание вполне можно сделать пакетной операцией, не требующей вмешательства, т.о. требования в общем случае к жестким рамкам времени распознавания лишены смысла.

Flukostat

13.04.2012 13:26

Сейчас тему найти не могу, но сколько помню, началось с того, что за рабочий день было отсканировано и распознано что-то порядка 10 тыс. страниц

economist

13.04.2012 14:16

Flukostat - да по моему как раз с этого, только речь шла "за сутки", т.к. документы после этого нужно было сразу вернуть, и работа шла часов 20.
...
LeXX - да так и есть, правда не знаю считается ли данный МФУ "нормальным". Кстати, штатный софт от Samsung содержит пакет OCR IRIS, он распознает папку с PDF и вставляет невидимый searchable - текстовый слой, причем качество его работы вполне приличное (на распознавание 1 стр уходит что-то около 20 секунд).
...
А вот CuneiForm на бухгалтерских документах тратит около 7 секунд на страницу, но бывают малозаполненные доки, там еще быстрее. Распознавание нужно в 99% именно для индексации документа поисковиками типа GoogleDesktop или YandexDesktop. Или внутренними индексаторами систем документооборота.
...
BigHarry - главное ей до предела ускорить опрос клавиатуры и интервал между нажатиями ~;-) Но это качается только "наших" документов, а "входящие" приходится таки распознавать, чтобы потом искать их не глазами, а по индексу.

economist

13.04.2012 14:20

BigHarry - характеристика копирования того МФУ относится к скорости печати, а не к скорости сканирования. 24 стр в минуту появляется только при копировании одного и того же листа (мультикопия).

krotov

13.04.2012 14:46

факт, речь шла о выполненой рабте, т.е. о качественном, безошибочном переводе 10тыс листов в электронный вид в редактируемом формате за одни сутки. К чему видио копирующего листы агрегата, так и не осознал.

lithium

13.04.2012 16:15

когда economist выложит ролик как он ходит по воде комментарии будут в стиле "он даже плавать не умеет"

LeXX	13.04.2012 16:50

Найдите lithium'у тему. Глядишь - третий раз придется извиниться и признать неправоту.

krotov

13.04.2012 17:35

речь шла о выполненой за сутки работе, о которой я писал выше, а не о скорости сканирования/копирования, эти характеристики без всякого видео можно посмотреть в документации к аппарату. Но спорить бесполезно, т.к. тему действительно не найти, тюнеры forums.kuban.ru потрудились на славу. Даже гугль не ищит.
economist может выкладывать все что угодно. но так как он засветился как знатный звездобол, я лично не поверю ни одному его слову.
Из последнего безбашенного nuздeжа -- [em]"Не думаю, что IBM на своих 300 тыс. рабочих мест "перешла" на OO
"[/em]

economist

13.04.2012 18:03

krotov речь НЕ шла о качественном, безошибочном переводе 10 тыс листов в электронный вид в редактируемом формате за одни сутки - так как это невозможно. Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов бюджетным устройством, а не досканером в 20 раз более дорогим.
...
Я вот тоже не могу найти ссылку на замену MSO на Lotus Symphony в IBM. Возможно это проделки тех же самых людей.

Flukostat

13.04.2012 18:18

[em]Речь шла о возможности сканировании и индексировании распознанного текста для полнотекстового поиска сканов[/em]
Т.е. все же 10 тыс страниц распознавались? Нэ ?

economist

13.04.2012 18:38

5 тыс. точно имеют текстовый слой в PDF. Про десять тыс. не помню - может была интерполяция на сутки. Другое дело что оппоненты называли 2 минуты на страницу, то есть 240 страниц за рабочий день. Возможно они так и работают, но меня это не устраивает никак.

gloomymen

13.04.2012 19:21

мне до сих пор сомнительно, видео не смотрел, просто трезвые мысли, разве качество исходных документов идентичное на 100%? вряд-ли, требуется настройка профилей 2-3-4 типов, кто-то это делал? вряд ли, "бледные" документы нуждаются в повторном сканировании, или неоднократном распознавании
как-то так

economist

13.04.2012 20:41

gloomymen - на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня. Потом еще три дня тихо окуевал от возможностей ImageMagick. Результатом стали десяток bat скриптов, некоторые позволяют делать форменные чудеса (в глазах секретарей). Например, книга из проекта с двусторонней печатью - как быстро ее отсканить? Очень просто - сканим стопкой нечетные, потом четные страниц, два итоговых PDF перетаскиваем на батник - и через пять минут у нас готов файл PDF со спущенными полосами, как надо.

gloomymen

13.04.2012 21:00

[em]на подбор 2-х профилей (больше и не надо) я потратил почти 2 дня[/em]
как-то не стыкуется с декларацией реактивности, у меня минут 30 ушло

economist

13.04.2012 21:04

gloomymen - насчет бледности - есть куча опций у того же сканера типа AutoLevel, и потом 90% доков всегда сканируются "чтобы было", значит сразу их бодрить не надо, лишь бы сохранилась информация для пост-обработки.
...
Для любых факсов/фото/серятины/бледнятины/лицензий итп на сканере просто выбирается 2-й профиль - grey scale. Т.к. при сканировании стопкой такое попадается нередко - пришлось наваять скрипт на Python, который следит за папкой, burst-ит свежак с помощью pdftk PDF-файл постранично, с помощью ImageMagick генерит уровни в list-файл, и в случае чего - применяет соотв. алгоритм обработки, а затем сливает файлы в один, обратно. Причем все это делается только в формате PDF - очень предсказуемым в части печатных результатов, поддерживающим теги и текстовые слои, ну и компактном при этом.

economist

13.04.2012 21:09

gloomymen - реактивность нужна от подчиненных, ну и потом я много поработал в типографии и РА, увлекаюсь фото и люблю повозиться с графикой. Мои PDF-сканы при распечатки неотличимы от хорошей ксерокопии, проиндексированы и компактны (50кБ/стр). Плюс на них еще стоит самоподписанный сертификат ЦП, так что я в ЛВС точно знаю что их не правили ничем.

gloomymen

13.04.2012 22:44

[em]реактивность нужна от подчиненных[/em]
тов. директор, вы мне более не интересны как явление)
удачи вам в поисках благодарных ущей

Flukostat

13.04.2012 22:50

мда-ааа...как много слов, ктр я не знаю...Да ладно. Суть в другом. Ежели выбран грейскейл, то даже файнридер глючит на распозновании, что уж говорить о кунейформ.

Flukostat

13.04.2012 22:52

сорри, ессно, распознАвании :)

economist

14.04.2012 09:34

gloomymen - адьос, ничего страшного - у людей разные мнения. Замечу лишь что руководители как раз существуют для того, чтобы подчиненные не спали на работе. Брошенный в одиночку на борьбу со сканером пользователь будет реально мучиться, пыхтеть, но саму работу толком не сделает. Об этом свидетельствуют чудовищные скан-архивы, виденные даже в приличных конторах. Сканер, имхо, САМЫЙ сложный элемент оргтехники в офисе. Он требует много ручной, ножной и умственной работы, а также знания базовых графических понятий, особенностей контрагентов и их стандартов итп. Скажем, многостраничный TIFF не станет стандартом в стране - не смотря на то что в Сбербанке, Роснефти, ВТБ, Газпроме, администрации итд его активно используют. Просто потому что он неудобен, у него нет привязки к "холсту", мало свободных и удобных программ для просмотра итп.
...
Flukostat - при распознавании любая OCR делает преобразование цвета до 0 и 1 и строит графические примитивы - прямые, дуги, эллипсы итп. Если серый читается глазами нормально - то и нормально распознается. У меня выработалась такая привычка - яркость серого нужно при сканировании в профиле сделать яркость чуть меньше (зависит от драйвера, ну ступенек на 20%). Тогда распознавание идет точнее и даже на глаз быстрее. Во-вторых - что сканируется в GS? - Всевозможные "сертификаты", и что в них распознавать-то? Две строки, впечатанные туда принтером. Так вот с этой задачей FR/CI справляются сопоставимо сносно.

krotov

14.04.2012 10:20

Нет, речь шла как раз о готовой работе, кому интересно спорить про скорость чего либо, если есть технические характеристики на оборудование? А там было, что-то типа -- людям загибали немереные деньги за перевод 10 тыс. листов чего-то там в электронный. И всякие злые фирмы загибали за это большие деньги и и длинный срок на выполнение работ, но тут въехал economist на белом ишаке и сделал все за сутки, то ли за 7, то ли за 20 тыров. Как-то так.
ЗЫ: Но ладно, это не проверить сейчас.

economist

14.04.2012 20:24

А давайте спросим - почем нынче перевод 10000 листов в EDM?
...
Я, с молчаливого согласия большинства - в голосовании не участвую...

economist

14.04.2012 20:29

Вот сию секунду ответила одна из ведущих в этом смысле контор в РФ - 42,38 руб. - лист - без НДС.

economist

14.04.2012 20:31

Блин, поучаствовал... Лишаю себя права 300 последующих постов на этой ветке.

Flukostat

16.04.2012 10:16

так и знал, что пан директор найдет предлог слиться из ветки :)

Гинзбург

17.04.2012 21:20

чо пан-директор - вкурсе конечно чем обусловлены падения даже 3.5 ?

economist

18.04.2012 09:51

Да... эдак однострочно мы до 600-го поста не дойдем.
...
Гинзбург - нет не в курсе. Падений не наблюдал. В какой ситуации происходит крэш?
...
А вот MSO Excel 2010, несмотря на все обновления, падает регулярно (1-2 раза в день) на 3-х разных мощных машинах, во время выполнения относительно ресурсоемких файловых операций, пересчета, переформатирования и даже во время просто ничего неделания. Выбешивает персонал капитально. Отправлял багрепорт и писал - пока тишина.
...
Что-то мне подсказывает, что за деньги я должен гавкаться с MS сильнее. Однако большинство поймает себя на мысли, что LO с его падениями раздражает больше. Что халявный уксус обязан быть крепче платного. К чему бы это?
...
Только мы с Flukostat достаточно много поливали грязью оба пакета, поэтому нам проще :-))

Flukostat

18.04.2012 10:28

Падения и глюки ЛО выбешивают гораздо больше, чем все остальное вместе взятое. Вчера пара товарищей дошла с ЛО до белого каления, они пытались из одного doc-файла вставить в другой doc-файл обычной процедурой [em]пкм-копировать - пкм-вставить[/em]. Результат операции - нулевой. [em]Вставить как [/em]выдавало список возможных вариантов, причем если выбирать первый пункт (пустая строка), то ничего не вставлялось. Нормально вставлялся только пункт [em]неформатированный текст[/em]. После выбора этого пункта снова работало [em]пкм-копировать - пкм-вставить[/em], а потом снова переставало. Я выслушал много чего ласкового.

Damnien

18.04.2012 14:15

LO 3.5.2. у меня лично падает регулярно. Кстати, юзвери как-то молчат, а меня уже достало вконец. Простенький xls-файл может только попытки с третьей открыться - постоянно предлагает восстановить.

economist

19.04.2012 10:53

Damnien - "...юзвери как-то молчат..." - так радоваться надо. Прежде всего за них, возможно они используют формат ODT в котором ничего из вышеописанного не происходит. А себе купите MSO :-)

Текущее время: 15:43. Часовой пояс GMT +3.

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] Последняя >>

Показывать 40 сообщений этой темы на одной странице