Скопировать текст из PDF- Использование программ

Гость

0 - 31.01.2012 - 16:17

Выделяю текст в PDF, нажимаю CTRL+c, потом открываю Word и нажимаю CTRL+v. Но вместо текста копируются "козябры". Как быть? Пример PDF (20 мегабайт):

http://www.kubnews.ru/upload/uf/373/...qqdwu-2012.pdf

Пробовал Foxit Reader и Adobe Acrobat Reader.

Гость

1 - 31.01.2012 - 16:18

Вот пример pdf поменьше (3 Мб)

http://www.kubnews.ru/upload/iblock/e91/0.pdf

То есть текст выделяется, но не получается скопировать его в Word или блокнот.

Гость

2 - 31.01.2012 - 16:35

ScreenshotReader Можно использовать хоть с растра все прочитает

Гость

3 - 31.01.2012 - 16:36

ScreenshotReader ABBYY канешна я имел ввиду

Гость

4 - 31.01.2012 - 16:42

С распознаванием можно и через FineReader пропустить. Вопрос в том, можно ли без распознавания текст вытащить. Т.е. текст выделяется, но при копировании получаются козябры и каждая строка - как отдельный абзац.

Гость

5 - 31.01.2012 - 19:08

Явно у текста едет кодировка, однако
если послать это сюда
http://www.convertpdftotext.net/
то получишь текст
или сюда тут ограничение по размеру http://www.onlineocr.net/default.aspx
и получишь doc файл

но что текст что док файл придется серьезно допиливать ручками

Гость

6 - 01.02.2012 - 07:44

Попробуйте сменить язык клавиатуры перед Ctrl+C. Для 1С это помогает. Есть однако такие PDF-файлы с юникодом, из которых будет скопирован заведомо однобайтовый текст, как бы кто ни старался. Это своеобразная защита от пиратства, реализуется при компилировании PDF путем подмены в уже готовом файле тега с кодировкой.

Гость

7 - 01.02.2012 - 10:44

7) пробовал менять раскладку - козябры остались. Похоже, действительно, PDF с юникодом, а при копировании он преобразуется в ANSI, отчего получаются козябры.

Гость

8 - 01.02.2012 - 20:36

Цитата:

Сообщение от Suppir