0
- 31.01.2012 - 16:17
|
Выделяю текст в PDF, нажимаю CTRL+c, потом открываю Word и нажимаю CTRL+v. Но вместо текста копируются "козябры". Как быть? Пример PDF (20 мегабайт): http://www.kubnews.ru/upload/uf/373/...qqdwu-2012.pdf Пробовал Foxit Reader и Adobe Acrobat Reader. | |
1
- 31.01.2012 - 16:18
|
Вот пример pdf поменьше (3 Мб) http://www.kubnews.ru/upload/iblock/e91/0.pdf То есть текст выделяется, но не получается скопировать его в Word или блокнот. | |
2
- 31.01.2012 - 16:35
| ScreenshotReader Можно использовать хоть с растра все прочитает | |
3
- 31.01.2012 - 16:36
| ScreenshotReader ABBYY канешна я имел ввиду | |
4
- 31.01.2012 - 16:42
| С распознаванием можно и через FineReader пропустить. Вопрос в том, можно ли без распознавания текст вытащить. Т.е. текст выделяется, но при копировании получаются козябры и каждая строка - как отдельный абзац. | |
5
- 31.01.2012 - 19:08
|
Явно у текста едет кодировка, однако если послать это сюда http://www.convertpdftotext.net/ то получишь текст или сюда тут ограничение по размеру http://www.onlineocr.net/default.aspx и получишь doc файл но что текст что док файл придется серьезно допиливать ручками | |
6
- 01.02.2012 - 07:44
| Попробуйте сменить язык клавиатуры перед Ctrl+C. Для 1С это помогает. Есть однако такие PDF-файлы с юникодом, из которых будет скопирован заведомо однобайтовый текст, как бы кто ни старался. Это своеобразная защита от пиратства, реализуется при компилировании PDF путем подмены в уже готовом файле тега с кодировкой. | |
7
- 01.02.2012 - 10:44
| 7) пробовал менять раскладку - козябры остались. Похоже, действительно, PDF с юникодом, а при копировании он преобразуется в ANSI, отчего получаются козябры. | |
8
- 01.02.2012 - 20:36
| как то вот так получилось, забирайте http://narod.ru/disk/39329412001/%D0...D0%95.rar.html | |
| Интернет-форум Краснодарского края и Краснодара |