3 способа конвертировать PDF в Word
реклама
У человека по долгу работы много работающего с текстами, рано или поздно встаёт задача преобразования документов из одного формата в другой. Например, из PDF, в котором распространяется много книг и различной документации, в формат Word (как говорят обычные пользователи). На самом деле имеются ввиду форматы DOC и DOCX. К программе-конвертеру будут стандартные требования, вроде интуитивно понятного интерфейса, чтобы ей могли пользоваться дети и пенсионеры, наличие русского языка, чтобы можно было работать с ней без знания английского, качественное конвертирование, без потери картинок или текста. Дополнительное пожелание, чтобы программа была от российских разработчиков, ввиду санкций и активного импортозамещения.
Что такое PDF файл, его плюсы и минусы?
реклама
Сначала уточним, что из себя представляет PDF файл. Это Portable Document Format (формат портативного документа), позволяющий сохранять в одном файле текст и картинки, при этом при печати не будет никаких смещений текста, как в вордовских файлах. В PDF файле сохраняются шрифты исходного документа и в любой программе для просмотра, он будет выглядеть одинаково. При создании PDF файла используется сжатие данных, которое можно настраивать в настройках программы PDF-редактора. Чем меньше сжатие, тем больше объём файла и выше качество картинки.
Плюсом этого формата является возможность защиты данных от редактирования и просмотра. В типографиях также используется формат PDF/X (разновидность Adobe PDF), но его мы рассматривать не будем.
Минусом формата PDF стала невозможность масштабирования текста на экране смартфона или электронной читалки (ридера). Большая часть подобных гаджетов имеют диагональ 6-7 дюймов, и страница в формате PDF будет выглядеть очень мелко, являясь практически нечитаемой. На первом фото страница книги на экране Amazon Kindle Paperwhite 2018, экран eINK Carta диагональю 6 дюймов и разрешением 1448х1072 точек. Если смотреть фото на экране монитора, то текст читаемый, но на втором фото видно в каком он масштабе, высота букв всего около 2 мм. Для комфортного чтения требуется размер минимум вдвое больше. Для привычного масштабирования текста требуется конвертация PDF в формат DOC или DOCX.
реклама
PDF файл может быть 3 видов:
Только текстовый, самый простой случай, когда с конвертацией справятся любые онлайн-сервисы, и бесплатные программы.
Только графический, когда каждая страница представляет собой картинку или фото. Работать с таким файлом нужно как со сканированным документом, и справится с этой задачей далеко не каждый конвертер.
Смешанный, наиболее сложный вариант для конвертирования, поскольку часть текста может опознаться неверно, вместо некоторых букв могут появиться служебные символы или пробелы.
Конвертация из PDF в DOC или DOCX
реклама
Для тестов я выбрал 2 книги, первая по настройке Ubuntu Linux, вторая по правилам деловой переписки. Книги были выбраны не случайно, первая приличного объёма и со сложным текстом, вторая скромного объёма, с текстом попроще и практически без картинок.
Самый простой для пользователя способ, воспользоваться Microsoft Word (минимум версией 2010, более старые могут не иметь такой функции). Этот способ довольно долгий и процесс конвертации не всегда увенчается успехом. Например, книгу с картинками объёмом 41,6 Мб он конвертировал 11 минут, после чего выдал ошибку. А книгу объёмом 1,5 Мб Microsoft Word сконвертировал меньше чем за минуту, без ошибок при конвертации, но с опечатками и смещениями в получившемся тексте. Word сконвертированный файл создал в отдельном окне, без традиционных вордовских панелей редактирования и предупредил, что редактирование запрещено, требуется создать копию этого файла и уже с ней работать. По умолчанию предложил сохранить в формате DOCX. Сохранённая копия открывалась уже как обычный вордовский документ и позволяла редактировать книгу.
реклама
Второй способ, использовать специальную программу. Например, Icecream PDF Converter, которая имеет встроенную читалку PDF, поддерживает запароленные файлы. Программа имеет русский интерфейс, разрабатывалась программистами из Питера. Бесплатная версия ограничена работой с файлами объёмом до 5 страниц. Повезло, что у моего друга была куплена полная версия программы и мне удалось её протестировать.
Проверял программу на двух книгах, что и ранее, все настройки были по умолчанию первую он предложил обработать с опознаваем сканированного текста и процесс пошёл без ошибок, но медленно, в силу объёма книги и сложности текста (русские и английские символы, плюс специальные знаки). Маленькую книгу он шустро конвертировал, менее, чем за минуту. По умолчанию был файл формата DOC помещённый в отдельную папку с идентичным названием. Были небольшие неточности и смещения ввиду сложного форматирования, но основной текст перенесся правильно. По качеству конвертации эта программа даже обогнала Microsoft Word, на мой субъективный взгляд. Интересно было бы сравнить платные версии всех подобных программ, но пока бюджет не позволяет. Тестировать пиратские версии программ не вижу смыла, поскольку при взломе программы зачастую повреждаются либо вырезаются некоторые её модули и функции.
Ещё есть PDFChef by Movavi, имеющая бесплатную и платную версии. Она не имеет русского интерфейса и имеет ограничение по объёму PDF файла 10 Мб, когда большинство книг имеют объём 20 Мб и больше.
Другая популярная программа ABBY Fine Reader уже специализируется на обработке сканированных документов. Она имеет бесплатную 30 дневную пробную версию и ограничение на 100 страниц для распознавания.
Конкурентом ABBY Fine Reader стала программа Readiris Pro, она требует регистрацию, имеет английский интерфейс, пробный период всего 10 дней и может конвертировать только 100 страниц. Она умеет распознавать математические формулы и различные символы, включая иероглифы.
Третий способ конвертировать PDF в Word онлайн. Например, Small PDF, требующая регистрацию, имеющая бесплатный период 7 дней и работающая с файлами любых объёмов. Она имеет русский интерфейс, но может ошибаться с распознаванием картинок.
Аналогичный сервис имеется у программы PDF24. Сама программа является PDF-редактором и устанавливается на ПК (есть и оналйн версия), а конвертировать предлагает собственным онлайн-сервисом в формат DOCX, либо TXT (с удалением всех картинок). Процесс довольно долгий даже для небольшой книги. Качество полученного файла немного уступает Microsoft Word и также требует ручного редактирования.
Уважаемые читатели, напишите, пожалуйста, о своём опыте конвертации файлов, можно любых форматов. Думаю, что остальным будет интересен Ваш опыт, напишите какими программами или онлайн-сервисами пользовались и какие настройки выставляли.
реклама
Лента материалов
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила