Videoforum - форум о видео и не только!

Videoforum - форум о видео и не только! (http://videoforums.ru/index.php)
-   Софт и игры (http://videoforums.ru/forumdisplay.php?f=35)
-   -   Конвертирование fb2 в формат Word (http://videoforums.ru/showthread.php?t=4906)

Жрец Нефтиды 03.08.2013 17:02

Конвертирование fb2 в формат Word
 
Многие книги в Сети сейчас раздаются в формате fb2. Не будем внутри этой темы разглагольствовать, а не проще ли какой-нибудь читалкой напрямую прочитать fb2. Задача поставлена однозначно в заголовке темы: конвертировать fb2 в doc, и точка. Причём сделать это нужно качественно. А что значит качественно – сейчас разберёмся.
Большинство читалок fb2 предоставляют возможность экспортировать fb2 в txt. Это нам и нужно: запускаем Word, открываем "Блокнотом" полученный txt файл, выделяем всё, копируем в буфер обмена, и в Word-е жмём "Правка" – "Специальная вставка" – "Неформатированный текст". При такой последовательности действий будет сохранено текущее, то есть заданное тобой, форматирование страниц.
В качестве тестового примера предлагаю вот этот скачанный из Сети файл:
http://yadi.sk/d/CE4EEPtK7X4eK
Этот файл имеет несколько тонкостей, о которые спотыкаются многие читалки. Главная тонкость в следующем. В самом начале файла находится небольшой кусок текста, который называется комментарии (аннотация, эпиграф). После него следует дата, а потом уже основной текст книги.
Я исследовал практически все читалки, до которых смог дотянуться. Сразу договоримся: в данной теме рассматриваем только работу на ПК, всякие там гнусные андроиды в упор не видим. Вот что мы имеем.
FB2 to Any converter комментарии видит, но без даты. При конвертировании в конце каждого абзаца добавляет пробел. (Полагаю, что функция отображения непечатных символов в Word-е у тебя включена.) При конвертировании в txt между абзацами вставляет пустую строку (при конвертировании в rtf не вставляет). Отбрасываем.
AlReader комментарии видит, но без даты. При экспорте в txt и в начале, и в конце каждого абзаца добавляет пробел, иногда со значком . Отбрасываем.
FBReader функции экспорта не имеет. Комментарии видит, но без даты. Функций "Выделить всё" и "Копировать" не имеет. Выделяем весь текст вручную следующим образом. Начинаем вести курсором при нажатой левой кнопке мыши от самого начала текста, потом, не отпуская кнопку мыши, жмём на клавиатуре "End" и доводим до самого конца текста. Копируем выделенный текст в буфер обмена одновременный нажатием кнопок "Ctrl" – "C". Вставляем в Word. Видим, что в конце каждого абзаца добавляет пробел. Отбрасываем.
STDU Viewer комментариев и даты не видит. При экспорте в txt в конце каждого абзаца добавляет пробел. Отбрасываем.
Ещё несколько программ типа Haali Reader, BookReader и т.п. имеют аналогичные недостатки: все они в конце каждого абзаца добавляют пробел, многие из них не видят комментариев, имеют другие заморочки. Не будем тратить время на их рассмотрение.
Переходим к двум действительно хорошим программам.
CoolReader берём с сайта http://coolreader.org/ Комментарии и дату видит! Имеет функцию экспорта в wol, но зачем это нужно? Функции экспорта в txt не имеет. Функций "Выделить всё" и "Копировать" не имеет. Копируем в Word вручную, как описано выше. Видим, что сзади каждого абзаца вставляет пробел. НЕ отбрасываем!
Ice Book Reader Professional берём с официального сайта http://www.ice-graphics.com/ICEReader/DownloadR.html Комментарии видит, причём выводит их в отдельном подокне. Дату не видит. Имеет функцию экспорта в разные форматы. Мы будем пользоваться функцией экспорта в txt, а уже оттуда скопируем в Word. Открываем файл, жмём "Библиотека", выделяем левым кликом мыши наш файл, жмём "Экспорт" – "Экспортировать книги". При каждом запуске программы опции на вылетевшей вкладке будут сбрасываться к значениям по умолчанию. От значений по умолчанию меняем следующие параметры. "Максимальная длина строки" – точка у "Не ограничена". Теперь строки не будут искусственно разбиваться. "Отступ абзаца" выставляем в 0. Теперь паразитные пробелы не будут добавляться ни в начале, ни в конце абзацев. Ни одна из исследованных мною программ так хорошо не работает! Жмём кнопку "Экспорт", и получаем txt файл. Сворачиваем Ice Book Reader Professional, но пока не выгружаем. Перекидываем текст из txt в Word. Видим, что пока комментариев нет. Но это даже к лучшему. Разворачиваем Ice Book Reader Professional. В подокне "Комментарии" видим комментарии. Внутри этого подокна работают функции "Выделить всё" и "Копировать". Копируем комментарии в Word. Поскольку при таком подходе мы явно видим, что данный кусок текста является комментариями, то можем выделить его другим шрифтом. Выгружаем Ice Book Reader Professional – вот выгружается он почему-то долго, что-то там сохраняет. Запускаем CoolReader и с его помощью копируем только дату – она обычно находится либо в самом начале книги, либо после комментариев, либо в самом конце книги. Сохраняем Word-ом doc файл.
Подведём итог. Тема fb2 выявила следующую негативную тенденцию в современном книгочтейном программировании. Программисты делают акцент на дизайн страниц, на какие-то там экзотические написания заглавных и прописных букв, и на прочую оформительскую пену, забывая при этом, что их "гениальные" читалки могут попросту пропустить кусок текста или добавить паразитные пробелы. Увы, превалирование дизайна над истинным качеством прослеживается сейчас не только в читалках. На счастье, каста жрецов всегда сумеет выудить ориентированное на качество ПО.
Если захочешь выйти со мной на связь напрямую – то: nefezida83@mail.ru

Жрец Нефтиды 17.02.2014 14:31

Вложений: 1
Полное собрание сочинений Марины Цветаевой в формате fb2 лежит здесь: http://rutracker.org/forum/viewtopic.php?t=2345269
Описанной в основной статье методикой я перевёл его в формат doc. Попутно убедился, что после нажатия кнопки "Экспорт" ещё некоторые опции лучше изменить в значения, отличные от значений по умолчанию. Как именно заполнять вкладку – увидишь на прикреплённой к этому посту фотографии. Именно с такими настройками я и обработал все fb2 файлы из данной раздачи М. Цветаевой.
Полное собрание сочинений Марины Цветаевой в формате doc выкладываю здесь:
http://yadi.sk/d/uweCl760J4JTF
Согласись, читать в формате doc гораздо лучше, чем в отстойном fb2 или в фотографическом pdf. Все почитатели и почитательницы творчества Цветаевой – не забываем восхвалять древнеегипетских жрецов!

DmitryKz 27.01.2017 07:51

Жрец, а мог бы ты обновить ссылки на Яндексе? Волшебное слово - Пожалуйста...

Жрец Нефтиды 08.02.2017 11:03

Спасибо, Дмитрий, что напомнил: тут у меня нет кнопки "Правка", не могу исправить.
Если кому нужно -- пишем в Л.С.

Prtava 08.02.2017 13:31

Как же вы бедненькие на ХР мучаетесь, даже текстовые файлы вам приходится конвертировать. А вот так на десятке без всяких лишних телодвижений, даже можно опцию включить "листать страницы как в настоящей книге"
[Для просмотра данной ссылки нужно зарегистрироваться]

Жрец Нефтиды 10.02.2017 17:47

Цитата:

Сообщение от Prtava (Сообщение 71073)
Как же вы бедненькие на ХР мучаетесь,

Буду дальше продолжать мучиться -- может, ещё кто-нибудь пожалеет...
А если серьёзно -- есть с десяток читалок с самым разным интерфейсом, не привязанных к ОС.
Эх, Prtava, ты не вычислил, чем меня реально можно зацепить. Есть такая программа -- Стеллариум. Симулятор планетария. На 32' мониторе штука космическая, с показом различных космических явлений. Так вот последние версии Стеллариума на XP уже не фурычат. Так что переход на 10 (11?) -- вопрос лишь инерции.

Prtava 10.02.2017 18:35

Цитата:

Сообщение от Жрец Нефтиды (Сообщение 71102)
Есть такая программа -- Стеллариум

Да, красиво
[Для просмотра данной ссылки нужно зарегистрироваться]

Цитата:

Сообщение от Жрец Нефтиды (Сообщение 71102)
Так что переход на 10 (11?)

10 - это теперь навсегда, не будет больше win 11 и далее. TreshHold уже снимается с поддержки, RS1 тоже после выхода летом RS2 тоже уйдет, какие еще названия MS бы не придумывало, все это навсегда десятка.

Валькирия666 13.02.2018 04:31

Так есть же специальные сервисы для конвертирования, и не надо ничего скачивать.


Часовой пояс GMT +1, время: 11:12.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd. Перевод: zCarot