Кто-нибудь читает с Киндла?

Кирилл П.

Сообщение Кирилл П. »

А просто перегнать ПДФ в текст (txt)?
Аватара пользователя
Пушистая няшечка2
Черный Пояс
Сообщения: 1042
Зарегистрирован: 03 окт 2009, 21:27

Сообщение Пушистая няшечка2 »

Кирилл П. писал(а):А просто перегнать ПДФ в текст (txt)?
Тоже как вариант. Но ведь хочется же до последнего сохранить красивое форматирование, если оно есть)
У меня, кстати, с конвертированием PDF пока не было проблем (пользуюсь Calibre).
Яшка
Черный Пояс
Сообщения: 514
Зарегистрирован: 04 апр 2011, 22:23

Сообщение Яшка »

Пушистая няшечка писал(а):
Кирилл П. писал(а):А просто перегнать ПДФ в текст (txt)?
Тоже как вариант. Но ведь хочется же до последнего сохранить красивое форматирование, если оно есть)
У меня, кстати, с конвертированием PDF пока не было проблем (пользуюсь Calibre).
Думаю те же проблемы будут. Проблема простая - конвертор не обладает искусственным интеллектом. И просто по расположению кусков текста на странице он не сможет догадаться что к какому абзацу относится. Закономерности конечно можно какие-то заложить в алгоритм. Но не так это просто все-таки.

Поэтому одно дело если это просто текст. Тут максимум может лишние абзацы добавить на местах разрыва страниц. А если есть еще и рисунки, таблицы, графики и текст их на разных страницах с разных сторон обтекает? Тогда будут проблемы. Мне вот такой вот попался - пришлось помучится.

Пользовался онлайн-конвертором http://www.convertfiles.com/
Может быть Calibre или http://www.online-convert.com/ бы и лучше обработал мой файл. Теперь уже не узнать. :)
Аватара пользователя
Пушистая няшечка2
Черный Пояс
Сообщения: 1042
Зарегистрирован: 03 окт 2009, 21:27

Сообщение Пушистая няшечка2 »

Яшка писал(а):А если есть еще и рисунки, таблицы, графики и текст их на разных страницах с разных сторон обтекает?
А это какая книжка?

Лично я вообще не представляю, как специальную литературу с таблицами и т.п... в маленькую читалку загонять. Ее надо как минимум отлично распознать и вычитать все ошибки. А на практике чаще всего - или нераспознанные, или OCR с ошибками. :(
Кирилл П.

Сообщение Кирилл П. »

Яшка писал(а):
Пушистая няшечка писал(а):
Кирилл П. писал(а):А просто перегнать ПДФ в текст (txt)?
Тоже как вариант. Но ведь хочется же до последнего сохранить красивое форматирование, если оно есть)
У меня, кстати, с конвертированием PDF пока не было проблем (пользуюсь Calibre).
Думаю те же проблемы будут.
Ну почему, Акробат позводяет сохранить как в текст правильно разбитый на абзацы, так и в rtf/doc, что вполне подъемно уже для большинства читалок...
Последний раз редактировалось Кирилл П. 07 дек 2011, 21:29, всего редактировалось 1 раз.
Кирилл П.

Сообщение Кирилл П. »

Пушистая няшечка писал(а):Лично я вообще не представляю, как специальную литературу с таблицами и т.п... в маленькую читалку загонять. Ее надо как минимум отлично распознать и вычитать все ошибки. А на практике чаще всего - или нераспознанные, или OCR с ошибками. :(
Ну, полагаю речь идет не о том пдф, который - просто контейнер для многостраничных растровых картинок, а про пдф с внедренными шрифтами и прочими элементами декора.
Яшка
Черный Пояс
Сообщения: 514
Зарегистрирован: 04 апр 2011, 22:23

Сообщение Яшка »

Кирилл П. писал(а):Ну почему, Акробат позводяет сохранить как в текст правильно разбитый на абзацы, так и в rtf/doc, что вполне подъемно уже для большинства читалок...
Кхм. Не знаю даже. Тут на примере, видимо, понять будет проще о чем я говорю. Правда не факт, что найду уже тот pdf. Но попробую.

Найду - выложу. А вы попробуете его нормально сконвертировать. И посмотрим.
Кирилл П.

Сообщение Кирилл П. »

Да я тут собственно ничем не кичусь, и интонация, ктр не слыхать, вполне себе задумчивая. Кладите конечно, побалуемся...
Яшка
Черный Пояс
Сообщения: 514
Зарегистрирован: 04 апр 2011, 22:23

Сообщение Яшка »

Кирилл П. писал(а):Да я тут собственно ничем не кичусь, и интонация, ктр не слыхать, вполне себе задумчивая. Кладите конечно, побалуемся...
Да я без претензий, собственно. :)
Файл вроде бы нашел, нужно только дождаться чтоб кто-то на раздачу торрента встал. Выложу скоро.
Кирилл П.

Сообщение Кирилл П. »

Яшка писал(а):Файл вроде бы нашел, нужно только дождаться чтоб кто-то на раздачу торрента встал. Выложу скоро.
А если просто банальный файлообменник?
Яшка
Черный Пояс
Сообщения: 514
Зарегистрирован: 04 апр 2011, 22:23

Сообщение Яшка »

Кирилл П. писал(а):
Яшка писал(а):Файл вроде бы нашел, нужно только дождаться чтоб кто-то на раздачу торрента встал. Выложу скоро.
А если просто банальный файлообменник?
Я выложу на файлобменник, да. Просто качал с торрента и потом удалил, как сконвертировал в фб2.
Аватара пользователя
А.М.
Черный Пояс
Сообщения: 905
Зарегистрирован: 25 май 2011, 10:40

Сообщение А.М. »

Кирилл П. писал(а):Ну почему, Акробат позводяет сохранить как в текст правильно разбитый на абзацы, так и в rtf/doc, что вполне подъемно уже для большинства читалок...
Мне больше нравится FineReader. ПДФ хорошо пережевывает и бережней относится к форматированию страниц.
Кирилл П.

Сообщение Кирилл П. »

Для распознавания Файнридер прекрасен, безусловно. Я имел в виду ПДФ, ктр не надо распознавать, с векторным текстом. Ну, типа как если из Ворда перегнать )
Аватара пользователя
А.М.
Черный Пояс
Сообщения: 905
Зарегистрирован: 25 май 2011, 10:40

Сообщение А.М. »

Кирилл П. писал(а):Для распознавания Файнридер прекрасен, безусловно. Я имел в виду ПДФ, ктр не надо распознавать, с векторным текстом. Ну, типа как если из Ворда перегнать )
Ну и я имел ввиду этот же случай... Просто несколько раз я получал от Акробата совершенно не вообразимую мешанину символов вместо нормально форматированного текста.
Теперь я сначала пробую получить текстовый файл с помощью акробата, а если он не справляется, использую Файнридер.
Яшка
Черный Пояс
Сообщения: 514
Зарегистрирован: 04 апр 2011, 22:23

Сообщение Яшка »

Проблемный PDF http://files.mail.ru/UOAROE
Ответить