Jump to content

Как оцифровать... книгу?


Recommended Posts

Имеется некоторое количество библиографических редкостей, которыми хотелось бы поделиться.

Проблема, собственно, в том, как произвести оцифровку (сканирование и распознавание)? Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной. Разбирать книгу на «тетрадки» тоже нельзя — новую такую купить просто негде.

В голову пришла мысль — может быть использовать фотоаппарат для этого? Есть Nikon D3200 с китовой оптикой. А что еще нужно? Что-то для правильного освещения? Специальный штатив для камеры? Как вообще процесс организовать?

 

Может кто-то уже делал подобное? :)

Буду раз советам.

Link to comment
Share on other sites

Мне кажется, любого штатива будет достаточно. В идеале кольцевая вспышка, как для макро, но тоже, наверное, достаточно любые доступные источники света выставить правильно. Это за несколько кадров можно настроить. Дистанционный спуск или с задержкой - чтобы нажатие на кнопку не влияло на камеру. А вот держатель для книги нужен хороший, чтобы листы правильно фиксировал и книгу не портил при этом.
Link to comment
Share on other sites

На хабре была статья, по-моему в 2019-м о сканировании книг. (В 2018-м https://habr.com/ru/post/425113/ , 2016-м https://habr.com/ru/post/389035/ https://habr.com/ru/post/393473/ )

Я бы поставил бы телефон с ПО для сканирования книг - они автоматически выравнивают и исправляют перспективные искажения.

Как дополнительный полезный инструмент - необходим деревянный и стеклянный уголок. В деревянный книга кладется, а стеклянным прижимается разворот.

http://krymology.info/images/f/f6/Simf_bibl_6.jpg

Link to comment
Share on other sites

 

Я бы поставил бы телефон с ПО для сканирования книг

 

выходное качество обнять и плакать, такое ощущение, что снималось всё на камеру в 0.3 MPx

Link to comment
Share on other sites

А стекло бликовать не будет?

По идее свет падает под таким углом, что отражение не попадет в объектив.

 

выходное качество обнять и плакат

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.
Link to comment
Share on other sites

Можно перевернуть: Фотик на пол, лампы рядом сбоку, так, чтобы блики в объектив не попадали. Над всем этим - стекло на двух табуретках. стикерами отметить уголки для выравнивания. сооружаешь все так, чтобы был небольшой запас на коррекцию перекосов. Развернутую книгу кладешь сверху на стекло разворотом вниз, как на ксерокс. Фотик (если умееет) подключаешь к компьютеру и клацаешь оттуда, выгребая снимки сразу на винт. Ну или пультом жмакаешь.

 

 

если со штатива - Швейн, обращайся, могу дать поюзать большой и устойчивый штатив.

 

 

В любом случае освещение либо ставишь так, чтобы не бликовало даже рикошетом (сильно сбоку несколько ламп), либо с широкими матовыми рассеивателями (Проволока плюс наволочка =) )

Link to comment
Share on other sites

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной.

Ну и что, раз вы потом планируете делать распознавание в Файнридере.

Тут скорей имеет бОльшее значение переплет книги - клеевой (дешевый), ниточный и т.д.

Вот, нашел у себя Детскую энциклопедию на 587 стр, сейчас попробую на сканере и фотиком сделать варианты.

Link to comment
Share on other sites

Den3

Да, распознавание будет. Я совсем не уверен, что сантиметр-полтора текста от корешка не уйдёт в «черную область», если использовать сканер

Link to comment
Share on other sites

Вот, провел эксперимент. Фотик и сканер.

йй.jpeg

 

ййй.JPG

С фотика все буквы четкие, но надо решать как победить изгиб книги т.к. он не дает нормально распознать.

Со сканера всё ровное кроме корешка. Данный сканер не имеет большой глубины резкости (хреновый сканер, офисный). Где то в подвале валяется старый Юмакс, вот тот имел большую глубину резкости, но и там излом корешка будет мешать распознаванию.

 

К сожалению, нет у меня стекла на которое можно было бы положить книгу, а фотик снизу и сделать снимок.

Link to comment
Share on other sites

Да, вариант со стеклом и освещением из окна (чтоб бликов не было), самое то.

P1060704_2.JPG

 

P1060706_2.JPG

Файнридер вполне сносно распознал. К сожалению, Вордовский файл тут не прицепишь. Вот он на Я-диске https://yadi.sk/i/G_EQvFCzJhTlSQ

 

Снято с рук, перпендикулярно книге (не всякий штатив умеет опускать голову вниз, придется как то городить сбоку чтоб лежал на чем то). Света из окна достаточно чтоб ничем больше не светить и он рассеянный. Стекло самое обычное грязное мебельное. После Файнридера все равно придется всё проверять.

Link to comment
Share on other sites

Когда-то давно сканировал книгу...

 

Суть метода - книга укладывается на угол (стекло), то есть она раскрыта на 90 градусов.

Используется, естественно, фотоаппарат, снимать можно хоть горизонтальную, хоть вертикальную часть.

Смысл - нет пространственных искажений у корешка толстых томов.

Link to comment
Share on other sites

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Проще, но существенно дольше. На сотой странице от писка голова уже болит (я книгу на 500 страниц сканировал, да).

 

 

Кстати, если книга большая, имеет смысл пробежать отдельно четные и нечетные страницы - меньше возни с перекладыванием и резкой для распознавателя. Корешок опять же не изгибается, можно даже без стекла обойтись.

Link to comment
Share on other sites

По идее свет падает под таким углом, что отражение не попадет в объектив.

 

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.

надо было срочно 400 документов в пдф загнать. оказалось проще подрезать на работе МФУ, которая потоком сканит. выходное качество с мобильных сканеров оказалось "ниачом"

Link to comment
Share on other sites

Если память не врет, то в библиотеке Франко был специальный сканер для книг. Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку. Давно было, в прошлой стране.
Link to comment
Share on other sites

Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку

 

знаю что у них достаточно быстро шторки на фотоаппаратах заело. По-моему лет за пять износились фотоаппараты.

Link to comment
Share on other sites

Совершенно верно. У нас тоже есть книжный сканер, как на картинке ниже.

Один из фотоаппаратов уже вышел из строя, предполагаю что исчерпался ресурс затвора.

Но качество сильно уступает обычным сканерам. Поэтому используем только для крупноформатных изданий и периодики.

http://krymology.info/images/f/f6/Simf_bibl_6.jpg

Edited by terrible
Link to comment
Share on other sites

Один из фотоаппаратов уже вышел из строя, предполагаю что исчерпался ресурс затвора.

Нужно что то по-современней с электронным затвором (всякого рода беззеркалки). Там механически ничего не по-портится)). Но соглашусь, 600 страниц отсканировать\отфоткать, да потом распознать, да еще проверить... это очень дорогая должна быть книга.

Но качество сильно уступает обычным сканерам

Тут да, но для распознавания в Файнридере его хватает, а большего и не запрашивали.

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Loading...

Чат

Чат

Please enter your display name

×
×
  • Create New...