Перейти к содержанию
Симферопольский Форум

Как оцифровать... книгу?


Рекомендуемые сообщения

Имеется некоторое количество библиографических редкостей, которыми хотелось бы поделиться.

Проблема, собственно, в том, как произвести оцифровку (сканирование и распознавание)? Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной. Разбирать книгу на «тетрадки» тоже нельзя — новую такую купить просто негде.

В голову пришла мысль — может быть использовать фотоаппарат для этого? Есть Nikon D3200 с китовой оптикой. А что еще нужно? Что-то для правильного освещения? Специальный штатив для камеры? Как вообще процесс организовать?

 

Может кто-то уже делал подобное? :)

Буду раз советам.

Ссылка на комментарий
Поделиться на другие сайты

Мне кажется, любого штатива будет достаточно. В идеале кольцевая вспышка, как для макро, но тоже, наверное, достаточно любые доступные источники света выставить правильно. Это за несколько кадров можно настроить. Дистанционный спуск или с задержкой - чтобы нажатие на кнопку не влияло на камеру. А вот держатель для книги нужен хороший, чтобы листы правильно фиксировал и книгу не портил при этом.
Или что-то случилось, или одно из двух.
Ссылка на комментарий
Поделиться на другие сайты

На хабре была статья, по-моему в 2019-м о сканировании книг. (В 2018-м https://habr.com/ru/post/425113/ , 2016-м https://habr.com/ru/post/389035/ https://habr.com/ru/post/393473/ )

Я бы поставил бы телефон с ПО для сканирования книг - они автоматически выравнивают и исправляют перспективные искажения.

Как дополнительный полезный инструмент - необходим деревянный и стеклянный уголок. В деревянный книга кладется, а стеклянным прижимается разворот.

http://krymology.info/images/f/f6/Simf_bibl_6.jpg


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов

Ничего не делается к лучшему © Борис Раушенбах

Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

Ссылка на комментарий
Поделиться на другие сайты

 

Я бы поставил бы телефон с ПО для сканирования книг

 

выходное качество обнять и плакать, такое ощущение, что снималось всё на камеру в 0.3 MPx

пыщ-пыщ
Ссылка на комментарий
Поделиться на другие сайты

Ну в любом случае придется как-то автоматизировать процесс корректировки искажений перспективы при такой съемке...
Ссылка на комментарий
Поделиться на другие сайты

А стекло бликовать не будет?

По идее свет падает под таким углом, что отражение не попадет в объектив.

 

выходное качество обнять и плакат

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов

Ничего не делается к лучшему © Борис Раушенбах

Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

Ссылка на комментарий
Поделиться на другие сайты

Можно перевернуть: Фотик на пол, лампы рядом сбоку, так, чтобы блики в объектив не попадали. Над всем этим - стекло на двух табуретках. стикерами отметить уголки для выравнивания. сооружаешь все так, чтобы был небольшой запас на коррекцию перекосов. Развернутую книгу кладешь сверху на стекло разворотом вниз, как на ксерокс. Фотик (если умееет) подключаешь к компьютеру и клацаешь оттуда, выгребая снимки сразу на винт. Ну или пультом жмакаешь.

 

 

если со штатива - Швейн, обращайся, могу дать поюзать большой и устойчивый штатив.

 

 

В любом случае освещение либо ставишь так, чтобы не бликовало даже рикошетом (сильно сбоку несколько ламп), либо с широкими матовыми рассеивателями (Проволока плюс наволочка =) )

- Что они хотят? 
- Ку они хотят…

Ссылка на комментарий
Поделиться на другие сайты

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной.

Ну и что, раз вы потом планируете делать распознавание в Файнридере.

Тут скорей имеет бОльшее значение переплет книги - клеевой (дешевый), ниточный и т.д.

Вот, нашел у себя Детскую энциклопедию на 587 стр, сейчас попробую на сканере и фотиком сделать варианты.

Ссылка на комментарий
Поделиться на другие сайты

Den3

Да, распознавание будет. Я совсем не уверен, что сантиметр-полтора текста от корешка не уйдёт в «черную область», если использовать сканер

Ссылка на комментарий
Поделиться на другие сайты

Вот, провел эксперимент. Фотик и сканер.

йй.jpeg

 

ййй.JPG

С фотика все буквы четкие, но надо решать как победить изгиб книги т.к. он не дает нормально распознать.

Со сканера всё ровное кроме корешка. Данный сканер не имеет большой глубины резкости (хреновый сканер, офисный). Где то в подвале валяется старый Юмакс, вот тот имел большую глубину резкости, но и там излом корешка будет мешать распознаванию.

 

К сожалению, нет у меня стекла на которое можно было бы положить книгу, а фотик снизу и сделать снимок.

Ссылка на комментарий
Поделиться на другие сайты

Да, вариант со стеклом и освещением из окна (чтоб бликов не было), самое то.

P1060704_2.JPG

 

P1060706_2.JPG

Файнридер вполне сносно распознал. К сожалению, Вордовский файл тут не прицепишь. Вот он на Я-диске https://yadi.sk/i/G_EQvFCzJhTlSQ

 

Снято с рук, перпендикулярно книге (не всякий штатив умеет опускать голову вниз, придется как то городить сбоку чтоб лежал на чем то). Света из окна достаточно чтоб ничем больше не светить и он рассеянный. Стекло самое обычное грязное мебельное. После Файнридера все равно придется всё проверять.

Ссылка на комментарий
Поделиться на другие сайты

Когда-то давно сканировал книгу...

 

Суть метода - книга укладывается на угол (стекло), то есть она раскрыта на 90 градусов.

Используется, естественно, фотоаппарат, снимать можно хоть горизонтальную, хоть вертикальную часть.

Смысл - нет пространственных искажений у корешка толстых томов.

Ссылка на комментарий
Поделиться на другие сайты

планетарный сканер - https://elarscan.ru/modelnyj-ryad/

их много разных !

Не любо - не слушай, а врать не мешай !

"Величайшей ошибкой было бы думать, " © В. И. ЛЕНИН ПСС том 34, стр. 244.

", было бы величайшей ошибкой думать," © В. И. ЛЕНИН ПСС том 42, стр. 74.

"поругаешь власть — попадаешь под закон об оскорблении, похвалишь власть — попадаешь под закон о фейковых новостях" © В. Матвиенко

Ссылка на комментарий
Поделиться на другие сайты

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Проще, но существенно дольше. На сотой странице от писка голова уже болит (я книгу на 500 страниц сканировал, да).

 

 

Кстати, если книга большая, имеет смысл пробежать отдельно четные и нечетные страницы - меньше возни с перекладыванием и резкой для распознавателя. Корешок опять же не изгибается, можно даже без стекла обойтись.

- Что они хотят? 
- Ку они хотят…

Ссылка на комментарий
Поделиться на другие сайты

По идее свет падает под таким углом, что отражение не попадет в объектив.

 

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.

надо было срочно 400 документов в пдф загнать. оказалось проще подрезать на работе МФУ, которая потоком сканит. выходное качество с мобильных сканеров оказалось "ниачом"

пыщ-пыщ
Ссылка на комментарий
Поделиться на другие сайты

Если память не врет, то в библиотеке Франко был специальный сканер для книг. Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку. Давно было, в прошлой стране.
Ссылка на комментарий
Поделиться на другие сайты

Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку

 

знаю что у них достаточно быстро шторки на фотоаппаратах заело. По-моему лет за пять износились фотоаппараты.


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов

Ничего не делается к лучшему © Борис Раушенбах

Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

Ссылка на комментарий
Поделиться на другие сайты

Совершенно верно. У нас тоже есть книжный сканер, как на картинке ниже.

Один из фотоаппаратов уже вышел из строя, предполагаю что исчерпался ресурс затвора.

Но качество сильно уступает обычным сканерам. Поэтому используем только для крупноформатных изданий и периодики.

http://krymology.info/images/f/f6/Simf_bibl_6.jpg

Изменено пользователем terrible
Ссылка на комментарий
Поделиться на другие сайты

Вот - A2B-600

planscan_a2v_001.png

Но он не 5 копеек стоит!

Не любо - не слушай, а врать не мешай !

"Величайшей ошибкой было бы думать, " © В. И. ЛЕНИН ПСС том 34, стр. 244.

", было бы величайшей ошибкой думать," © В. И. ЛЕНИН ПСС том 42, стр. 74.

"поругаешь власть — попадаешь под закон об оскорблении, похвалишь власть — попадаешь под закон о фейковых новостях" © В. Матвиенко

Ссылка на комментарий
Поделиться на другие сайты

Один из фотоаппаратов уже вышел из строя, предполагаю что исчерпался ресурс затвора.

Нужно что то по-современней с электронным затвором (всякого рода беззеркалки). Там механически ничего не по-портится)). Но соглашусь, 600 страниц отсканировать\отфоткать, да потом распознать, да еще проверить... это очень дорогая должна быть книга.

Но качество сильно уступает обычным сканерам

Тут да, но для распознавания в Файнридере его хватает, а большего и не запрашивали.

Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

Загрузка...

Чат

Чат

Please enter your display name

×
×
  • Создать...