Симферопольский Форум: Как оцифровать... книгу? - Симферопольский Форум

Перейти к содержимому

Внимание! Для всех новых пользователей введена премодерация сообщений и тем.
  • (2 Страниц)
  • +
  • 1
  • 2
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

Как оцифровать... книгу?

#1 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 10:59

Имеется некоторое количество библиографических редкостей, которыми хотелось бы поделиться.
Проблема, собственно, в том, как произвести оцифровку (сканирование и распознавание)? Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной. Разбирать книгу на «тетрадки» тоже нельзя — новую такую купить просто негде.
В голову пришла мысль — может быть использовать фотоаппарат для этого? Есть Nikon D3200 с китовой оптикой. А что еще нужно? Что-то для правильного освещения? Специальный штатив для камеры? Как вообще процесс организовать?

Может кто-то уже делал подобное? :)
Буду раз советам.


#2 Пользователь офлайн   FreeLSD 

  • Живу здесь
  • PipPipPipPipPip
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 9 940
  • Регистрация: 16 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 11:05

Мне кажется, любого штатива будет достаточно. В идеале кольцевая вспышка, как для макро, но тоже, наверное, достаточно любые доступные источники света выставить правильно. Это за несколько кадров можно настроить. Дистанционный спуск или с задержкой - чтобы нажатие на кнопку не влияло на камеру. А вот держатель для книги нужен хороший, чтобы листы правильно фиксировал и книгу не портил при этом.

Если человек не начнёт работать над собой, то дьявол найдёт ему другую работу - выискивать недостатки у других.

Поблагодарили: 1

#3 Пользователь офлайн   Rumlin 

  • Добрый волшебник
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 33 878
  • Регистрация: 16 Сентябрь 10
  • Сказали спасибо раз:
  • ГородHavana
  • Страна:  

Отправлено 17 Июль 2020 - 11:14

На хабре была статья, по-моему в 2019-м о сканировании книг. (В 2018-м https://habr.com/ru/post/425113/ , 2016-м https://habr.com/ru/post/389035/ https://habr.com/ru/post/393473/ )
Я бы поставил бы телефон с ПО для сканирования книг - они автоматически выравнивают и исправляют перспективные искажения.
Как дополнительный полезный инструмент - необходим деревянный и стеклянный уголок. В деревянный книга кладется, а стеклянным прижимается разворот.
Изображение


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов
Ничего не делается к лучшему © Борис Раушенбах
Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский


Какой ты любопытный.

Поблагодарили: 2 :

#4 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 11:24

А стекло бликовать не будет?


#5 Пользователь офлайн   Moloch 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 867
  • Регистрация: 03 Апрель 14
  • Сказали спасибо раз:
  • ГородБабруйск
  • Страна:  

Отправлено 17 Июль 2020 - 11:29

Просмотр сообщенияRumlin (17 Июль 2020 - 11:14) писал:


Я бы поставил бы телефон с ПО для сканирования книг


выходное качество обнять и плакать, такое ощущение, что снималось всё на камеру в 0.3 MPx

пыщ-пыщ

#6 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 11:47

Ну в любом случае придется как-то автоматизировать процесс корректировки искажений перспективы при такой съемке...


#7 Пользователь офлайн   Rumlin 

  • Добрый волшебник
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 33 878
  • Регистрация: 16 Сентябрь 10
  • Сказали спасибо раз:
  • ГородHavana
  • Страна:  

Отправлено 17 Июль 2020 - 11:57

Просмотр сообщенияSchwein сказал:

А стекло бликовать не будет?
По идее свет падает под таким углом, что отражение не попадет в объектив.

Просмотр сообщенияMoloch сказал:

выходное качество обнять и плакат
Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов
Ничего не делается к лучшему © Борис Раушенбах
Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский


Какой ты любопытный.

#8 Пользователь офлайн   Инквизитор 

  • Vexilla regis prodeunt inferni
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 14 103
  • Регистрация: 20 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 12:59

Можно перевернуть: Фотик на пол, лампы рядом сбоку, так, чтобы блики в объектив не попадали. Над всем этим - стекло на двух табуретках. стикерами отметить уголки для выравнивания. сооружаешь все так, чтобы был небольшой запас на коррекцию перекосов. Развернутую книгу кладешь сверху на стекло разворотом вниз, как на ксерокс. Фотик (если умееет) подключаешь к компьютеру и клацаешь оттуда, выгребая снимки сразу на винт. Ну или пультом жмакаешь.


если со штатива - Швейн, обращайся, могу дать поюзать большой и устойчивый штатив.


В любом случае освещение либо ставишь так, чтобы не бликовало даже рикошетом (сильно сбоку несколько ламп), либо с широкими матовыми рассеивателями (Проволока плюс наволочка =) )

"Время разрухи загрязняет разум."

Поблагодарили: 1

#9 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 6 748
  • Регистрация: 29 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 13:49

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Просмотр сообщенияSchwein сказал:

Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной.

Ну и что, раз вы потом планируете делать распознавание в Файнридере.
Тут скорей имеет бОльшее значение переплет книги - клеевой (дешевый), ниточный и т.д.
Вот, нашел у себя Детскую энциклопедию на 587 стр, сейчас попробую на сканере и фотиком сделать варианты.


#10 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 14:01

Den3
Да, распознавание будет. Я совсем не уверен, что сантиметр-полтора текста от корешка не уйдёт в «черную область», если использовать сканер


#11 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 6 748
  • Регистрация: 29 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 14:18

Вот, провел эксперимент. Фотик и сканер.
Прикрепленное изображение: йй.jpeg

Прикрепленное изображение: ййй.JPG
С фотика все буквы четкие, но надо решать как победить изгиб книги т.к. он не дает нормально распознать.
Со сканера всё ровное кроме корешка. Данный сканер не имеет большой глубины резкости (хреновый сканер, офисный). Где то в подвале валяется старый Юмакс, вот тот имел большую глубину резкости, но и там излом корешка будет мешать распознаванию.

К сожалению, нет у меня стекла на которое можно было бы положить книгу, а фотик снизу и сделать снимок.


Поблагодарили: 2 :

#12 Пользователь офлайн   top 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 1 613
  • Регистрация: 16 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 14:42

а если ручной сканер использовать?
примерно такой
https://aliexpress.r...earchweb201603_


#13 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 14:47

top
Область сканирования не зацепит часть текста у корешка, уже пробовал :)


#14 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 6 748
  • Регистрация: 29 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 14:50

Да, вариант со стеклом и освещением из окна (чтоб бликов не было), самое то.
Прикрепленное изображение: P1060704_2.JPG

Прикрепленное изображение: P1060706_2.JPG
Файнридер вполне сносно распознал. К сожалению, Вордовский файл тут не прицепишь. Вот он на Я-диске https://yadi.sk/i/G_EQvFCzJhTlSQ

Снято с рук, перпендикулярно книге (не всякий штатив умеет опускать голову вниз, придется как то городить сбоку чтоб лежал на чем то). Света из окна достаточно чтоб ничем больше не светить и он рассеянный. Стекло самое обычное грязное мебельное. После Файнридера все равно придется всё проверять.


Поблагодарили: 3 :

#15 Пользователь офлайн   CIBAS 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 1 746
  • Регистрация: 07 Июль 15
  • Сказали спасибо раз:
  • ГородСимферополь
  • Страна:  

Отправлено 17 Июль 2020 - 14:53

Когда-то давно сканировал книгу...

Суть метода - книга укладывается на угол (стекло), то есть она раскрыта на 90 градусов.
Используется, естественно, фотоаппарат, снимать можно хоть горизонтальную, хоть вертикальную часть.
Смысл - нет пространственных искажений у корешка толстых томов.


Поблагодарили: 3 :

#16 Пользователь офлайн   Schwein 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 805
  • Регистрация: 15 Сентябрь 10
  • Сказали спасибо раз:

Отправлено 17 Июль 2020 - 14:56

Буду думать... Спасибо всем за ценные советы :)


#17 Пользователь офлайн   Gennadyi 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 12 404
  • Регистрация: 17 Сентябрь 10
  • Сказали спасибо раз:
  • ГородСимферополь
  • Страна:  

Отправлено 17 Июль 2020 - 15:35

планетарный сканер - https://elarscan.ru/modelnyj-ryad/
их много разных !

Не любо - не слушай, а врать не мешай !
"Величайшей ошибкой было бы думать, " © В. И. ЛЕНИН ПСС том 34, стр. 242.
", было бы величайшей ошибкой думать," © В. И. ЛЕНИН ПСС том 42, стр. 74.
"поругаешь власть — попадаешь под закон об оскорблении, похвалишь власть — попадаешь под закон о фейковых новостях" © В. Матвиенко

#18 Пользователь офлайн   Инквизитор 

  • Vexilla regis prodeunt inferni
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 14 103
  • Регистрация: 20 Сентябрь 10
  • Сказали спасибо раз:
  • Страна:  

Отправлено 17 Июль 2020 - 15:51

Просмотр сообщенияDen3 сказал:

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Проще, но существенно дольше. На сотой странице от писка голова уже болит (я книгу на 500 страниц сканировал, да).


Кстати, если книга большая, имеет смысл пробежать отдельно четные и нечетные страницы - меньше возни с перекладыванием и резкой для распознавателя. Корешок опять же не изгибается, можно даже без стекла обойтись.

"Время разрухи загрязняет разум."

#19 Пользователь офлайн   Moloch 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 867
  • Регистрация: 03 Апрель 14
  • Сказали спасибо раз:
  • ГородБабруйск
  • Страна:  

Отправлено 17 Июль 2020 - 16:50

Просмотр сообщенияRumlin (17 Июль 2020 - 11:57) писал:

По идее свет падает под таким углом, что отражение не попадет в объектив.

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.

надо было срочно 400 документов в пдф загнать. оказалось проще подрезать на работе МФУ, которая потоком сканит. выходное качество с мобильных сканеров оказалось "ниачом"

пыщ-пыщ

#20 Пользователь офлайн   Зеленый 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 304
  • Регистрация: 06 Июнь 11
  • Сказали спасибо раз:
  • ГородБахчисарай
  • Страна:  

Отправлено 17 Июль 2020 - 18:16

Если память не врет, то в библиотеке Франко был специальный сканер для книг. Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку. Давно было, в прошлой стране.


Поделиться темой:


  • (2 Страниц)
  • +
  • 1
  • 2
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

1 человек читают эту тему
0 пользователей, 1 гостей, 0 скрытых пользователей