Симферопольский Форум: Как оцифровать... книгу? - Симферопольский Форум

Перейти к содержимому

Внимание! Для всех новых пользователей введена премодерация сообщений и тем.
  • (2 Страниц)
  • +
  • 1
  • 2
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

Как оцифровать... книгу?

#1 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 10:59

Имеется некоторое количество библиографических редкостей, которыми хотелось бы поделиться.
Проблема, собственно, в том, как произвести оцифровку (сканирование и распознавание)? Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной. Разбирать книгу на «тетрадки» тоже нельзя — новую такую купить просто негде.
В голову пришла мысль — может быть использовать фотоаппарат для этого? Есть Nikon D3200 с китовой оптикой. А что еще нужно? Что-то для правильного освещения? Специальный штатив для камеры? Как вообще процесс организовать?

Может кто-то уже делал подобное? :)
Буду раз советам.


#2 Пользователь офлайн   FreeLSD 

  • Живу здесь
  • PipPipPipPipPip
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 12 548
  • Регистрация: 16 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 11:05

Мне кажется, любого штатива будет достаточно. В идеале кольцевая вспышка, как для макро, но тоже, наверное, достаточно любые доступные источники света выставить правильно. Это за несколько кадров можно настроить. Дистанционный спуск или с задержкой - чтобы нажатие на кнопку не влияло на камеру. А вот держатель для книги нужен хороший, чтобы листы правильно фиксировал и книгу не портил при этом.

Или что-то случилось, или одно из двух.

Поблагодарили: 1

#3 Пользователь офлайн   Rumlin 

  • Добрый волшебник
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 42 268
  • Регистрация: 16 сентября 10
  • ГородHavana
  • Страна:  

Отправлено 17 июля 2020 - 11:14

На хабре была статья, по-моему в 2019-м о сканировании книг. (В 2018-м https://habr.com/ru/post/425113/ , 2016-м https://habr.com/ru/post/389035/ https://habr.com/ru/post/393473/ )
Я бы поставил бы телефон с ПО для сканирования книг - они автоматически выравнивают и исправляют перспективные искажения.
Как дополнительный полезный инструмент - необходим деревянный и стеклянный уголок. В деревянный книга кладется, а стеклянным прижимается разворот.
Изображение


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов
Ничего не делается к лучшему © Борис Раушенбах
Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

Поблагодарили: 2 :

#4 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 11:24

А стекло бликовать не будет?


#5 Пользователь офлайн   Moloch 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 875
  • Регистрация: 03 апреля 14
  • ГородБабруйск
  • Страна:  

Отправлено 17 июля 2020 - 11:29

Просмотр сообщенияRumlin (17 июля 2020 - 11:14) писал:


Я бы поставил бы телефон с ПО для сканирования книг


выходное качество обнять и плакать, такое ощущение, что снималось всё на камеру в 0.3 MPx

пыщ-пыщ

#6 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 11:47

Ну в любом случае придется как-то автоматизировать процесс корректировки искажений перспективы при такой съемке...


#7 Пользователь офлайн   Rumlin 

  • Добрый волшебник
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 42 268
  • Регистрация: 16 сентября 10
  • ГородHavana
  • Страна:  

Отправлено 17 июля 2020 - 11:57

Просмотр сообщенияSchwein сказал:

А стекло бликовать не будет?
По идее свет падает под таким углом, что отражение не попадет в объектив.

Просмотр сообщенияMoloch сказал:

выходное качество обнять и плакат
Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов
Ничего не делается к лучшему © Борис Раушенбах
Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

#8 Пользователь офлайн   Инквизитор 

  • Vexilla regis prodeunt inferni
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 162
  • Регистрация: 20 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 12:59

Можно перевернуть: Фотик на пол, лампы рядом сбоку, так, чтобы блики в объектив не попадали. Над всем этим - стекло на двух табуретках. стикерами отметить уголки для выравнивания. сооружаешь все так, чтобы был небольшой запас на коррекцию перекосов. Развернутую книгу кладешь сверху на стекло разворотом вниз, как на ксерокс. Фотик (если умееет) подключаешь к компьютеру и клацаешь оттуда, выгребая снимки сразу на винт. Ну или пультом жмакаешь.


если со штатива - Швейн, обращайся, могу дать поюзать большой и устойчивый штатив.


В любом случае освещение либо ставишь так, чтобы не бликовало даже рикошетом (сильно сбоку несколько ламп), либо с широкими матовыми рассеивателями (Проволока плюс наволочка =) )

"Конец России хотели бы увидеть многие, но пока его удается только подержать за щекой…!" (с)

Изображение

Поблагодарили: 1

#9 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 7 297
  • Регистрация: 29 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 13:49

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Просмотр сообщенияSchwein сказал:

Книги толстые, около 700 страниц в каждой, потому при сканировании на планшетном сканере та часть, что к переплёту, будет чёрной.

Ну и что, раз вы потом планируете делать распознавание в Файнридере.
Тут скорей имеет бОльшее значение переплет книги - клеевой (дешевый), ниточный и т.д.
Вот, нашел у себя Детскую энциклопедию на 587 стр, сейчас попробую на сканере и фотиком сделать варианты.


#10 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 14:01

Den3
Да, распознавание будет. Я совсем не уверен, что сантиметр-полтора текста от корешка не уйдёт в «черную область», если использовать сканер


#11 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 7 297
  • Регистрация: 29 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 14:18

Вот, провел эксперимент. Фотик и сканер.
Прикрепленное изображение: йй.jpeg

Прикрепленное изображение: ййй.JPG
С фотика все буквы четкие, но надо решать как победить изгиб книги т.к. он не дает нормально распознать.
Со сканера всё ровное кроме корешка. Данный сканер не имеет большой глубины резкости (хреновый сканер, офисный). Где то в подвале валяется старый Юмакс, вот тот имел большую глубину резкости, но и там излом корешка будет мешать распознаванию.

К сожалению, нет у меня стекла на которое можно было бы положить книгу, а фотик снизу и сделать снимок.


Поблагодарили: 2 :

#12 Пользователь офлайн   top 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 1 735
  • Регистрация: 16 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 14:42

а если ручной сканер использовать?
примерно такой
https://aliexpress.r...earchweb201603_


#13 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 14:47

top
Область сканирования не зацепит часть текста у корешка, уже пробовал :)


#14 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 7 297
  • Регистрация: 29 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 14:50

Да, вариант со стеклом и освещением из окна (чтоб бликов не было), самое то.
Прикрепленное изображение: P1060704_2.JPG

Прикрепленное изображение: P1060706_2.JPG
Файнридер вполне сносно распознал. К сожалению, Вордовский файл тут не прицепишь. Вот он на Я-диске https://yadi.sk/i/G_EQvFCzJhTlSQ

Снято с рук, перпендикулярно книге (не всякий штатив умеет опускать голову вниз, придется как то городить сбоку чтоб лежал на чем то). Света из окна достаточно чтоб ничем больше не светить и он рассеянный. Стекло самое обычное грязное мебельное. После Файнридера все равно придется всё проверять.


Поблагодарили: 3 :

#15 Пользователь офлайн   CIBAS 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 4 119
  • Регистрация: 07 июля 15
  • ГородСимферополь
  • Страна:  

Отправлено 17 июля 2020 - 14:53

Когда-то давно сканировал книгу...

Суть метода - книга укладывается на угол (стекло), то есть она раскрыта на 90 градусов.
Используется, естественно, фотоаппарат, снимать можно хоть горизонтальную, хоть вертикальную часть.
Смысл - нет пространственных искажений у корешка толстых томов.


Поблагодарили: 4 :

#16 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 484
  • Регистрация: 15 сентября 10

Отправлено 17 июля 2020 - 14:56

Буду думать... Спасибо всем за ценные советы :)


#17 Пользователь офлайн   Gennadyi 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 20 343
  • Регистрация: 17 сентября 10
  • ГородСимферополь
  • Страна:  

Отправлено 17 июля 2020 - 15:35

планетарный сканер - https://elarscan.ru/modelnyj-ryad/
их много разных !

Не любо - не слушай, а врать не мешай !
"Величайшей ошибкой было бы думать, " © В. И. ЛЕНИН ПСС том 34, стр. 244.
", было бы величайшей ошибкой думать," © В. И. ЛЕНИН ПСС том 42, стр. 74.
"поругаешь власть — попадаешь под закон об оскорблении, похвалишь власть — попадаешь под закон о фейковых новостях" © В. Матвиенко

#18 Пользователь офлайн   Инквизитор 

  • Vexilla regis prodeunt inferni
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 18 162
  • Регистрация: 20 сентября 10
  • Страна:  

Отправлено 17 июля 2020 - 15:51

Просмотр сообщенияDen3 сказал:

Имхо, конечно, но проще сканер чем фотик. Но такой, у которого прижимная крышка умеет подниматься.

Проще, но существенно дольше. На сотой странице от писка голова уже болит (я книгу на 500 страниц сканировал, да).


Кстати, если книга большая, имеет смысл пробежать отдельно четные и нечетные страницы - меньше возни с перекладыванием и резкой для распознавателя. Корешок опять же не изгибается, можно даже без стекла обойтись.

"Конец России хотели бы увидеть многие, но пока его удается только подержать за щекой…!" (с)

Изображение

#19 Пользователь офлайн   Moloch 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 875
  • Регистрация: 03 апреля 14
  • ГородБабруйск
  • Страна:  

Отправлено 17 июля 2020 - 16:50

Просмотр сообщенияRumlin (17 июля 2020 - 11:57) писал:

По идее свет падает под таким углом, что отражение не попадет в объектив.

Буквы нормально в pdf выглядят. С картинками возможно что-то будет не так как при фотографировании, но и при сканировании можно ужать так, что на картинках будет муть. Если не предполагается распознавание в Finereader, то я бы делал бы телефоном.

надо было срочно 400 документов в пдф загнать. оказалось проще подрезать на работе МФУ, которая потоком сканит. выходное качество с мобильных сканеров оказалось "ниачом"

пыщ-пыщ

#20 Пользователь офлайн   Зеленый 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 437
  • Регистрация: 06 июня 11
  • ГородБахчисарай
  • Страна:  

Отправлено 17 июля 2020 - 18:16

Если память не врет, то в библиотеке Франко был специальный сканер для книг. Они им свои фонды оцифровывали и у них можно было заказать оцифровку книг за денежку. Давно было, в прошлой стране.


Поделиться темой:


  • (2 Страниц)
  • +
  • 1
  • 2
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

1 человек читают эту тему
0 пользователей, 1 гостей, 0 скрытых пользователей