Симферопольский Форум: Распознавание речи и всё, что с этим связано - Симферопольский Форум

Перейти к содержимому

Внимание! Для всех новых пользователей введена премодерация сообщений и тем.
Страница 1 из 1
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

Распознавание речи и всё, что с этим связано

#1 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 429
  • Регистрация: 15 сентября 10

Отправлено 01 января 2015 - 19:34

Озадачили меня проблемой — есть диктофонные записи, нужно преобразовать их в текст.
Вариантов, насколько я вижу, немного — есть два API, от Яндекса и от Гугла, и есть некоторое количество софтов, которые эти API используют. Софтов для винды, которые бы использовали Яндекс API, я не нашёл, и потому тестировал только гугловские наработки. Практика показала, что API довольно прилично распознают качественный звук, а вот с диктофонными записями беда — много шумов и искажений. СтОит ли пробовать как-то вычистить записи? Если стОит — то был бы рад ссылкам по теме, ибо в обработке звука мало чего понимаю... Или же из дерьма конфетку не сделать, и надо думать о использовании приличного микрофона при осуществлении записи?


#2 Пользователь офлайн   arrpoSt1m 

  • Я не пью, я отмечаю
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 8 019
  • Регистрация: 17 сентября 10
  • ГородСимферополь
  • Страна:  

Отправлено 01 января 2015 - 19:37

Просмотр сообщенияSchwein сказал:

СтОит ли пробовать как-то вычистить записи?

Крапотливая и долгая работа

Просмотр сообщенияSchwein сказал:

приличного микрофона при осуществлении записи?

да

Просмотр сообщенияSchwein сказал:

есть диктофонные записи, нужно преобразовать их в текст.

с существующими могу помочь


#3 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 429
  • Регистрация: 15 сентября 10

Отправлено 01 января 2015 - 19:55

Просмотр сообщенияarrpoSt1m сказал:

с существующими могу помочь

Посадить человека на расшифровку и набор? :)


#4 Пользователь офлайн   Den3 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 7 294
  • Регистрация: 29 сентября 10
  • Страна:  

Отправлено 01 января 2015 - 19:56

Просмотр сообщенияSchwein сказал:

СтОит ли пробовать как-то вычистить записи?

Мне кажется для правильного распознавания нужна не разговорная речь и темп речи, а четко проговариваемая и лучше с одной интонацией, типа машинной (или как на кассетах по обучению языкам). Имхо проще слушать диктофон и одновременно проговаривать то что говорят членораздельно и последовательно нежели чистить звук, а потом по любому править ошибки от не точного распознавания.
По софту не подскажу, не интересовался. Но на работе сотрудник как то хвастался\удивлялся что девочки-машинистки до сих пор не освоили распознавание речи, а у него получалось. Но он будет лишь после праздников что б спросить что и как...


Поблагодарили: 1

#5 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 429
  • Регистрация: 15 сентября 10

Отправлено 01 января 2015 - 20:11

Den3
Попробовал сейчас эту методику — качество распознавания, конечно, выше... но практического смысла для решения именно данной задачи в ней нет — человек, который обычно с записями этими работает, набирает очень быстро, потому смысл передиктовки пропадает. Вот для распознавания рукописей или очень плохих копий старых документов способ подходит, возьму на вооружение.


#6 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 429
  • Регистрация: 15 сентября 10

Отправлено 01 января 2015 - 20:17

В общем, насколько я вижу, пока прогресс в данной области не настолько заметен, чтобы в лоб решать поставленную задачу — требуется и дополнительное оборудование (хороший микрофон, например), и условия к самой речи (ну или дополнительные манипуляции, время на проведение которых практически лишает смысла использование данных технологий).
Печаль :(


#7 Пользователь офлайн   arrpoSt1m 

  • Я не пью, я отмечаю
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 8 019
  • Регистрация: 17 сентября 10
  • ГородСимферополь
  • Страна:  

Отправлено 01 января 2015 - 20:20

Просмотр сообщенияSchwein сказал:

Печаль

единственным выходом на сегодняшний день является

Просмотр сообщенияSchwein сказал:

Посадить человека на расшифровку и набор?


#8 Пользователь офлайн   trespa 

  • Живу здесь
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Активный участник
  • Сообщений: 1 537
  • Регистрация: 29 декабря 10
  • ГородSimferopol

Отправлено 02 января 2015 - 13:30

Юзаю на смарте клаву SWYPE+DRAGON. Там кроме набора движением, есть голосовой ввод (НЕ ГУГЛ)!!! Раньше "набирал" СМС только монотонным, небыстрым голосом. Только что, ради интереса попробовал усложнить ему/ей :) задачу: говорил быстро, специально не выделяя слова... Качество распознавания приятно удивило. Может покопать в сторону этой разработки?


Поблагодарили: 1

#9 Пользователь офлайн   Rumlin 

  • Добрый волшебник
  • PipPipPipPipPip
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Старая гвардия
  • Сообщений: 42 159
  • Регистрация: 16 сентября 10
  • ГородHavana
  • Страна:  

Отправлено 02 января 2015 - 15:16

человек обходится в 20$ за час обработанной записи. Если запись шумная, трудноразличимая , то дороже. Качество лучше чем у программного продукта.

если цель найти программу для надиктовывания - лучше dragon под макось не видел.


Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов
Ничего не делается к лучшему © Борис Раушенбах
Люди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский

#10 Пользователь офлайн   Neinsager 

  • –· ·– ···· ··– ·––– ··––··
  • Перейти к галерее
  • Вставить ник
  • Цитировать
  • Раскрыть информацию
  • Группа: Модераторы
  • Сообщений: 21 429
  • Регистрация: 15 сентября 10

Отправлено 02 января 2015 - 21:02

Rumlin
Не, надиктовывание реально практически не нужно.

trespa
Попробую виндовую версию, но не особо верю в успех.


Поделиться темой:


Страница 1 из 1
  • Вы не можете создать новую тему
  • Вы не можете ответить в тему

1 человек читают эту тему
0 пользователей, 1 гостей, 0 скрытых пользователей