Neinsager Опубликовано 1 января, 2015 Жалоба Поделиться Опубликовано 1 января, 2015 Озадачили меня проблемой — есть диктофонные записи, нужно преобразовать их в текст.Вариантов, насколько я вижу, немного — есть два API, от Яндекса и от Гугла, и есть некоторое количество софтов, которые эти API используют. Софтов для винды, которые бы использовали Яндекс API, я не нашёл, и потому тестировал только гугловские наработки. Практика показала, что API довольно прилично распознают качественный звук, а вот с диктофонными записями беда — много шумов и искажений. СтОит ли пробовать как-то вычистить записи? Если стОит — то был бы рад ссылкам по теме, ибо в обработке звука мало чего понимаю... Или же из дерьма конфетку не сделать, и надо думать о использовании приличного микрофона при осуществлении записи? Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
arrpoSt1m Опубликовано 1 января, 2015 Жалоба Поделиться Опубликовано 1 января, 2015 СтОит ли пробовать как-то вычистить записи?Крапотливая и долгая работаприличного микрофона при осуществлении записи?даесть диктофонные записи, нужно преобразовать их в текст.с существующими могу помочь Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Neinsager Опубликовано 1 января, 2015 Автор Жалоба Поделиться Опубликовано 1 января, 2015 с существующими могу помочьПосадить человека на расшифровку и набор? :) Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Den3 Опубликовано 1 января, 2015 Жалоба Поделиться Опубликовано 1 января, 2015 СтОит ли пробовать как-то вычистить записи?Мне кажется для правильного распознавания нужна не разговорная речь и темп речи, а четко проговариваемая и лучше с одной интонацией, типа машинной (или как на кассетах по обучению языкам). Имхо проще слушать диктофон и одновременно проговаривать то что говорят членораздельно и последовательно нежели чистить звук, а потом по любому править ошибки от не точного распознавания.По софту не подскажу, не интересовался. Но на работе сотрудник как то хвастался\удивлялся что девочки-машинистки до сих пор не освоили распознавание речи, а у него получалось. Но он будет лишь после праздников что б спросить что и как... Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Neinsager Опубликовано 1 января, 2015 Автор Жалоба Поделиться Опубликовано 1 января, 2015 Den3Попробовал сейчас эту методику — качество распознавания, конечно, выше... но практического смысла для решения именно данной задачи в ней нет — человек, который обычно с записями этими работает, набирает очень быстро, потому смысл передиктовки пропадает. Вот для распознавания рукописей или очень плохих копий старых документов способ подходит, возьму на вооружение. Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Neinsager Опубликовано 1 января, 2015 Автор Жалоба Поделиться Опубликовано 1 января, 2015 В общем, насколько я вижу, пока прогресс в данной области не настолько заметен, чтобы в лоб решать поставленную задачу — требуется и дополнительное оборудование (хороший микрофон, например), и условия к самой речи (ну или дополнительные манипуляции, время на проведение которых практически лишает смысла использование данных технологий).Печаль :( Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
arrpoSt1m Опубликовано 1 января, 2015 Жалоба Поделиться Опубликовано 1 января, 2015 Печаль единственным выходом на сегодняшний день являетсяПосадить человека на расшифровку и набор? Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
trespa Опубликовано 2 января, 2015 Жалоба Поделиться Опубликовано 2 января, 2015 Юзаю на смарте клаву SWYPE+DRAGON. Там кроме набора движением, есть голосовой ввод (НЕ ГУГЛ)!!! Раньше "набирал" СМС только монотонным, небыстрым голосом. Только что, ради интереса попробовал усложнить ему/ей :) задачу: говорил быстро, специально не выделяя слова... Качество распознавания приятно удивило. Может покопать в сторону этой разработки? Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Rumlin Опубликовано 2 января, 2015 Жалоба Поделиться Опубликовано 2 января, 2015 человек обходится в 20$ за час обработанной записи. Если запись шумная, трудноразличимая , то дороже. Качество лучше чем у программного продукта. если цель найти программу для надиктовывания - лучше dragon под макось не видел. Цитата Я детей вообще то боюсь, милостивый мой государь, - шумливы, жестоки и себялюбивы, а коли дети правят державой? ©Юлиан Семёнов Ничего не делается к лучшему © Борис РаушенбахЛюди, люди — это самое главное. Люди дороже даже денег. © Ф.М. Достоевский Ссылка на комментарий Поделиться на другие сайты Поделиться
Neinsager Опубликовано 2 января, 2015 Автор Жалоба Поделиться Опубликовано 2 января, 2015 RumlinНе, надиктовывание реально практически не нужно. trespaПопробую виндовую версию, но не особо верю в успех. Цитата Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Присоединяйтесь к обсуждению
Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.
Примечание: Ваш пост будет проверен модератором, прежде чем станет видимым.