Задачиcегодня задач в базе - 1452

Задача 1151. "Непонятные слова" все задачи

Код для вставки в блог


Код вставки в блог | Результат

Скопируйте готовый код используя комбинацию клавиш Ctrl+C.

С развитием интернета появилась необходимость перевода старых бумажных книг в электронный формат. Cлучается, что система не в состоянии распознать то или иное слово. Владельцы некоторых сайтов нашли способ, как «заставить» своих посетителей переводить непонятные для машины слова. Каким образом они это делают? 
Читать полностью
23.12.2013

Автор текста: 

С развитием интернета появилась необходимость перевода старых бумажных книг в электронный формат. Автоматизированная компьютерная система сканирует изображение печатной страницы и самостоятельно распознает буквы и слова. Но довольно часто случается, что система не в состоянии распознать то или иное слово, особенно если оно вышло из широкого употребления или является, например, профессиональным термином. Тогда «расшифровывать» изображение приходится «живому» человеку. Это очень затягивает процесс оцифровки книг. Но владельцы некоторых специализированных сайтов нашли способ, как «заставить» своих посетителей переводить непонятные для машины слова в удобоваримый вид. Каким образом они это делают? 

(Голосов: 0, Рейтинг: 0)
   


Добавить решение/комментарий:

Решения и комментарии:
  • sbm|22.01.2014|

    они на сайте создали конкурс - кто исправит большее количество ошибок, тот получит какой то приз итоги подбивались ежемесячно

  • Использовали ресурс - пользователей сайта. При скачивании контента пользователь должен подтвердить, что он не инфоробот. Для этого пользователь должен ввести какое-то ключевое слово. В качестве ключевого слова использовались нерасшифрованные слова.

  • Видел видео на ютубе про это: для подтверждения того, что посетитель человек нужно ввести два-три слова, одно или два из них известные (системе), а одно из скана книги, которое не удалось распознать, причем пользователь не знает об этом. Если известное(ые) слово(а) введено верно, то неизвестное помещается в базу вариантов, когда множество пользователей введут один вариант с большим перевесом, этот вариант распознавания ставится в соответствие к скану слова.