Швидкий переклад тексту з фото на Android, iOC, Windows Phone. Як перевести текст з картинки - програма. Розпізнавання тексту

Вітаю вас, шановні читачі блогу сайт! Напевно, багато хто з вас зіштовхувалися з необхідністю розпізнати текст   з якого-небудь відсканованого документа, книги, фотографії і т.д. Як правило, для великого обсягу розпізнавання тексту з документів використовують спеціальні і досить дорогі програми (OCR). Але для того, щоб розпізнати невелику кількість сторінок тексту, зовсім необов'язково купувати дороге додаток. Є багатьом відома безкоштовна програма розпізнавання тексту   , Про яку я вже писав, - CuneiForm. Вона проста, зручна, але її треба встановлювати на комп'ютер.

А якщо потреба в розпізнаванні текстів з документів виникає не так часто, то, напевно, буде логічніше скористатися спеціальним онлайн сервісом, який розпізнає текст безкоштовно   або за символічну суму. Таких сервісів в інтернеті можна знайти кілька десятків. І, у кожного сервісу, як правило, є свої плюси і мінуси, які може визначити тільки сам користувач.

Для читачів свого блогу я вирішив зробити невелику добірку онлайн сервісів, на яких можна розпізнавати тексти з документів   різних форматів.

Вибір зробив за наступними критеріями:

  Послуга розпізнання тексту повинна бути безкоштовною.

  Кількість розпізнаються сторінок тексту повинно бути необмеженим, а якщо і є незначні обмеження, то не зв'язані з демонстрацією якості розпізнавання документа.

  Сервіс повинен підтримувати розпізнавання російського тексту.

який сервіс розпізнає тексти краще, А який гірше, вирішувати вже вам, шановні читачі. Адже результат, отриманий після розпізнавання текстів, залежить від багатьох чинників. Це може залежати від розміру початкового документа (сторінки, фотографії, малюнка, що сканує тексту і т.д.), формату і, звичайно ж, якості розпізнається документа.

Отже, у мене вийшло шість сервісів, на яких можна займатися розпізнаванням текстів   онлайн без будь-яких особливих обмежень.

На перше місце я поставив сервіс Google   Диск, де можна зробити розпізнавання тексту онлайн, Лише через те, що цей ресурс російською мовою. Всі інші «буржуйські» сервіси англійською мовою.

Сім сервісів де можна розпізнати текст онлайн безкоштовно.

  Google Диск

Тут потрібна реєстрація, якщо немає свого аккаунта в Google. Але, якщо ви колись вирішили створити свій блог   на blogspot, то аккаунт у вас вже є. Можна розпізнавати зображення PNG, JPG, і GIF і файли PDF розміром не більше 2 МБ. У файлах PDF розпізнаються тільки перші десять сторінок. Розпізнані документи можна зберігати в форматах DOC, TXT, PDF, PRT та ODT.

  OCR Convert.

Безкоштовний онлайн сервіс з розпізнавання текстів, що не вимагає реєстрації. Підтримує формати PDF, GIF, BMP і JPEG. Розпізнавши текст, зберігає у вигляді URL посилання з розширенням TXT, який можна скопіювати і вставити в потрібний вам файл. Дозволяє завантажувати одночасно п'ять документів обсягом до 5 МБ.

i2OCR.

На цьому онлайн сервісі потрібна реєстрація. Підтримує документи для розпізнавання текстів в форматі TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM. Можна завантажувати документ до 10 Мб без будь-яких обмежень. Отриманий результат розпізнавання можна скачати на комп'ютер в розширенні DOC.

  NewOCR.

На мій погляд, найсерйозніший і відмінний онлайн сервіс, який не потребує реєстрації. Без обмежень можна безкоштовно розпізнавати практично будь-які графічні файли. Завантажувати відразу по кілька сторінок тексту в форматі TIFF, PDF і DjVu. Може розпізнавати тексти з зображень в файлах DOC, DOCX, RTF і ODT. Виділяти і розгортати необхідну область тексту сторінки для розпізнавання. Підтримує 58 мов і може зробити переклад тексту за допомогою Google перекладача онлайн   . Зберегти отримані результати розпізнавання можна в форматах TXT, DOC, ODT, RTF, PDF, HTML.

OnlineOcr.

Дозволяє без реєстрації і безкоштовно провести розпізнавання тексту з 15 зображень за одну годину з максимальним розмірів 4 МБ. Ви можете отримати текст з файлів формату JPG, JPEG, BMP, TIFF, GIF і зберегти на свій комп'ютер отриманий результат у вигляді документів з розширенням MS Word (DOC), MS Excel (XLS) або в текстовому форматі TXT. Але для цього доведеться щоразу вводити капчу. Підтримує для розпізнавання 32-ма мовами.

FreeOcr.

Онлайн сервіс для безкоштовного розпізнавання тексту, на якому не потрібна реєстрація. Але для отримання результату потрібно буде вводити капчу. Розпізнає по одній сторінці файли в форматі PDF і зображення JPG, GIF, TIFF або BMP. Є обмеження на розпізнавання не більше 10 документів на годину і розмір зображення не повинен перевищувати 5000 пікселів і обсяг 2 МБ. Розпізнаний текст можна скопіювати і вставити в документ потрібного вам формату.

OCRonline.

При розпізнаванні текстів на цьому онлайн сервісі рекомендується, щоб файли зображень були високої якості у форматі JPG (хоча приймає до розпізнавання і інші формати). Можна розпізнати тільки п'ять сторінок тексту в тиждень, і зберегти на комп'ютері в форматі DOC, PDF, RTF і TXT. Додаткові сторінки розпізнає тільки за «буржуйські піастри» і обов'язково потрібно зареєструватися.

Сподіваюся, що ці онлайн сервіси   розпізнавання тексту   кому-то зможуть полегшити трудомісткий процес набору текстів вручну. Так чи інакше, в цих сервісах є користь. А який з них краще або гірше, кожен визначить сам для себе.

Буду чекати ваших відгуків. А якщо кому з читачів сподобалася ця добірка сервісів для розпізнавання текстів, буду дуже вдячний тим, хто поділиться посиланням на цю сторінку зі своїми друзями. І буде вам і вашим друзям УДАЧА!

На завершення цієї статті хочу побажати всім благополуччя і успіхів.

Поділися з другом:

Вітаю вас, дорогі читачі блогу. Сьогодні я хочу розповісти вам про деякі сервісах, які давно у мене лежать в закладках. Йтиметься про сервіси розпізнавання тексту онлайн.

Напевно, у кожного був випадок, коли ви хотіли переписати якийсь текст з картинки або PDF файлу. Це могли бути якісь документи або просто красива цитата. У мене таких випадків було чимало і мене завжди виручали сервіси розпізнавання тексту. Звичайно, існують і програми для цієї мети, але я віддаю перевагу такі прості завдання робити онлайн.

Нижче ви можете побачити перелік сервісів, завдяки яким розпізнати текст з зображення простіше простого. Всі сервіси абсолютно безкоштовні і не вимагають реєстрації.

Принцип сервісів досить простий. Ви завантажуєте зображення, що містить текст, сервіс його обробляє і видає вам готовий текст, позбавляючи вас від його переписування. Якість розпізнавання тексту з зображення безпосередньо залежить від якості самого зображення.

Де можна розпізнати текст з PDF файлу, картинки або фотографії безкоштовно?

Отже, ось список сервісів:

www.newocr.com   - дозволяє розпізнати текст безкоштовно з зображень таких форматів як: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Сервіс підтримує безліч мов. Після розпізнання тексту з картинки, його можна скопіювати і вставити в свій документ. www.onlineocr.net   - аналогічний попередньому сервіс, з тією лише відмінністю, що тут розпізнаний текст можна скачати в форматах Microsoft Word   (Docx), Microsoft Exel (xlsx), Text Plain (txt). www.free-ocr.com - сервіс, що підтримує формати jpg, png, bmp, pdf, jpeg, tiff, tif і gif. Мов розпізнавання трохи менше ніж в попередніх сервісах, але теж чимало. Завантажити розпізнаний тест можна в txt форматі. www.i2ocr.com   - сервіс, що підтримує більше 60 мов. Крім основної функції розпізнавання тексту з зображень, тут є такі інструменти як:
  • Конвертація web-сторінки в PDF;
  • Перетворення web-сторінки в зображення (скріншот);
  • Генератор кнопок CSS3;
  • Міжнародні клавіатури;
  • Перетворювач формату зображень;

Якість вилучення тексту з зображень

Особливої ​​різниці в якості розпізнавання тексту на зображеннях між сервісами я не помітив, тому як приклад покажу лише перший сервіс.

Для прикладу я взяв кілька зображень різного розміру і якості зображеного тексту.

Зображення 1 (790 X 588 px)


Зображення 2 (793 X 1024 px)

Зображення 3 (600 X 350 px)


І ось результат самого тексту, який сервіс розпізнав на зображенні.

Результат 1 зображення:

Йшов 25 рік без
  власної яхти і будиночка
  на березі океану, думка про
  продажу нирки перестає
  здаватися божевільною.

У першому зображенні текст розпізнаний ідеально і взагалі без помилок.

Результат 2 зображення:

Меню У новорічну ніч
  ЯТріветственний коктейль
  (Шампанське радянське) 150 гр.
  Солона квашені, домашні. 60/1 гр.
  Грибочки з льоху.
  Яссорті аз маранованньск грибів. 64,5 гр.
  ч М'ясне Яссорта (ростбіф, мова буякенана) 85 гр.
  Оселедець з картоплею і цибулею червоним. 100 гр.
  Лосось камчатський з травами дикими 58,5 гр.
  Оселедчик під шубкою. 200 гр.
  Холодець, з м'ясом. 182 гр.
  Олів'є м'ясної 150 гр.
  Салат з курячою грудкою а грібочкама 150 гр.
  фруктова ваза
  (Виноград, груша, банани, яблуко, апельсин, кави) 375 гр.
  Сігбная кошик 85 гр.
  Кулеб'яка з лососем і судаком або 212 гр.
  Товядана зі сметаною і сиром картопляним
  гратаном а соусом червоне вино 247 гр.
  Запечені груші з червоним вином,
  морозивом і волоськими горіхами 142 гр.
  напої
  Шампанське (Російське полсле. 750 гр.
  7 (Горілка Лунтика 500 гр.
  (Вано Червоне Ундурага сухий, 750 гр.
  Фано * Біле (Ундурага сук. 750 гр.
  $ Ода з газом 600 гр.
  Фода без газу 600 гр. ., №3
  3 \\. , ',: Морс (промисловий) 1000 грам. »?`
  Сік / '! Пельсан (2л.) 2000 гр.

Тут видно присутність помилок. Це пов'язано з особливостями шрифту і контрастом тексту на основному фоні.

Результат 3 зображення:

Щоб живильні маски віддали вашій шкірі
  есь свій корисний арсенал, важливо
  7 олнять їх правильно. Ось моменти,
  Перші потрібно враховувати при
Ь; _ Ьеоваііі поживних масок для обличчя.
  Йтательние маски не можна х
  поранити, вони
  "Тотова безпосередньо перед
  Чоцедурой
  е_ перед застосуванням живильної маски
  [Гдліцо необхідно очистити скрабом і злегка
  кість-рить
  особі поживна маска тримається 20
  міну''после чого змивається теплою водою
  в тім'яних години після використання
  живильної маски на вулицю бажано не
  ьд'виходіть
  стота застосування поживних масок для
  і особи - 2-3 в тиждень
  Використовуйте принцип - два тижні робите

У третьому прикладі ліва частина стовпчика имееет погану контрастність, тому деякі правила слова взагалі не розпізнані.

На основі цих трьох прикладів, можна зробити простий висновок - чим краще і виразніше видно текст на зображенні, тим якісніше буде розпізнавання тексту. Багато що так само залежить від шрифту тексту. Якщо шрифт простий, то його сервіс прочитає без праці, ну а чим складніше шрифт, тим більше буде помилок при розпізнаванні тексту.

Онлайн розпізнавання тексту - це процедура вилучення символів з відсканованого документа або зображення за допомогою веб-програм. Розпізнавання слів дозволяє користувачеві суттєво зекономити час, адже їх не потрібно друкувати самостійно.

Сьогодні за допомогою оптичної технології розпізнавання тексту OCR масово конвертується величезна кількість відсканованих книг журналів, які потім можна читати на комп'ютері.

Оптичне розпізнавання стало популярним, адже після процедури визначення символів, текст можна не тільки прочитати, але й перевести за допомогою автоматичного перекладача, внести правки і форматувати його, застосовуючи різні стилі.

На жаль, дана технологія не може розпізнати інформацію з зі стовідсотковою точністю, тому після завершення обробки файлу проводиться порівняння двох вихідних документів (якщо форматується великий документ або книга) і коректор вносить правки в отриманий текст.

1. Онлайн-словник для розпізнавання тексту ABBYY

2. Сервіс Online-Ocr

Даний сервіс дозволяє без реєстрації створити текстовий документ   з відсканованого файлу або з самої звичайної картинки. Даний сервіс був першим, хто використав технологію оптичного розпізнавання машинного тексту.

Наведемо приклад розпізнавання з ПДФ в Ворд:

  • Зайдіть на сайт сервісу: http://www.onlineocr.net/
  • Натисніть на клавішу «вибрати файл» і знайдіть на своєму комп'ютері необхідний ПДФ документ, з якого буде визначено текст. Максимальний розмір вхідного документа дорівнює п'яти мегабайтам;


  • Виберіть мову вхідного документа і формат кінцевого файлу із запропонованого списку підтримуваних форматів. Натисніть кнопку «Конвертувати»;

Процес конвертації займає максимум 5 хвилин, даний показник залежить від розміру вхідного файлу, від його кодування і складності візуального оформлення.

Не підлягає сумніву той факт, що іноді доводиться працювати з документами, що містять графічні зображення з якимось текстом на іноземній мові, який підлягає перекладу. Про те, як перевести текст з картинки або перетворити його в легкий для читання формат, зараз і піде мова. Слід врахувати, що процедура ця включає кілька основних етапів, на які потрібно звернути особливу увагу.

Як перевести текст з картинки: варіанти дій

Почнемо з того, що будь-яка програма спочатку повинна розпізнати текст в графічному форматі, після чого визначити мову, на якому він написаний, і, нарешті, перевести. Найголовніша проблема, з якою стикається більшість користувачів, полягає навіть не в розпізнаванні тексту або мови, а в тому, що більшість програм-перекладачів недостатньо ефективні в плані перекладу. По суті, це так званий машинний переклад, який багатьма не вітається, оскільки може містити помилки, пов'язані з морфологією самої мови, використовуваного спочатку.

Проте, якщо спробувати, наприклад, перевести англійський текст з картинки, порядок дій може бути наступним:

  • перетворення графіки в текстовий формат;
  • розпізнавання мови (необов'язково);
  • редагування оригінального тексту (бажано, але не обов'язково);
  • переклад.

Розпізнавання тексту за допомогою ABBYY FineReader

На першій стадії, коли у користувача є зображення з текстом іноземною мовою, його слід перевести в звичайний текстовий формат. Найкраще для цього підходить програмний пакет ABBYY FineReader, що вважається лідером у своїй галузі.


Розпізнавання тексту виробляється досить просто. У самій програмі потрібно відкрити шуканий графічний файл (або просто перетягнути його в поле докладання), потім слід натиснути кнопку розпізнавання і дочекатися завершення процесу При бажанні можна встановити мову вихідного документа (якщо їх декілька, є можливість завдання такого параметра, як, наприклад, російський + англійська).

експорт


Коли текст буде розпізнано, його можна скопіювати для подальшої вставки   в будь-який текстовий редактор або перекладач, але є можливість швидкого збереження в будь-який інший формат. Для зручності використання краще вибрати формат DOCX, який для MS Word є основним.

Вставка фрагмента в текстові редактори

Тепер текст потрібно вставити в редактор. У разі копіювання виділеного тексту або фрагмента в FineReader в редактор Word вставка   виробляється з буфера обміну відповідною командою з меню або сполучення клавіш Ctrl + V (це всі знають). Якщо ж початковий текст був збережений у вигляді файлу, його потрібно просто відкрити, використовуючи для цього команди меню або звичайний подвійний клік на документі.


Тепер найголовніша проблема - як з картинки перевести текст в Word? На жаль, ніяк. Даний просто не призначений для здійснення переказів. Але вихід є. Програма дозволяє встановлювати в своє середовище спеціальні надбудови ( «Рута», «Плай» і т. Д.). Після інсталяції в самому редакторі з'являється додатковий розділ на головній панелі і кнопка для швидкого доступу   до операції переказу. Досить виділити потрібний фрагмент і активувати переклад.

Як перевести текст з картинки в перекладача?

Досить непоганим методом перекладу є використання спеціалізованих програм або онлайн-сервісів. Одним з найпотужніших можна назвати сервіс translate.ru або аналогічну програму-перекладач PROMPT, яка встановлюється на комп'ютер. У будь-якому випадку в перекладач потрібно вставити розпізнаний текст або фрагмент, вказати напрямок перекладу і натиснути кнопку старту. Залежно від обсягу переклад може зайняти деякий час. Правда, онлайн-перекладач має обмеження за кількістю знаків, які можна вставити в основне поле для вихідного тексту. До того ж це - система машинного перекладу. Але в більшості випадків переклад здійснюється не за окремими словами, а цілими фразами або пропозиціям з урахуванням специфіки їх побудови і навіть ідіоматичних виразів.


Можна, звичайно, звернутися і до ресурсів, де подібними операціями займаються «живі» перекладачі, але, як правило, всі вони платні, та й часу переклад, виходячи з обсягу і складності тексту, може зайняти досить багато. Зате в програмах можна зробити, так би мовити, чорновий переклад, а за умови володіння якоюсь мовою зробити чистове редагування самому.

Використання програми Screen Translator

А ось перед нами програма, яка з картинки переводить в текст вихідний матеріал, причому з однієї мови на іншу швидко і впевнено без всяких перетворень, які були описані вище. Справа в тому, що в ній вже є вбудовані движки розпізнавання тексту (Tesseract) і перекладу (Google Translate). Як перевести текст з картинки з її допомогою? Дуже просто! Для захоплення текстового фрагмента використовується поєднання клавіш Ctrl + Alt + Z, потім при затиснутою ліву кнопку миші виділяється цікавить користувача фрагмент, і через деякий час з'являються результати - вікно з розпізнаним текстом і нижче віконце з перекладом.

Нюанси розпізнавання і перекладу

Як перевести текст з картинки, вже трохи зрозуміло. Тепер кілька слів про додаткові дії на всіх етапах. Для отримання якісного перекладу бажано відразу ж відредагувати розпізнаний текстовий фрагмент (виправити граматично помилки, прибрати зайві прогалини або здійснити форматування). Надалі це спростить роботу з додатком-перекладачеві, оскільки ті ж прогалини деякі програми можуть сприймати як кінець пропозиції.


Машинний переклад рекомендується використовувати виключно як чернетка, оскільки тексти специфічної спрямованості (техніка, фармацевтика і т. Д.) Не завжди можуть бути переведені коректно зважаючи на наявність в них безлічі термінів, які в базі даних онлайн-ресурсу або програми просто відсутні. Але в тому ж сервісі translate.ru або аналогічної стаціонарній програмі можна спочатку вказати область використання вихідного тексту (комп'ютери, техніка, медицина і т. Д.). Це спростить перекладачеві завдання ще більше.

висновки

Ось, власне і все, що стосується перекладу текстів з картинок. Що використовувати? Здається, найкраще спочатку зробити розпізнавання, потім зробити редагування, а потім - переклад в програмі. Screen Translator показує непогані результати, але за великим рахунком жодна з нині створених програм не може перевести текст з однієї мови на іншу в повній мірі коректно. Пов'язано це тільки з тим, що будь-яка мова має свої морфологічні особливості.

Однак зараз уточнимо область пошуку і розглянемо тільки фото перекладачі - додатки, які дозволяють тобі переводити те, що знято на камеру, тобто вміють розпізнавати текст і більш менш адекватно відтворювати його на твоєму власною мовою.

1. Перекладач Google

Так, фірмовий перекладач Google в минулому році. Підтримуючи більше 50 мов, для роботи без інтернет-підключення необхідно додатково з качати мовні пакети для кожної мови.

2. Lingvo Dictionaries

Російська розробка ABBYY пропонує більше 50 базових словників для 30 мов. Має не тільки функцію ФотоПеревода, але і допомагає в заучуванні іноземних слів, пропонує вправи, пошук перекладеного слова в Мережі і багато інших цікавих функцій. Працює автономно. Але, зате, платно.

3. ABBYY TextGrabber + Translator

Ще один додаток ABBYY, заточене вже прямо на переклад фотографій. Сфотографуй цікавить тебе фрагмент, після чого розпізнаний текст можна відразу ж відредагувати, перевести, відправити e-mail або SMS. Для розпізнавання тексту інтернет-з'єднання не потрібно, розпізнавання проводиться прямо на мобільному пристрої, Однак для перекладу вимагається інтернет-з'єднання.




4. Translator

Ще одне фірмовий додаток - Translator від Bing для Windows Phone. Він дозволяє переводити голос, сканувати і перекладати текст, завантажувати словники на смартфон і працювати без зв'язку з Мережею. Також перекладач пропонує сервіс Word   of the Day, який показує одне слово для запам'ятовування на стартовому екрані.

5. iSignTranslate

iSignTranslate дозволяє бачити вивіски, таблички, знаки на твоїй мові. Не потрібно нічого натискати, виділяти, фотографувати, просто наведи камеру свого телефону на текст і додаток переведе його автоматично. Для перекладу потрібне підключення до інтернету.