SDL Trados - разпознаване на текст в сканирани PDF документи.
Thread poster: etale
etale
etale
Local time: 20:19
Spanish to Bulgarian
+ ...
Mar 12, 2018

Напоследък ми изпращат доста сканирани PDF документи. Функцията на SDL Trados 2017 за четене на PDF файли всеки път ми показва грешка.
Как се справяте Вие с този проблем, колеги?


 
Pavel Tsvetkov
Pavel Tsvetkov  Identity Verified
Bulgaria
Local time: 21:19
Member (2008)
English to Bulgarian
+ ...

Moderator of this forum
. Mar 12, 2018

Здравейте, etale!

Подходящ софтуер за преработката на сканирани документи в текст е ABBYY Finereader. Има и много други, но този се справя добре със славянски езици вкл. български.

Поздрави,
Павел


 
Ekaterina Kroumova
Ekaterina Kroumova  Identity Verified
French to Bulgarian
+ ...
Не е най-доброто решение Mar 12, 2018

Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBY... See more
Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBYY PDF Transformer+, отлично се справя, но май от известно време предлагането ѝ е спряно.

При всички случаи, ако често Ви изпращат такива файлове, или искайте предварително да Ви ги извлекат в подходящ за текстообработване формат, или си набавете надежден софтуер. Ако нямате притеснения за поверителността, има прилични онлайн варианти.
Collapse


 
invguy
invguy  Identity Verified
Bulgaria
Local time: 21:19
English to Bulgarian
Още един глас за ABBYY Mar 12, 2018

Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична ... See more
Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична работа.

Вероятно няма някои функции за автоматизация, с които разполагат по-новите версии. Но аз и без това съм малко консерва и не обичам софтуер да решава вместо мен, без да ме пита – тъй че ценя въможностите на тази версия за ръчен контрол, макар че това със сигурност прави процеса по-бавен.
Collapse


 
Georgi Kovachev
Georgi Kovachev  Identity Verified
Bulgaria
Local time: 21:19
Member (2010)
English to Bulgarian
+ ...
Купете си софтуер и поискайте повишение на цената Mar 12, 2018

Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина щ�
... See more
Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина ще отделяте по-малко време за странична дейност. Аз лично ползвам PDF Transformer Pro 2.0, който е предишната версия на PDF Transformer+.

Бих искал да Ви обърна внимание на цената. Опитът ми от последните месеци показва, че получавам все по-малко документи в текстови формат – както е и при Вас, както и че агенциите не са склонни да отделят време и ресурс, за да се занимават с подготовка на документите за превод – разбирайте преобразуване в текстови формат и сравняване на резултата с оригиналния текст.
Затова преди време поисках от една от агенциите по-висока цена за сканирани документи или за такива в PDF формат, при които преобразуването в текстови формат е по-лошо, най-вече заради необходимото допълнително време за обработка (за друга давам цена за всеки текст, като уговорката ми е, че за сканирани файлове тя е по-висока по подразбиране). Не постигнах по-висока цена с първата агенция, но вече пестя време, като предавам само текст и не се занимавам да копирам и нагласявам изображенията от оригиналния файл – знаете, че техническите ръководства са пълни с такива.

Установявам обаче, че запитванията, свързани със сканирани/PDF файлове, ми отнемат все повече време, а не всички от тях биват потвърждавани. Решението, което ползвам от скоро, е да преобразувам в .txt формат (с PDF Transformer Pro 2.0), съвсем набързо да събера цели изречения, които са на отделни редове, да изтрия излишните интервали и да анализирам текста с преводаческата програма. Това става по-бързо в сравнение с преобразуване в doc(x) формат, тъй като няма колони, таблици, символи за край на реда, параграф или страница – поне такова усещане имам от последната седмица. Вярно е, че няма таблици, но за даване на първоначална информация за срока на изпълнение и стойността на превода върши работа.

Моля, ако някой колега има по-ефективно решение в тази връзка, да го сподели

Поздрави!
Георги

П. С. Не се притеснявайте да искате компенсация за повечето отделено време за странична дейност. Ще установите, че колкото по-често казвате „Не“ (на нахални предложения да работите повече за същото възнаграждение), толкова повече ще постигате една от Вашите цели – по-голямо заплащане за повече положен труд или същото заплащане, но без допълнителен труд
Collapse


 
etale
etale
Local time: 20:19
Spanish to Bulgarian
+ ...
TOPIC STARTER
Благодаря Mar 13, 2018

Ще опитам пробната версия на ABBYY FineReader и след това вероятно ще го купя.
Документите, които ми изпращат, в повечето случаи съдържат лични данни и затова онлайн конвертирането е изключено.
Поисках да ми ги изпращат в подходящ формат [както казвахме едно време: във вид удобен за логаритмуване], но любезно ми отказаха.
Благодаря за отзивчивостта, колеги.
Желая Ви приятен ден!


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

SDL Trados - разпознаване на текст в сканирани PDF документи.






TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »