Pages in topic:   [1 2] >
Работа с терминологическими базами кошек: как бороться с падежами
Thread poster: Nikita Kobrin
Nikita Kobrin
Nikita Kobrin  Identity Verified
Lithuania
Local time: 09:15
Member (2010)
English to Russian
+ ...
Jul 22, 2012

Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166

Чтобы не отклоняться там от темы, решил создать новую.

Sergei Tumanov wrote:

Nikita Kobrin wrote:

Sergei Tumanov wrote:

Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже.

Надеюсь, это шутка такая? Тут следует улыбнуться?

Nikita Kobrin


Это не шутка.

Мне такой вариант работы с терминами нравится.


Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее.

Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так:


English:

browser helper object

Russian:

вспомогательный объект браузера


Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом:


English:

browser helper object

Russian:

вспомогательный объект браузера
вспомогательного объекта браузера
вспомогательному объекту браузера
вспомогательным объектом браузера
вспомогательном объекте браузера


Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет:

1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

2) Как будут выглядеть ваши базы?

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?


На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка.

Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги?

Nikita Kobrin


 
Sergey Inaekyan
Sergey Inaekyan
Local time: 09:15
English to Russian
+ ...
Частотность употребления падежей Jul 22, 2012

Nikita Kobrin wrote:
Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.


1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д.
2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение).
Оказывается в Интернете имеется научное обоснование моей голой эмпирике
"Среди падежных форм первое место по частотности употребления занимают формы родительного падежа".
П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика.


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 09:15
English to Russian
+ ...
Не так страшен черт, как его малюют. Jul 22, 2012

Тысячи терминов -- это, конечно, серьезно.

Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно
:0)


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 09:15
English to Russian
+ ...
ответы на конкретные вопросы Jul 22, 2012

пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в
... See more
пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает.

Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.

[Edited at 2012-07-22 20:02 GMT]
Collapse


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Russian Federation
Local time: 09:15
Italian to Russian
+ ...
Спелчекер, не встроенный, а отдельное приложение Jul 22, 2012

В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент.
Может быть, когда-то и над русским языком взойдет заря?

[Edited at 2012-07-22 20:49 GMT]


 
Nadiia and Vatslav Yehurnovy
Nadiia and Vatslav Yehurnovy
Ukraine
Local time: 09:15
Member (2008)
English to Russian
+ ...
Оно и так выглядит неплохо :) Jul 23, 2012

Nikita Kobrin wrote:

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми.

А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов

Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях.

Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов.

По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office

Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским.


 
Yuri Dubrov
Yuri Dubrov  Identity Verified
Russian Federation
Local time: 09:15
English to Russian
+ ...
кстати вышла ОРФО 2012 Jul 23, 2012

ОРФО 2012 12.0.1 Профессиональная
скачать пробную версию
http://www.informatic.ru/node/95

Что удивило> предлагает изменить е на ё и наоборот


 
Andrej
Andrej  Identity Verified
Local time: 12:15
Member (2005)
German to Russian
+ ...
--- Jul 23, 2012

Yuri Dubrov wrote:

Что удивило> предлагает изменить е на ё и наоборот


В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/


 
Vitali Stanisheuski
Vitali Stanisheuski
Belarus
Local time: 09:15
Member (2005)
English to Russian
+ ...
SITE LOCALIZER
у одного моего клиента Jul 23, 2012

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

 
Alexey Ivanov
Alexey Ivanov  Identity Verified
Russian Federation
Local time: 09:15
English to Russian
Мне не кажется это удобным Jul 23, 2012

Vitali Stanisheuski wrote:

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.


Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio.
Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.

[Edited at 2012-07-23 14:33 GMT]


 
Natalia Kobzareva
Natalia Kobzareva  Identity Verified
Israel
Local time: 09:15
English to Russian
+ ...
Призрак бродит по Европе... Jul 23, 2012

Только сегодня взмечтанулось о сохранении падежей в Мультитерме.
В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом.


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Russian Federation
Local time: 09:15
Italian to Russian
+ ...
Орфо-демо Jul 23, 2012

Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more preci
... See more
Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно.
Collapse


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 09:15
English to Russian
+ ...
еще множественное число Jul 23, 2012

заношу.
В обоих падежах
И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз.


 
bogdan_demeshko
bogdan_demeshko
Local time: 13:15
Chinese to Russian
+ ...
что предлагают CATы? May 17, 2014

в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?..

 
Valery Afanasiev
Valery Afanasiev  Identity Verified
Russian Federation
Local time: 09:15
English to Russian
+ ...
А зачем вообще работать с терминологическими базами? May 17, 2014

Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько... See more
Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п.

Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок.

В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть.

Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами?
Collapse


 
Pages in topic:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Работа с терминологическими базами кошек: как бороться с падежами


Translation news in Russian Federation





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »