Работа с терминологическими базами кошек: как бороться с падежами (Russian)

Non-English forums » Russian »
Работа с терминологическими базами кошек: как бороться с падежами
Track this topic

Pages in topic: [1 2] >

Работа с терминологическими базами кошек: как бороться с падежами

Thread poster: Nikita Kobrin

Nikita Kobrin

Lithuania
Local time: 09:15
Member (2010)
English to Russian
+ ...

Jul 22, 2012

Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166

Чтобы не отклоняться там от темы, решил создать новую.

Sergei Tumanov wrote:

Nikita Kobrin wrote:

Sergei Tumanov wrote:

Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже.

Надеюсь, это шутка такая? Тут следует улыбнуться?

Nikita Kobrin

Это не шутка.

Мне такой вариант работы с терминами нравится.

Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее.

Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так:

English:

browser helper object

Russian:

вспомогательный объект браузера

Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом:

English:

browser helper object

Russian:

вспомогательный объект браузера
вспомогательного объекта браузера
вспомогательному объекту браузера
вспомогательным объектом браузера
вспомогательном объекте браузера

Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет:

1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

2) Как будут выглядеть ваши базы?

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка.

Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги?

Nikita Kobrin

Sergey Inaekyan
Local time: 09:15
English to Russian
+ ...

Частотность употребления падежей

Jul 22, 2012

Nikita Kobrin wrote:
Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д.
2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение).
Оказывается в Интернете имеется научное обоснование моей голой эмпирике
"Среди падежных форм первое место по частотности употребления занимают формы родительного падежа".
П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика.

Sergei Tumanov

Local time: 09:15
English to Russian
+ ...

Не так страшен черт, как его малюют.

Jul 22, 2012

Тысячи терминов -- это, конечно, серьезно.

Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно
:0)

Sergei Tumanov

Local time: 09:15
English to Russian
+ ...

ответы на конкретные вопросы

Jul 22, 2012

пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает.

Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.

[Edited at 2012-07-22 20:02 GMT] ▲ Collapse

Gennady Lapardin

Russian Federation
Local time: 09:15
Italian to Russian
+ ...

Спелчекер, не встроенный, а отдельное приложение

Jul 22, 2012

В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент.
Может быть, когда-то и над русским языком взойдет заря?

[Edited at 2012-07-22 20:49 GMT]

Nadiia and Vatslav Yehurnovy
Ukraine
Local time: 09:15
Member (2008)
English to Russian
+ ...

Оно и так выглядит неплохо :)

Jul 23, 2012

Nikita Kobrin wrote:

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми.

А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов

Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях.

Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов.

По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office

Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским.

Yuri Dubrov

Russian Federation
Local time: 09:15
English to Russian
+ ...

кстати вышла ОРФО 2012

Jul 23, 2012

ОРФО 2012 12.0.1 Профессиональная
скачать пробную версию
http://www.informatic.ru/node/95

Что удивило> предлагает изменить е на ё и наоборот

Andrej

Local time: 12:15
Member (2005)
German to Russian
+ ...

---

Jul 23, 2012

Yuri Dubrov wrote:

Что удивило> предлагает изменить е на ё и наоборот

В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/

Vitali Stanisheuski
Belarus
Local time: 09:15
Member (2005)
English to Russian
+ ...

SITE LOCALIZER

у одного моего клиента

Jul 23, 2012

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

Alexey Ivanov

Russian Federation
Local time: 09:15
English to Russian

Мне не кажется это удобным

Jul 23, 2012

Vitali Stanisheuski wrote:

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio.
Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.

[Edited at 2012-07-23 14:33 GMT]

Natalia Kobzareva

Israel
Local time: 09:15
English to Russian
+ ...

Призрак бродит по Европе...

Jul 23, 2012

Только сегодня взмечтанулось о сохранении падежей в Мультитерме.
В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом.

Gennady Lapardin

Russian Federation
Local time: 09:15
Italian to Russian
+ ...

Орфо-демо

Jul 23, 2012

Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно. ▲ Collapse

Sergei Tumanov

Local time: 09:15
English to Russian
+ ...

еще множественное число

Jul 23, 2012

заношу.
В обоих падежах
И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз.

bogdan_demeshko
Local time: 13:15
Chinese to Russian
+ ...

что предлагают CATы?

May 17, 2014

в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?..

Valery Afanasiev

Russian Federation
Local time: 09:15
English to Russian
+ ...

А зачем вообще работать с терминологическими базами?

May 17, 2014

Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п.

Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок.

В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть.

Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами? ▲ Collapse

Pages in topic: [1 2] >

Login to reply/comment

To report site rules violations or get help, contact a site moderator:

Moderator(s) of this forum
Natalie	[Call to this topic]
Jarema	[Call to this topic]
Margarita	[Call to this topic]
Andriy Bublikov	[Call to this topic]

You can also contact site staff by submitting a support request »

Работа с терминологическими базами кошек: как бороться с падежами

Translation news in Russian Federation

No recent translation news about Russian Federation.

Submit a news story about translation in Russian Federation »
Read more translation news »

Forum rules

Help and orientation

Wordfast Pro
Translation Memory Software for Any Platform Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value Buy now! »

Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers! The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc. More info »

Recent posts | FAQ | Rules | Moderators | Article knowledgebase

Your current localization setting

English

Select a language

More languages...

Работа с терминологическими базами кошек: как бороться с падежами

Работа с терминологическими базами кошек: как бороться с падежами

You have native languages that can be verified

Your current localization setting

Select a language