Pages in topic: [1 2] > | Работа с терминологическими базами кошек: как бороться с падежами Thread poster: Nikita Kobrin
| Nikita Kobrin Lithuania Local time: 09:15 Member (2010) English to Russian + ...
Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166 Чтобы не отклоняться там от темы, решил создать новую. Sergei Tumanov wrote: Nikita Kobrin wrote: Sergei Tumanov wrote: Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже. Надеюсь, это шутка такая? Тут следует улыбнуться? Это не шутка. Мне такой вариант работы с терминами нравится. Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее. Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так: English: browser helper object Russian: вспомогательный объект браузера Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом: English: browser helper object Russian: вспомогательный объект браузера вспомогательного объекта браузера вспомогательному объекту браузера вспомогательным объектом браузера вспомогательном объекте браузера Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет: 1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет. 2) Как будут выглядеть ваши базы? 3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться? На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка. Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги? | | | Частотность употребления падежей | Jul 22, 2012 |
Nikita Kobrin wrote: Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет. 1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д. 2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение). Оказывается в Интернете имеется научное обоснование моей голой эмпирике "Среди падежных форм первое место по частотности употребления занимают формы родительного падежа". П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика. | | | Не так страшен черт, как его малюют. | Jul 22, 2012 |
Тысячи терминов -- это, конечно, серьезно. Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно :0) | | | ответы на конкретные вопросы | Jul 22, 2012 |
пункт 2 А какое кому дело? Мне будет полезно, а на остальное мне чихать ++++++++++ пункт 3 Не знаю, если честно Я мемоку не пользуюсь. Потому и не переживаю. Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в ... See more пункт 2 А какое кому дело? Мне будет полезно, а на остальное мне чихать ++++++++++ пункт 3 Не знаю, если честно Я мемоку не пользуюсь. Потому и не переживаю. Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает. Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.
[Edited at 2012-07-22 20:02 GMT] ▲ Collapse | |
|
|
Спелчекер, не встроенный, а отдельное приложение | Jul 22, 2012 |
В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент. Может быть, когда-то и над русским языком взойдет заря?
[Edited at 2012-07-22 20:49 GMT] | | | Оно и так выглядит неплохо :) | Jul 23, 2012 |
Nikita Kobrin wrote: 3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться? В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми. А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях. Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов. По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским. | | | Yuri Dubrov Russian Federation Local time: 09:15 English to Russian + ... кстати вышла ОРФО 2012 | Jul 23, 2012 |
ОРФО 2012 12.0.1 Профессиональная скачать пробную версию http://www.informatic.ru/node/95 Что удивило> предлагает изменить е на ё и наоборот | | | Andrej Local time: 12:15 Member (2005) German to Russian + ...
Yuri Dubrov wrote: Что удивило> предлагает изменить е на ё и наоборот В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/ | |
|
|
Vitali Stanisheuski Belarus Local time: 09:15 Member (2005) English to Russian + ... SITE LOCALIZER у одного моего клиента | Jul 23, 2012 |
У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм. | | | Alexey Ivanov Russian Federation Local time: 09:15 English to Russian Мне не кажется это удобным | Jul 23, 2012 |
Vitali Stanisheuski wrote: У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм. Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio. Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.
[Edited at 2012-07-23 14:33 GMT] | | | Призрак бродит по Европе... | Jul 23, 2012 |
Только сегодня взмечтанулось о сохранении падежей в Мультитерме. В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом. | | |
Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........ Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more preci... See more Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........ Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно. ▲ Collapse | |
|
|
еще множественное число | Jul 23, 2012 |
заношу. В обоих падежах И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз. | | | что предлагают CATы? | May 17, 2014 |
в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?.. | | | А зачем вообще работать с терминологическими базами? | May 17, 2014 |
Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько... See more Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п. Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок. В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть. Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами? ▲ Collapse | | | Pages in topic: [1 2] > | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Работа с терминологическими базами кошек: как бороться с падежами No recent translation news about Russian Federation. |
Wordfast Pro | Translation Memory Software for Any Platform
Exclusive discount for ProZ.com users!
Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value
Buy now! » |
| Protemos translation business management system | Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |