Smartcat в мире двуязычных форматов: поддержка вместо преград

Однажды я научился за три месяца работать в пяти разных CAT-инструментах. Нет, не на спор и не в каком-то странном конкурсе переводчиков. Просто я устроился в переводческое агентство.

Двуязычные форматы файлов

В крупных агентствах обычно можно найти целый «зоопарк» переводческих инструментов для работы с разными форматами файлов: ведь никогда не угадаешь, в каком формате придут файлы от очередного клиента.

Это только кажется преимуществом, на самом деле новым переводчикам приходится тратить рабочее время на то, чтобы освоить все эти программы. К тому же, часто приходится переносить переводческие ресурсы между разными инструментами. И наконец, лицензии — их нужно сначала купить, потом эффективно управлять ими внутри компании, а еще считать доступное количество пользователей и следить за системными требованиями… Выходит, такое разнообразие только мешает бизнес-процессу. И чем крупнее агентство, тем больше усилий требуется, чтобы поддерживать эту инфраструктуру.

Стандарты

Переводческая индустрия породила несколько стандартов для обмена ресурсами между разными CAT-программами.

В конце 90-х появилась первая версия стандарта TMX, который используется для хранения памяти переводов. Это сильно облегчило жизнь переводчикам, ведь TMX-файлы можно было использовать в разных программах и передавать их на носителях. В начале 2000-х назрела необходимость для нового стандарта. Так появился формат XLIFF для обмена локализуемыми данными и сопутствующей информацией.

Стандарты дают возможность использовать ресурсы в разных CAT-инструментах, но всех проблем они не решают.

Во-первых, файлы в непопулярных форматах вроде TTX или ITD приходится вручную конвертировать в более современные форматы либо искать доисторический софт, чтобы открыть их. В обоих случаях есть риск потерять информацию.

Во-вторых, у большинства компаний нет инструментов для централизованного учета и управления версиями ресурсов. Поэтому в ход идут разные ухищрения: некоторые пишут даты и этапы процесса прямо в названии файла, другие создают сложные структуры из папок с файлами. В любом случае, «человеческий фактор» грозит ошибками и напрасно потраченным временем.

И наконец, разные программы читают XLIFF-файлы неодинаково. Бывает, теряется сегментация, неправильно определяются языковые коды, «слетают» статусы сегментов. Переводчикам часто приходится править файлы «руками» в блокноте.

XLIFF с разными вкусами

Бывает, что стандарты не устраивают отдельных игроков. Поэтому некоторые разработчики CAT-инструментов создали свои вариации на тему формата XLIFF, причем их спецификации хранятся в секрете.

Мы проделали большую работу, чтобы разобраться в тонкостях каждого такого формата. Ведь мы хотим, чтобы компании и фрилансеры перестали тратить время на изучение инструментов, пляски с бубном вокруг файлов и отслеживание сроков лицензий.

Мы не изобретаем своих форматов. Вместо этого мы даем пользователям возможность работать с уже существующими, причем постоянно добавляем поддержку новых форматов. Наша цель — сделать так, чтобы вы открыли браузер и сразу начали работу, какой бы файл не попал вам в руки, а потом одним кликом сдали бы заказчику работу.

XLIFF 1.2

Файл с переводами в этом формате содержит статусы сегментов, а также данные о методе сегментации и блокированных сегментах. При импорте такого файла вся эта информация в нем будет доступна в Smartcat. Через API можно получить XLIFF-версию любого документа. Файл будет полностью совместим с любыми системами.

SDLXLIFF

Пожалуй, самый популярный формат на основе XLIFF. Этот формат используется для работы в программе Trados Studio, но его можно без труда загрузить в Smartcat. Мы добавили поддержку SDLXLIFF в самых ранних версиях и с каждым релизом совершенствуем ее.

Пакеты Trados Studio и WorldServer

Многие заказчики, которые работают в Trados Studio, передают задачи на перевод в пакетах. Пакеты содержат двуязычные файлы в формате SDLXLIFF, базы памяти переводов, глоссарии и инструкции к проекту.

Переводчикам, у которых не установлены продукты компании SDL, часто приходится изощряться, чтобы достать из пакета SDLXLIFF-файлы и файлы памяти переводов. Не все знают, что гораздо проще загрузить пакет в Smartcat: все данные будут автоматически извлечены и станут доступны в нашем CAT-редакторе. Если вам прислали пакет Trados Studio и WorldServer, после завершения проекта вы сможете получить возвратный пакет с готовым переводом и сопутствующими данными и отправить менеджеру агентства или клиенту.

MQXLIFF

Это вторая по популярности разновидность формата XLIFF от разработчиков CAT-программы memoQ. При работе с ним иногда применяют лайфхак: экспортируют MQXLIFF-файл из memoQ с опцией «Plain XLIFF for other tools» и затем меняют расширение файла с “.mqxliff” на “.xlf”. Но дьявол кроется в деталях: из-за несовместимости заказчик может потерять статусы сегментов при возврате файла — из-за этого будет непонятно, какие сегменты на каком этапе были подтверждены. Чтобы не мучиться и не терять важную информацию, MQXLIFF-файлы можно загрузить в Smartcat и работать с ними как ни в чем не бывало.

TTX

Этот формат казалось бы давно отслужил свое и занял почетное место в музее двуязычных форматов. Тем не менее, некоторые пользователи продолжают им пользоваться. Smartcat уважает наследие прошлого, поэтому с форматом TTX можно работать как с любым другим.

Больше, чем поддержка форматов

В Smartcat можно не только работать с разными форматами, но и:

  • Совместно переводить документ — хоть вдвоем, хоть командой из ста человек, при этом не мешая друг другу. Как только сегмент переведен, редактор сразу может отредактировать его. Все участники проекта могут пользоваться его ресурсами, а новые термины или совпадения с памятью переводов сразу становятся доступны каждому.
  • Начать переводить можно на одном компьютере, а продолжить — на другом, ведь вся информация хранится в «облаке».
  • Использовать разные движки машинного перевода, в том числе адаптивный движок Lilt. Для этого просто включите нужный движок в настройках проекта.

Пока другие пытаются «привязать» пользователей к своему продукту через ограничения, мы создаем «умные» технологии и даем к ним доступ всем. Но наша цель — не набор инструментов, а экосистема, в которой встроенные и сторонние решения помогают людям эффективно решать любые задачи и общаться между собой.

В общем, мы хотим, чтобы переводчики и компании меньше думали о форматах и прочих чисто технических вопросах и сосредоточились на переводах. Кстати, вы можете попросить нас добавить новый формат — для этого напишите нашим специалистам.


Павел Доронин,
Product Manager