сряда, 16 юли 2008 г.

Как се пише „Internet“ на български?


Думичката „интернет“ сигурно е една от най-често употребяваните в съвременното ежедневие. Знаем ли обаче как се пише на български?

Без много обяснения и излишно церемонене „Нов правописен речник на българския език“ на БАН (НПРБЕ) е категоричен:

Думата „интернет“ се пише с малка буква и ударението пада върху „и“.

Дадени са следните примери на употреба в специалното Приложение 17 „Списък на думи с разделно писане“:
интернет адрес, интернет доставчик, интернет карта, интернет страница

„Правописен и правоговорен речник на българсия език“ на Петър Пашов и Христо Първев (изд. 2004 г.) е съгласен за малката буква, но дава различно произношение. Този речник предлага ударението да е на второто „е“ или - „интернЕт“. Не очаквах това стряскащо разкритие, защото си мислех, че поне при произношението на тази дума няма колебания, но явно съм грешала.

Анкетата, която течеше тук през последния месец и половина, имаше за цел да види каква е нагласата на повечето потребители относно изписването на тази дума.
Ето и резултатите:


За разлика от двата основни правописни речника на българския език 51% от гласувалите смятат, че правилният правопис е с главна буква: „Интернет“.
33% процента намират за правилен „официалния“ правопис, 12% казват, че зависи от употребата, двама гласуващи са си признали откровено, че не знаят.

Най-вероятно повече от половината гласували (51%) са предпочели „Интернет“, защото такъв е правописът на английски. Ето речниковата статия от Oxford Advanced Learner’s Dictionary

Internet /.../ noun (usually the Internet) (also informal the Net) [sing.] an international computer network connecting other networks and computers from companies, universities, etc.: I looked it up on the Internet. You can buy our goods over the Internet. All the rooms have access to the Internet / Internet access. an Internet service provider (= a company that provides you with an Internet connection and services such as email, etc.)
От тази статия става ясно, че „интернет“ на английски не само се пише с главна буква, но и че обикновено се членува. На български не казваме *Ще потърся в Интернета, нито *Можете да купите стоките ни в Интернета, но пък със сигурност казваме Вчера пак ми спряха интернета - със значение „връзката с Интернет“, а не световната мрежа, разбира се.
При всички случаи хората, решили да изписват думата интернет с главна буква обаче, ще трябва да правят това във всички изрази, в които се употребява, т.е. Интернет адрес, Интернет доставчик и т.н. и ще трябва да са наясно, че всъщност използват английския, а не българския правопис.

Също доста висок процент от гласувалите (33%) са предпочели правописа с малка буква. Те автоматично спазват препоръките на НПРБЕ и единственият им проблем са горните 51 процента, които биха им възразили. А това съвсем не се случва рядко. Например, ако един преводач използва малка буква, а редакторът не отвори НПРБЕ и поправи масово думата с главна буква, автоматично се получава огромна каша, която при опит на коректора да бъде поправена, става съвсем безнадеждна - в половината текст „интернет“ е с малка, а в другата половина - с главна буква.

Скромните 12 % от гласувалите са казали, че правописът на малка/главна буква зависи от употребата. Тъй като нито НПРБЕ, нито Оксфорд дават две различни употреби на тази дума, тези хора трябва да ползват други източници. Самата аз, преди да се снабдя с НПРБЕ, спадах към тях и бях запаметила най-често срещаната дефиниция в Мрежата, която по най-добрия начин е формулирана така:

Какво е Интернет и каква е разликата му с интернет
авг.15, 2007 in Речник
В общия смисъл, интернет (с малко и) е компютърна мрежа, която свързва няколко мрежи.
Интернет е съкращение от интер-нетуърк, или буквално преведено на български — междумрежа. Като съществително собствено име, Интернетът е обществено-достъпна международно свързана система от компютри (заедно с информацията и услугите, които те предлагат на потребителите), която използва протоколния стек (Transmission Control Protocol/Internet Protocol) TCP/IP. Така че, най-големият интернет е просто наричан Интернет.
Процесът на свързване на мрежи по този начин е известен като internetworking.
(публикувано с любезното позволение на Богомил Шопов)

Ако приемем тази дефиниция за вярна, то думата „интернет“ с малко „и“ ще бъде използвана в съвсем малко на брой технически текстове, свързани с изграждането и поддържането на локални мрежи. Аз лично бих се съгласила с правило за малка/главна буква, зависещо от употребата, единствено ако говорим за думата „мрежа“. „мрежа“ е локалната мрежа, а „Мрежата“ (винаги членувано) е световната мрежа. И един въпрос, който ми се струва логичен: „компютърна мрежа, която свързва няколко мрежи“ не означава ли просто „мрежа“? При създаването на "The Internet" може и да е имало такова разграничение, но днес то ми се струва леко архаично.

Почетните двама гласували са си признали, че пишат тази дума, както им дойде. И прави са хората - то може ли да се разбере нещо в тази каша?

Рестартирам анкетата, за да видя дали резултатите ще се променят и в каква посока.
Моля, гласувайте:)

Редакция: Ето и резултатите от повторната анкета.

събота, 12 юли 2008 г.

Занаятът да превеждаш бля-бля-бля


Наскоро в proz.com беше публикувана горната анкета. На въпроса „Кое твърдение описва най-добре превода?“ най-популярният отговор е „Това е занаят“. Цели 35% от гласувалите преводачи са пренебрегнали възможностите изкуство, работа, вродена способност и наука и са избрали „занаят“.
И съвсем логично. Професията на преводача процъфтява в наши дни. Освен книги вече превеждаме сайтове, софтуери, ръководства, маркетингови материали, договори и какво ли още не - все във връзка с масовата консумация и глобализиращия се пазар. Тези преводи не изискват творчество (1), а запретване на ръкави и оборудване на едно компютърно работно място с всичко необходимо за продължително седене: удобен стол - за предпочитане с облегалки и възможност за въртене, поставки за китките - за клавиатура и мишка и обезателно очила с антирефлексно покритие.
Теорията на превода, която важи за този тип преводи, е проста и ясна: придържайте се към текста и гледайте крайният вариант да е четим от носителите на езика цел (2).
И всичко щеше да е чудесно при изпълнението на 1 и 2, ако не съществуваше това ужасно нещо, наречено

gobbledygook


Това е така досадното „бля-бля-бля“, заучените фразички, които трябва да се напъхат в един рекламен или разяснителен текст за даден продукт, за да е сигурен клиентът, че действително говорим за „цялостно решение“, „ново поколение“, „пазарен лидер“ и т.н. и т.н.
Изобщо не съм първата, която роптае срещу това идиотско бръщолевене. Ето какво казва David Meerman Scott в статията си „The Gobbledygook Manifesto -- Cutting Edge! Mission Critical! An analysis of gobbledygook in over 388,000 press releases sent in 2006

Oh jeez, not another flexible, scalable, groundbreaking, industry-standard, cutting-edge product from a market-leading, well positioned company! Ugh. I think I'm gonna puke!

Ето и малко статистика:

(източник)


Някои преводачи казват: „Аз не спазвам принципа Gobbledygook In Gobbledygook Out (Бля-бля влязло, Бля-бля излязло), защото след това читателите ще ме псуват мен.“. Какво правим обаче, когато един текст е съставен само от такива брътвежи, примесени с рекламни лозунги по 7-8 на страница?

Някой изобщо издържал ли е да прочете един такъв текст от край до край? И нещото, което най ми е чудно: ЩО за човек седи и пише 18 страници за нещо, което може да се побере на ЕДНА?

Или може би аз съм в грешка? При усвояването на уменията за писане на литературните интерпретативни съчинения, с които приемат родните университети, се посвещава изключително много време на техниката в текста да се пъхат високопарни и завъртулени изрази, така че да не остане никакво съмнение у читателя, че сме интерпретирали де що има за интерпретиране. Само че, драги мои, това изобщо не са текстове, които се публикуват, още по-малко четат от някого. Тези текстове се четат веднъж, оценяват се и се изхвърлят в забвение. Това, че Cambridge изпитват писане на статии, писма, доклади, предложения, критики и есета, нищо не означава. Какво ли разбират англичаните? Ще ми санкционират използване на клишета и ще ми ограничават мисълта в 350 думи! Ние искаме да пишем по 20 страници глупости!

В момента ми е кофти, че вече преведох 60 страници безумен текст във възхвала на един обикновен софтуер и ми остават още 20.

Обръщам се с молба към всички: недейте да насърчавате този стил на писане - нито като писатели, нито като читатели. Търсете различните фирми, които не вярват в тези заклинания за (не)успешен маркетинг и докладвайте, за да можем да изплакнем око.

четвъртък, 10 юли 2008 г.

SDL Trados Webinars This July



As you can see, SDL Trados has prepared a really good program for July.
If you are interested in translation technology - either as a translator, or as a user of translation services for localization and internationalization, you'll find these FREE webinars quite interesting.
See the list of webinars here, or go to the list of recorded webinars to view some previous webinars on various topics related to the use of CAT tools, lessons for beginners and other interesting presentations.

вторник, 1 юли 2008 г.

Google Translate и автоматичният превод


Мина доста време, откакто Google включиха българския към езиците, които се поддържат от набралата популярност услуга Google Translate. Оттогава направих някои експерименти с въпросния инструмент и реших да опиша впечатленията си.


Какво казва Мрежата

Не е трудно да намериш в интернет куп подигравателни статийки, коментари и дискусии, посветени на машинния превод. Кой например не е чел така популярния превод на кухненски аспиратор Taurus, увековечил съчетаното използване на думичките смокиня и шибалка? Малко ли са и тези, които отвориха Google Translate, разочароваха се дълбоко поради факта, че не може им да преведе на английски „на баба ти хвърчилото“ и го затвориха с презрение?

Е време е да дадем и една малко по-различна гледна точка.

Няколко думи за машинния превод
Българската статия за Машинния превод в Уикипедия описва по много добър начин и с малко по-сложни научни термини какво точно е това чудо. Ето определението на Уикипедия:

Машинен превод е дисциплина от компютърната лингвистика, която се занимава със задачата за автоматично превеждане на писмен текст или реч от един естествен език на друг чрез компютърен софтуер.

Google, както обикновено, са намерили далеч по-лаконичен начин да изразят същото.

What is "automatic translation"?
It's translation produced by state-of-the-art technology, without the intervention of human translators. Automatic translation is also often referred to as machine translation.

Тоест: превод без човешка намеса.


Опити за „такова животно“ със сигурност има от самата зора на компютрите. Към момента според най-различни източници, машинният (автоматичният) превод може да постигне максимална точност от 85%. Не мога да се сетя къде точно видях тази оценка, но година-две след като за пръв път прочетох тези данни, започнах да практикувам т.нар. „превод с помощта на компютър“ (англ. computer-aided translation или computer-assisted translation – CAT). Без да се впускам в много подробности, стандартните настройки на CAT инструмента, който ползвам сега, предвиждат наказателно отнемане (penalty) на точно 15% от точността на сегмент, произлязъл от машинен превод. Значи бихме могли да приемем, че един машинен превод може да предостави МАКСИМАЛНА ТОЧНОСТ от 85%.


Приносът на Google


Както е известно, Google дължат огромния успех на своята търсачка на патентования си алгоритъм PageRank™. Беше въпрос на време да разпрострат изследователската си дейност и в областта на компютърната лингвистика и по-точно в един от най-комерсиалните й клонове - машинния превод. Коментаторите бележат началото на гугълската ера в автоматичния превод със статията Statistical machine translation live, пусната в официалния блог на Google на 28 април 2006 г. от Franz Och. (Преди това пак е имало автоматичен превод, предлаган от Google, но той е бил базиран на продукта Systran, от който също се възползва Babelfish (Altavista). )


Какво е новото?
Google вече говорят за статистически машинен превод


What is statistical machine translation?
Most state-of-the-art, commercial machine-translation systems in use today have been developed using a rule-based approach, and require a lot of work to define vocabularies and grammars.
Our system takes a different approach: we feed the computer billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model. We've achieved very good results in research evaluations.

С други думи: Google са заредили безброй много паралелни текстове, въвели са няколко правила (грубо казано разбира се) и ето ти най-успешния (че и безплатен) софтуер за машинен превод (една статия на френски с малко статистика).


Какво научих АЗ от кратките си експерименти с Google Translate:


1. Поддържа се превод освен между български-английски, но и между български-гръцки. Отне ми известно време да разбера, че двойката български-гръцки всъщност използва английския като междинен, но това е факт. Много добър финт - можеха просто да кажат, че не поддържат тези двойки и да си навлекат малко мрънкане, но Google просто добавят една стъпка, която се изпълнява на заден фон - и ето ти доволен потребител.


2. Google Translate се справя много добре с текстове от сфери като финанси, счетоводство, право, Европейски съюз и т.н. Това ме кара да си мисля, че са били „подравнени“ (aligned) доста текстове именно от безбройните преводи на ЕС или други подобни. Много добре:) Самият ЕС не е заредил в IATE почти нищо за български (за разлика от гръцки), но пък Google са се сетили. Още веднъж: браво на Google.


3. Google Translate върши отлична работа при превод на имена на държави, най-различни съкращения (знае например, че ΑΞΕ (Άμεσες ξένες επενδύσεις) e FDI (Foreign Direct Investment) и ПЧИ (Преки чуждестранни инвестиции) ) , химични вещества (знае и какво са „PCB or PCT“ - сега е моментът да тествате:)).
Тоест, Google Translate може да се ползва изключително успешно като речник за масов превод на несвързан текст и нерядко на доста специфични термини от различни сфери.


4. Специално за български учудващо често се улучва и правилната пунктуация (?!).


5. Google Translate не се справя никак добре при художествени текстове, фразеологични словосъчетания, остарели изрази, всекидневна реч, неграмотни текстове с правописни и пунктуационни грешки. Е - простено да му е.


6. Google са оставили потребителя да даде своя принос чрез линка „Предложете по-добър превод“. Тоест всеки, който разполага с паралелни текстове на два езика, може да ги зареди по най-елементарен начин в отварящото се поленце и така да подпомогне каузата за създаване на един по-добър машинен превод. Аз лично вече редовно давам своята лепта при комбинациите между трите ми езика, макар че ако за български-гръцки се минава през английски, едва ли предложенията ми биват отчитани... Я да видим...


В заключение с радост мога да отбележа, че машинният превод е направил решителна крачка напред благодарение на Google. Според изследването на bytelevel (плюс още) по-малко от 30% от потребителите на интернет са носители на английския език с тенденция да стават все по-малко. В същото време Европа развива езикова политика, която цели до навършването на пълнолетие всеки европейски гражданин да владее на добро ниво два езика в допълнение към майчиния, като със съжаление се отбелязва, че практиката да се изучава само английски се дължи на „принципа на минималното усилие“. Ето затова аз съм „за“ машинния превод. Той може да не е пълно решение на проблема „езикова бариера“, но определено вече започва да помага.


А що се отнася до това, дали машинният превод ще замести човешкия - мисля, че е тотално невъзможно. Единственият начин машина да преведе със 100% точност един текст е той да е съставен от друга машина. Защото хората използват безброй синоними, стилови окраски, тавтология, грешки, жаргон, обратен словоред и т.н., а машините биха могли да владеят само „книжовен“ език в прав словоред и съставен от думи, които имат точно една аналогична дума на изходния език, за да се избягват евентуални обърквания.


Линкове:

Google Translate: http://google.com/translate_t

За технологията на Google Translate: http://www.google.com/intl/en/help/faq_translation.html