вторник, 20 септември 2011 г.

Филологически вицове II

Нова порция филологически вицове следва по-долу. По традиция единият ще е пернишки :)


***
Блондинка се прибира у дома и разтревожено пита мъжа си:
- Къде са децата?
Той: - На английски.
Тя: Офффф - добре де... - Where are the childen?

***

Разговор на български, който няма превод на японски:
- Какво правиш?
- Нищо, на работа съм...

***

- Как се нарича изкуството да общуваш с перничанин?
- Бойно изкуство!

четвъртък, 8 септември 2011 г.

Google Речник умря, да живее Google Преводач

Някъде бях прочела, че човек не може да научи език, като просто наизусти един речник и една граматика. Езикът трябва да се говори, да се използва в конкретни ситуации, да изпълнява определени цели. Както хората, така и компютрите не могат да научат език по този начин и затова успешните методи за машинен превод разчитат не на правила и лексика, а на статистика – милиарди паралелни текстове, които „научават“ машината да разбира кое на какво съответства.

Затова и не се изненадах, когато разбрах, че Google пенсионира своята услуга „Google Речник“.
Google Речник беше твърде статичен и неудобен и когато Google Преводач започна да предлага речникова функция, аз лично съвсем забравих за по-старата услуга.

Днес се сетих да се върна към темата „Google“, защото проектът Khan Academy (безплатни уроци по всичко) ми припомни за една нова преводаческа услуга на Google, а именно превод на субтитри от английски на всички поддържани от Google Преводач езици.


Да вземем видеоклипа от страницата, която обяснява как работи Google Преводач:



Точно този англоезичен клип е преведен на няколко езика, така че можете да изберете субтитри от бутона „cc“ (closed captions).

Под „Избор на надписи“ (Caption Selections) са всички езици, за които собственикът на клипа е заредил вече преведени субтитри. Google Преводач се намесва, когато съответният англоезичен клип няма предварително заредени субтитри.

Това, което Google прави, включва две неща:

1. Транскрибира речта от клипа, като създава субтитри на английски. Технологията на Google за разпознаване на реч не е широко популярна, но качеството й е забележително - можете да се уверите в това, като например изгледате няколко транскрибирани клипа.

Информацията от Google по темата е оскъдна и е най-общо следната:

YouTube използва експериментална технология за разпознаване на говор с цел предоставяне на машинно-генерирани надписи или „автоматични надписи“. Въпреки че не са идеални, автоматичните надписи помагат съдържанието на видеоклипа да стане достъпно за глухи хора или такива със слухови увреждания.

 2. Превежда транскрибираната реч. Това става, като изберете „Превод на надписи“ (Translate Captions) от бутона „cc“ и след това съответния език, на който искате да получите автоматичен (машинен) превод. Ето един примерен клип, с който можете да тествате. Нарочно съм избрала клип на икономическа тема, защото тя е една от най-подходящите за ползване на Google Преводач.




Що се отнася до технологиите за разпознаване на българска реч, такива май няма да има скоро. Преди повече от две години писах по темата, но оттогава няма никакви развития. И все пак, ако ви е интересна теорията зад технологиите за разпознаване на реч, можете да разгледате презентацията: Система за разпознаване на българска реч

понеделник, 5 септември 2011 г.

Дзен мълчание

Някой попитал Ян Дзи:
- Когато първият патриарх на Дзен пристигнал от Индия в Китай, той седял с лице към стената цели девет години - какво означава това?
- Бидейки индиец, той не е можел да говори по китайски - отговорил Ян Дзи.
(източник: Томас Клири, „Дзен“)

Малък филологически поздрав за любителите на конспирации :) Липсата на комуникация често се тълкува неправилно, подозира се наличие на скрит замисъл, а всъщност става дума за липса на общ език.