Навука і тэхналогіі33

Як гэта працуе: машынны пераклад з розных моваў

7 студзеня 1954 года ў штаб-кватэры карпарацыі IBM у Нью-Ёрку адбыўся так званы «Джорджтаўнскі эксперымент», падчас якога быў паспяхова прадэманстраваны цалкам аўтаматычны пераклад некалькіх дзясяткаў розных сказаў з рускай мовы на ангельскую.

Той пераклад быў вельмі просты: у слоўніку было ўсяго 250 словаў і 6 правілаў, таму сістэма магла перакласці толькі некалькі самых прымітыўных фраз. Але мэтай было прыцягненне ўвагі да машыннага перакладу і дэманстрацыя яго перспектыўнасці.

Цяпер, дзякуючы інтэрнэту, кожнае незнаёмае слова ці сказ можна за некалькі секунд перакласці на родную мову, і гэты пераклад атрымаецца даволі дакладны. Што ж змянілася з тых часоў? Які цяпер прынцып працы аўтаматычных перакладчыкаў і якая будучыня ў жывых перакладчыкаў-прафесіяналаў?

Сучасныя анлайн-перакладчыкі (самы вядомы з якіх — Google Translate) выкарыстоўваюць статыстычны машынны пераклад, у працэсе якога камп’ютарная праграма аналізуе велізарны масіў тэкстаў, перакладзеных людзьмі, і перакладае слоўнік і граматыку адной мовы на іншую ў лічбавым фармаце. Гучыць складана? Давайце разбірацца.

Велізарны масіў тэкстаў складаецца з вялікай колькасці моўных пар — тэкстаў, якія маюць дзве дакладныя моўныя версіі (перакладзеныя чалавекам). У якасці такіх тэкстаў звычайна выкарыстоўваюцца афіцыйныя дакументы шматмоўных краін, дзе пераклад дакументацыі ёсць абавязковым на ўсе дзяржаўныя мовы. Такія пераклады заўсёды найбольш дасканалыя, бо дзяржаўныя дакументы вырашаюць лёс асобных людзей і краіны ў цэлым. Таксама вельмі карыснымі аказаліся шматмоўныя дакументы, якія выпускаюцца ААН. 

Аналізуючы пары розных тэкстаў, сістэма «вучыцца», засвойваючы з кожным разам усё больш новых правілаў. Такім чынам будуецца мадэль мовы.

Таксама кожная сістэма аўтаматычнага перакладу мае мадэль перакладу — «слоўнік», у якім для ўсіх словаў і фраз на адной мове пералічаныя магчымыя пераклады на іншую мову з указаннем верагоднасці гэтых перакладаў. Мадэлі перакладу для кожнай пары моваў утрымліваюць мільёны пар слоў і словазлучэнняў.

Калі вы перакладаеце з англійскай мовы на беларускую, задзейнічаюцца дзве моўныя пары: беларуская-руская і руская-англійская. То бок спачатку тэкст перакладаецца с англійскай на рускую, а потым — з рускай на беларускую.

Такі шлях найбольш рацыянальны, бо дакументаў, якія б мелі дасканалыя англійскую і беларускую версіі — няшмат, і просты пераклад з англійскай на беларускую атрымліваўся б вельмі няякасным праз недастатковую «навучанасць» сістэмы.

Непасрэдна перакладам займаецца дэкодар — алгарытм, які праводзіць аналіз тэксту і для кожнага слова падбірае ўсе варыянты перакладу, упарадкоўваючы іх па змяншэнні верагоднасці. Затым усе атрыманыя варыянты дэкодар ацэньвае з дапамогай мадэлі мовы на частату ўжывання і выбірае прапанову з найлепшым спалучэннем верагоднасці і частаты.

На жаль, цяпер няма сэрвісу аўтаматычнага перакладу, які б мог перакласці тэкст з такой жа дакладнасцю, як і чалавек-перакладчык. Але ўжо цяпер некаторыя кампаніі ўкараняюць у машынны пераклад нейронныя сеткі, якія значна паляпшаюць яго якасць.

Таму можна меркаваць, што з цягам часу спецыялісты-перакладчыкі будуць патрэбныя толькі для стварэння складаных мастацкіх перакладаў, што значна скароціць колькасць людзей, занятых у гэтай сферы. Але наўрад ці гэта вельмі блізкая перспектыва. А як лічыце вы?

Чытайце таксама: Наступная рэвалюцыя ў інфарматыцы — нейронныя сеткі (распавядаем пра нейронныя сеткі простымі словамі)

Каментары3

У Лагойску пекар адмаўляецца прадаваць свой хлеб пакупнікам, у якіх ёсць сабакі84

У Лагойску пекар адмаўляецца прадаваць свой хлеб пакупнікам, у якіх ёсць сабакі

Усе навіны →
Усе навіны

Трагічная смерць мужа і выпрабаванне медыцынай: гісторыя беларускі ў Польшчы5

У Мінску амаль тысяча хрушчовак — імі хутка зоймуцца2

У пратэстах у Іране загінулі 35 чалавек, больш за 1200 арыштаваныя

«Галоўны я»: Трамп назваў групу чыноўнікаў ЗША, якія будуць кіраваць Венесуэлай17

Пасол Беларусі ў Расіі расказаў пра дамоўленасці з газам

Серыял «Pluribus» — самы няправільны постапакаліпсіс ці нешта большае? Расказваем пра смелы мысленчы эксперымент на ТБ15

У Трампа адмовіліся выключаць варыянт ваеннага захопу Грэнландыі6

Хто такая Дэлсі Радрыгес, што заняла месца Мадура. Марыянетка Трампа ці абаронца Венесуэлы?2

Пакуль свет засяроджаны на інфляцыі і войнах, у Паўднёвай Карэі новы вораг — выпадзенне валасоў4

больш чытаных навін
больш лайканых навін

У Лагойску пекар адмаўляецца прадаваць свой хлеб пакупнікам, у якіх ёсць сабакі84

У Лагойску пекар адмаўляецца прадаваць свой хлеб пакупнікам, у якіх ёсць сабакі

Галоўнае
Усе навіны →

Заўвага:

 

 

 

 

Закрыць Паведаміць