БЕЛ Ł РУС

Рэдактар беларускай Вікіпедыі: Будучыня праекта — за штучным інтэлектам

6.03.2025 / 22:40

Nashaniva.com

«Менск і Мінск — дзве паловы сталічнай душы», — спявае ў песні Лявон Вольскі. Вядомы жарт, што ў беларусаў усяго па два, знаходзіць сваё адлюстраванне нават у Вікіпедыі. Іх у нас таксама дзве — класічным правапісам і школьным. Але ці толькі ў правапісе розніца? Адзін з рэдактараў беларускай Вікіпеды Андрусь (імя зменена ў мэтах бяспекі), кажа, што не толькі. А ў чым менавіта? Budzma.org паразмаўляла з ім пра гэта, а таксама пра аб’ектыўнасць інфармацыі, дынаміку развіцця абедзвюх версій і асноўныя праблемы, з якімі сутыкаюцца рэдактары.

У беларускай Вікіпедыі два раздзелы — тарашкевіцай і наркамаўкай. Малюнак створаны нейрасеткай Poe.com

— Раскажыце, якія адрозненні ёсць у двух раздзелах Вікіпедыі — афіцыйнага і класічнага правапісу

— Напачатку гэта быў адзін раздзел, у якім розныя рэдактары спрабавалі дамаўляцца і пісаць двума правапісамі. Падыходы да напісання артыкулаў ніяк не адрозніваліся. Але гэта не дало ніякага плёну, бо ўся энергія ішла на пустыя спрэчкі пра правапіс, у выніку чаго беларускую Вікіпедыю падзялілі на дзве. Сёння, акрамя правапісу, адрозненне паміж раздзеламі палягае ў асноўным у тым, што ў раздзеле на тарашкевіцы выкарыстоўваюцца гістарычныя назвы беларускіх гарадоў, якія за савецкім часам былі перайменаваныя. Такі падыход не выкарыстоўваецца паслядоўна: некаторыя вуліцы, якія маюць савецкія назвы, застаюцца з такімі ж назвамі ў артыкулах.

Доўгія гады паміж двума раздзеламі не было моцнага ідэалагічнага супрацьстаяння. Але ў апошнія гады сітуацыя змянілася.

Раздзел тарашкевіцай стаў далёка адыходзіць ад закладзеных у Вікіпедыю прынцыпаў нейтральнасці. Рэдактары «тарашкевіцы» фактычна ствараюць альтэрнатыўную рэальнасць.

Калі там адкрыць артыкул «Беларусь», можна заўважыць у якасці афіцыйнага сімвала бел-чырвона-белы сцяг, адзіную дзяржаўную мову — беларускую, і прэзідэнтку Святлану Ціханоўскую. І тут узнікае пытанне: калі ў нас усё добра, у чым тады праблема беларусаў? Гэтая старонка адлюстроўвае чаканні і жаданні рэдактараў, але не рэчаіснасць. На гэтай глебе ўзнікае новы канфлікт паміж раздзеламі. 

Старонка «Беларусь» на тарашкевіцы

Калі адкінуць ідэалагічныя адрозненні, рэдактары «тарашкевіцы» таксама адмоўна ставяцца да стварэння артыкулаў на аснове перакладаў з рускага раздзелу. У «наркамаўцы» такога няма: любая інфармацыя будзе каштоўнай. Вядома, пры стварэнні артыкулаў па беларускай тэматыцы лепш пісаць па наяўных крыніцах, але артыкул пра якую-небудзь англа-бурскую вайну, які добра напісаны ў рувікі, лепш перакласці.

Вікіпедыя не мае на мэце стварэнне ўнікальнага беларускага кантэнту, яна мае на мэце падаваць веды на беларускай мове.

— Ці можна сказаць, што актыўнасць у «тарашкевіцы» нашмат меншая, чым у «наркамаўцы»?

— Гэта натуральна. Напачатку праект «тарашкевіцы» быў моцна прадстаўлены ў інтэрнэце. Ёсць статыстыка, паводле якой у 2007 годзе колькасць актыўных рэдактараў «тарашкевіцы» складала 57 чалавек, а «наркамаўкі» 39. На гэты момант сітуацыя іншая: раздзел з афіцыйным правапісам значна вырас па колькасці аўтараў. Нельга сказаць, што актыўнасць на раздзеле з класічным правапісам нулявая. Але колькасць рэдактараў не расце з 2009 года: іх як было 120, так і застаецца.

Прычынай гэтага можа быць тое, што новыя аўтары проста не ведаюць, як пісаць тарашкевіцай. У школе гэты правапіс не вывучаюць, а слоўнікаў на ім мінімальная колькасць. Не зразумела, дзе і як правяраць гэтыя словы, бо праграм па праверцы правапісу таксама няшмат. Чалавеку, які скончыў беларускую школу, цяжка адаптавацца да яго. Тарашкевіца — гэта не проста мяккія знакі паміж «н», яна мае больш складаныя правілы, якія даводзіцца вучыць з нуля. «Школьны» акадэмічны правапіс найбольш пашыраны, і людзям на ім зручней пісаць.

— Ці былі спробы аб’яднання двух раздзелаў у адзін?

— Пасля падзелу беларускай Вікіпедыі пра гэта не заходзіла размоў. На мяжы 2000-х — 2010-х гг. быў моцны канфлікт паміж двума раздзеламі. Рэдактары абвінавачвалі адно аднаго ў крадзяжы артыкулаў, быццам яны перапісваюць чужыя тэксты і адаптуюць пад свой правапіс. Гэта былі вечныя бойкі. З 2014 года раздзел з акадэмічным правапісам значна вырас па колькасці артыкулаў, і канфлікт з «тарашкевіцай» пачаў сціхаць. Бо было ўжо вядома, які раздзел будзе першым, і нічога гэтаму нельга было супрацьпаставіць. 

На сёння два раздзелы існуюць як паралельныя праекты, якія ніяк не звязаныя паміж сабой. Рэдактары «наркамаўкі» ведаюць некаторых рэдактараў «тарашкевіцы», але яны не бачаць патрэбы аб’ядноўвацца.

— Калі казаць пра тэмы, якіх артыкулаў не хапае ў беларускай Вікіпедыі?

— Мне здаецца, што ўсе тэмы хоць неяк прадстаўленыя ў абедзвюх Вікіпедыях. Але не хапае артыкулаў пра дакладныя і прыродазнаўчыя навукі. У той час, калі дастаткова артыкулаў пра розныя біяграфіі, гістарычныя падзеі, кнігі. Многія могуць падумаць, што гэта праз адсутнасць спецыялізаванай тэрміналогіі. Аднак з тэрміналогіяй усё добра, бо хапае беларускіх тэматычных слоўнікаў. І шмат словаў у навуковых артыкулах складаюць інтэрнацыяналізмы.

Таксама ёсць праблема з рэлігійнымі тэмамі, дзе якраз узнікаюць складанасці з перакладамі. Напрыклад, царкоўнаславянская мова цяжка перакладаецца на беларускую, каб захаваць у ёй пазнавальныя абліччы слоў з рэлігійнай тэрміналогіі. У Беларусі дзве асноўныя канфесіі, дзе амаль кожны тэрмін і імя будуць адрознівацца паводле напісання. Гэтая варыятыўнасць стварае праблемы, і праз гэта мала хто хоча занурацца ў такія тэмы.

У раздзелах ёсць і свае перакосы. Напрыклад, у раздзеле «тарашкевіцай» масава ствараюцца артыкулы пра імёны ліцвінаў. І яны ніколі не з’явяцца ў Вікіпедыі акадэмічным правапісам, бо для нашых рэдактараў крыніцы, выкарыстаныя для напісання тых артыкулаў, з’яўляюцца маргінальнымі. 

Ёсць прыклады, калі ў адным раздзеле штосьці ёсць, а ў іншым няма, таму што мы не прымаем тую крыніцу за надзейную. Напрыклад, рэдактары раздзела з класічным правапісам спасылаліся на аўтара Алёхна Дайліда, які праз самвыдат публікуе свае кнігі і даследаванні ў інтэрнэце. Ягонае імя — гэта псеўданім. Сябе ён пазначае як бакалаўр гуманітарных навук (то-бок проста выпускнік універсітэта). Няма ніякай крытыкі (ні станоўчай, ні адмоўнай) на публікацыі гэтага ананіма ад навукоўцаў, таму мы не прымаем такую крыніцу.

Артыкул на тарашкевіцы пра Вікіпедыю, адміністратараў і правілы

— Ці адчуваецца падтрымка Беларускай Вікіпедыі з боку міжнароднай супольнасці, калі казаць пра Google?

— Беларуская Вікіпедыя за апошні час стала займаць вышэйшае месца на старонцы пошуку. Аднак ёсць свае нюансы: у большасці беларусаў будзе расейскамоўны інтэрфейс, а значыць, што артыкул з расейскай Вікіпедыі будзе на першым месцы, нават калі рабіць запыт па-беларуску. Артыкул з беларускай Вікіпедыі можа быць як на другім, так і на дваццаць другім месцы. Расейскі Yandex выдае артыкулы з беларускай Вікіпедыі лепш за амерыканскі Google.

Таксама ёсць праблема нябачнасці даных раздзела з акадэмічным правапісам. Google карыстаецца базай даных Wikidata і падцягвае ў правы бок старонкі картку з кароткай інфармацыяй (напрыклад, пра вядомых асобаў). І калі загугліць што-небудзь напісанае акадэмічным правапісам, у тую картку чамусьці падцягваюцца звесткі з «тарашкевіцы». Хтосьці ўвёў тарашкевіцу па змоўчанні як асноўны беларускі правапіс, хаця ён не з’яўляецца афіцыйным. Пры гэтым інтэрфейс Google аформлены «школьным» правапісам.

— Як, на ваш погляд, рэдактары могуць паўплываць на гэтую сітуацыю?

— Фактычна ніяк. Тут трэба ўмешвацца палітычным структурам. Амерыканскія карпарацыі не цікавяцца тым, наколькі прадстаўленая беларуская мова на іх сервісах, і ці ёсць яна там наогул. Бо яны не могуць на гэтым зарабіць. Такое стаўленне ў іх да многіх невялікіх моваў, і ў гэтым сэнсе мы не адзінокія. Праблема не толькі ў тым, што Google не выдае беларускую, а ў тым, што ў Беларусі ёй мала карыстаюцца.

— Калі вяртацца да тэмы актыўнасці ў беларускай Вікіпедыі, як заахвоціць больш людзей далучацца да напісання артыкулаў?

— Канешне, прымусова нікога не пасадзіш, адназначнага адказу, як прыцягнуць людзей пісаць артыкулы ў Вікіпедыю, я не маю. Да гэтага мусіць быць уласнае памкненне. Можна сто раз расказаць чалавеку, як лёгка правіць Вікіпедыю, але ён не зробіць ніводнай праўкі, і наадварот — чалавек, які не мае ніякага ўяўлення пра тое, як пісаць у Вікіпедыю, прыйдзе і сам пачне разбірацца ва ўсім з нуля.

Не магу сказаць, што галоўная праблема беларускіх Вікіпедый у адсутнасці рэдактараў. Для невялікай еўрапейскай моўнай супольнасці, якая знаходзіцца ў дыскрымінацыйным становішчы, нас даволі шмат.

Беларуская Вікіпедыя большая за раздзелы на еўрапейскіх мовах, якія з’яўляюцца адзінымі дзяржаўнымі ў сваіх краінах. Грэчаскай мовай валодае 13 млн чалавек, але грэчаская Вікіпедыя трохі меншая за беларускую.

Для нас як рэдактараў сёння куды больш важна, каб крыніцы былі даступныя, каб было па чым пісаць артыкулы. Сёння адной з асноўных праблем з’яўляецца тое, што многія крыніцы папяровыя і не заўсёды ёсць у бібліятэках. Вялікая колькасць інфармацыі не выходзіць у інтэрнэт.

Для нас важна, каб усё было даступна анлайн: фотаздымкі і біяграфічныя звесткі публікаваліся пад свабоднымі ліцэнзіямі, а творы, якія перайшлі ў грамадскі набытак, сканаваліся. Музеі маглі б сканаваць карціны і кнігі.

У заходніх краінах гэтая практыка вельмі папулярная, бо стала вядома, што музеі нічога ад гэтага не губляюць: людзі ўсё адно іх наведваюць, каб паглядзець карціны. Праз Вікіпедыю магчыма папулярызаваць музеі. У Беларусі ж такая практыка амаль адсутнічае, усё вельмі закрытае. Музеі і архівы не супрацоўнічаюць з беларускай Вікіпедыяй, бо адсутнічаюць загады ад вышэйшых інстанцый. Прапаганда Вікіпедыі — гэта добра, але яна не можа працаваць так, як нам бы хацелася.

Неабавязкова пісаць пра вайскоўцаў, палітыкаў і гістарычных дзеячаў, калі ў вас да гэтага не ляжыць душа. Сфера дзейнасці шырокая.

У беларускай Вікіпедыі мала артыкулаў пра сучасныя фільмы і камп’ютарныя гульні. Калі вам падабаецца нейкі акцёр ці актрыса, альбо камп’ютарная гульня, можна паглядзець, ці ёсць пра гэта артыкул у Вікіпедыі, і па жаданні дадаць. Гэта самы просты шлях, як увайсці ў Вікісупольнасць.

— Ці часта ў Беларускай Вікіпедыі вядзецца праца над паляпшэннем старых артыкулаў?

— Рэч у тым, што наш раздзел невялікі. Хоць мы добра спраўляемся з колькасцю артыкулаў на душу насельніцтва ў параўнанні нават з украінцамі і расейцамі, агульная колькасць рэдактараў у нас меншая. Гэта стварае праблему з чалавечымі рэсурсамі. І часта бывае, што артыкул пра нейкую калісьці актуальную падзею, які быў распачаты даўно, працягвае існаваць у такім жа выглядзе і на сёння.

У вялікіх раздзелах такіх праблем няма, бо там заўсёды падтрымліваецца актуальнасць і падпраўляецца тэкст. Мы як рэдактары не можам пастаянна падтрымліваць актуальнасць, бо колькасць такіх артыкулаў расце. Перыядычна мы пераафармляем іх і дапісваем, але нашых магчымасцяў мала, каб рабіць гэта добра. У беларускай Вікіпедыі можна знайсці якую-небудзь біяграфію і пабачыць, што з 2018 года там нічога не абнаўлялася.

Я вельмі спадзяюся на штучны інтэлект, што вялікія раздзелы будуць хутка перапісвацца пад актуальную інфармацыю, а малыя раздзелы будуць мець магчымасць з дапамогай нейрасетак у адзін клік перакладаць новыя дадаткі і абнаўленні. Пакуль да гэтага яшчэ далёка.

Я спрабаваў карыстацца ChatGPT для стварэння артыкулаў і заўважыў, што шмат месцаў у тэкстах выглядаюць ненадзейнымі. Гэта пакуль яшчэ не той інструмент, якім можна карыстацца штодзень, але за гэтым, відавочна, будучыня Вікіпедыі.

Чытайце таксама:

Ціханоўская на Саміце штучнага інтэлекту расказала пра пяць варыянтаў, як тэхналогіі ШІ могуць дапамагчы дэмруху

Ціханоўская ў Давосе сустрэлася з заснавальнікам Вікіпедыі і падзякавала за «канчатковае вырашэнне» беларускага пытання

«Белоруссии» больш няма. Артыкул у рускай Вікіпедыі канчаткова перайменавалі

Навукоўцы высветлілі, што людзі чытаюць Вікіпедыю абсалютна па-рознаму — усё залежыць ад узроўню адукацыі

Прызналі «экстрэмісцкімі» суполкі аматараў беларускамоўнай Вікіпедыі

Каментары да артыкула