Редактор белорусской Википедии: Будущее проекта — за искусственным интеллектом
«Менск і Мінск — дзве паловы сталічнай душы», — поет в песне Лявон Вольский. Известная шутка, что у белорусов всего по два, находит свое отражение даже в Википедии. Их у нас тоже две — с классическим правописанием и школьным. Но только ли в правописании разница? Один из редакторов белоруской Википедии Андрусь (имя изменено в целях безопасности), говорит, что не только. А в чем именно? Budzma.org пообщалась с ним об этом, а также об объективности информации, динамике развития обеих версий и основных проблемах, с которыми сталкиваются редакторы.

— Расскажите, какие имеются различия в двух разделах Википедии — официального и классического правописания.
— Изначально это был один раздел, в котором разные редакторы пытались договариваться и писать двумя правописаниями. Подходы к написанию статей никак не отличались. Но это не дало никакого результата, так как вся энергия уходила на пустые споры о правописании, в результате чего белорусскую Википедию разделили на две. Сегодня, кроме правописания, различие между разделами заключается в основном в том, что в разделе на тарашкевице используются исторические названия белорусских городов, которые в советское время были переименованы. Такой подход не применяется последовательно: некоторые улицы, имеющие советские названия, остаются с теми же названиями в статьях.
Долгие годы между двумя разделами не было сильного идеологического противостояния. Но в последние годы ситуация изменилась.
Раздел на тарашкевице стал значительно отходить от заложенных в Википедию принципов нейтральности. Редакторы «тарашкевицы» фактически создают альтернативную реальность.
Если там открыть статью «Беларусь», можно увидеть в качестве официального символа бело-красно-белый флаг, единственным государственным языком — белорусский, а президентом — Светлану Тихановскую. И тут возникает вопрос: если у нас все хорошо, в чем тогда проблема белорусов? Эта страница отражает ожидания и желания редакторов, но не реальность. На этой почве возникает новый конфликт между разделами.

Если отбросить идеологические различия, редакторы «тарашкевицы» также отрицательно относятся к созданию статей на основе переводов из русского раздела. В «наркомовке» такого нет: любая информация будет ценной. Конечно, при создании статей на белорусскую тематику лучше писать по имеющимся источникам, но статью о какой-нибудь англо-бурской войне, которая хорошо написана в русской Википедии, лучше перевести.
Википедия не ставит целью создание уникального белорусского контента, ее цель — предоставлять знания на белорусском языке.
— Можно ли сказать, что активность в «тарашкевице» значительно ниже, чем в «наркомовке»?
— Это естественно. Изначально проект «тарашкевицы» был широко представлен в интернете. Есть статистика, согласно которой в 2007 году количество активных редакторов «тарашкевицы» составляло 57 человек, а «наркомовки» — 39. На данный момент ситуация иная: раздел с официальным правописанием значительно вырос по числу авторов. Нельзя сказать, что активность в разделе с классическим правописанием нулевая. Но количество редакторов не растет с 2009 года: их как было 120, так и остается.
Причиной этого может быть то, что новые авторы просто не знают, как писать на тарашкевице. В школе это правописание не изучают, а словарей на нем — минимальное количество. Непонятно, где и как проверять эти слова, потому что программ для проверки правописания тоже немного. Человеку, окончившему белорусскую школу, сложно адаптироваться к нему. Тарашкевица — это не просто мягкие знаки между «н», она имеет более сложные правила, которые приходится учить с нуля. «Школьное» академическое правописание наиболее распространено, и людям на нем удобнее писать.
— Были ли попытки объединения двух разделов в один?
— После разделения белорусской Википедии об этом не шло разговоров. На рубеже 2000-х — 2010-х годов был сильный конфликт между двумя разделами. Редакторы обвиняли друг друга в краже статей, якобы они переписывают чужие тексты и адаптируют под свое правописание. Это были вечные споры. С 2014 года раздел с академическим правописанием значительно вырос по количеству статей, и конфликт с «тарашкевицей» начал затихать. Потому что уже было ясно, какой раздел будет первым, и этому ничего нельзя было противопоставить.
На сегодняшний день два раздела существуют как параллельные проекты, никак не связанные между собой. Редакторы «наркомовки» знают некоторых редакторов «тарашкевицы», но не видят необходимости объединяться.
— Если говорить о темах, каких статей не хватает в белорусской Википедии?
— Мне кажется, что все темы хоть как-то представлены в обеих Википедиях. Но не хватает статей по точным и естественным наукам. В то время как достаточно статей о разных биографиях, исторических событиях, книгах. Многие могут подумать, что это из-за отсутствия специализированной терминологии. Однако с терминологией все в порядке, так как хватает белорусских тематических словарей. И много слов в научных статьях составляют интернационализмы.
Также есть проблема с религиозными темами, где как раз возникают сложности с переводами. Например, церковнославянский язык сложно переводится на белорусский, чтобы сохранить в нем узнаваемый облик слов с религиозной терминологией. В Беларуси две основные конфессии, где почти каждый термин и имя будут различаться по написанию. Эта вариативность создает проблемы, и из-за этого мало кто хочет углубляться в такие темы.
В разделах есть и свои перекосы. Например, в разделе «тарашкевицей» массово создаются статьи о именах литвинов. И они никогда не появятся в Википедии с академическим правописанием, потому что для наших редакторов источники, использованные для написания этих статей, являются маргинальными.
Есть примеры, когда в одном разделе что-то есть, а в другом нет, потому что мы не принимаем тот источник за надежный. Например, редакторы раздела с классическим правописанием ссылались на автора Алехно Дайлида, публикующего самиздатом свои книги и исследования в интернете. Его имя — это псевдоним. Себя он обозначает как бакалавр гуманитарных наук (то есть просто выпускник университета). Нет никакой критики (ни положительной, ни отрицательной) на публикации этого анонима от ученых, поэтому мы не принимаем такой источник.

— Ощущается ли поддержка Белорусской Википедии со стороны международного сообщества, если говорить о Google?
— Белорусская Википедия за последнее время стала занимать более высокие позиции в результатах поиска. Однако есть свои нюансы: у большинства белорусов интерфейс будет русскоязычным, а значит, статья из русской Википедии окажется на первом месте, даже если запрос делать по-белорусски. Статья из белорусской Википедии может быть как на втором, так и на двадцать втором месте. Российский Yandex выдает статьи из белорусской Википедии лучше, чем американский Google.
Также существует проблема невидимости данных раздела с академическим правописанием. Google использует базу данных Wikidata и подгружает в правую часть страницы карточку с краткой информацией (например, об известных личностях). И если загуглить что-либо, написанное академическим правописанием, в эту карточку почему-то подтягиваются сведения из «тарашкевицы». Кто-то ввел тарашкевицу по умолчанию как основное белорусское правописание, хотя оно не является официальным. При этом интерфейс Google оформлен «школьным» правописанием.
— Как, на ваш взгляд, редакторы могут повлиять на эту ситуацию?
— Фактически никак. Тут нужно вмешательство политических структур. Американские корпорации не интересуются тем, насколько представлен белорусский язык на их сервисах и есть ли он там вообще. Потому что они не могут на этом заработать. Такое отношение у них ко многим малым языкам, и в этом смысле мы не одиноки. Проблема не только в том, что Google не выдает белорусский язык, а в том, что в Беларуси им мало пользуются.
— Если вернуться к теме активности в белорусской Википедии, как привлечь больше людей к написанию статей?
— Конечно, принудительно никого не заставишь, однозначного ответа, как привлечь людей писать статьи в Википедию, у меня нет. Для этого должно быть собственное стремление. Можно сто раз рассказать человеку, как легко редактировать Википедию, но он не сделает ни одной правки, и наоборот — человек, не имеющий никакого представления о том, как писать в Википедию, придет и сам начнет разбираться во всем с нуля.
Не могу сказать, что главная проблема белорусских Википедий — отсутствие редакторов. Для небольшого европейского языкового сообщества, находящегося в дискриминационном положении, нас довольно много.
Белорусская Википедия больше, чем разделы на европейских языках, которые являются единственными государственными в своих странах. Греческим языком владеют 13 миллионов человек, но греческая Википедия немного меньше белорусской.
Для нас, как для редакторов, сегодня куда более важно, чтобы источники были доступны, чтобы было на основе чего писать статьи. Сегодня одной из основных проблем является то, что многие источники бумажные и не всегда есть в библиотеках. Большое количество информации не публикуется в интернете.
Для нас важно, чтобы все было доступно онлайн: фотографии и биографические сведения публиковались под свободными лицензиями, а произведения, перешедшие в общественное достояние, сканировались. Музеи могли бы сканировать картины и книги.
В западных странах эта практика очень популярна, потому что стало известно, что музеи ничего от этого не теряют: люди все равно их посещают, чтобы посмотреть картины. Через Википедию можно популяризировать музеи. В Беларуси же такая практика практически отсутствует, все очень закрыто. Музеи и архивы не сотрудничают с белорусской Википедией, потому что отсутствуют распоряжения от вышестоящих инстанций. Продвижение Википедии — это хорошо, но оно не может работать так, как нам бы хотелось.
Не обязательно писать о военных, политиках и исторических деятелях, если у вас к этому не лежит душа. Сфера деятельности широка.
В белорусской Википедии мало статей о современных фильмах и компьютерных играх. Если вам нравится какой-то актер или актриса, либо компьютерная игра, можно посмотреть, есть ли об этом статья в Википедии, и при желании добавить. Это самый простой способ войти в Викисообщество.
— Часто ли в Белорусской Википедии ведется работа над улучшением старых статей?
— Дело в том, что наш раздел небольшой. Хотя мы хорошо справляемся с количеством статей на душу населения по сравнению даже с украинцами и россиянами, общее число редакторов у нас меньше. Это создает проблему с человеческими ресурсами. И часто бывает, что статья о каком-то когда-то актуальном событии, начатая давно, продолжает существовать в таком же виде и сегодня.
В крупных разделах таких проблем нет, потому что там всегда поддерживается актуальность и корректируется текст. Мы, как редакторы, не можем постоянно поддерживать актуальность, потому что количество таких статей растет. Периодически мы их переоформляем и дописываем, но наших возможностей мало, чтобы делать это хорошо. В белорусской Википедии можно найти какую-нибудь биографию и увидеть, что с 2018 года там ничего не обновлялось.
Я очень надеюсь на искусственный интеллект, что в крупных разделах статьи будут быстро переписываться с учетом актуальной информации, а малые разделы получат возможность с помощью нейросетей в один клик переводить новые дополнения и обновления. Пока до этого еще далеко.
Я пробовал использовать ChatGPT для создания статей и заметил, что во многих местах тексты выглядят ненадежными. Это пока еще не тот инструмент, которым можно пользоваться ежедневно, но за этим, очевидно, будущее Википедии.
Тихановская на Саммите искусственного интеллекта рассказала о пяти вариантах, как технологии ИИ могут помочь демдвижению
Тихановская в Давосе встретилась с основателем Википедии и поблагодарила за «окончательное решение» белорусского вопроса на площадке
«Белоруссии» больше нет. Статью в русской Википедии окончательно переименовали
Ученые выяснили, что люди читают Википедию абсолютно по-разному — все зависит от уровня образования
Признали «экстремистскими» сообщества любителей белорусскоязычной Википедии
Комментарии
ИИ - всего лишь инструмент при помощи которого решаются задачи.
Тысячи лет назад человекообезьяны не кричали, что будущее за колесом.