Еврокампус

Из лингвиста в программисты: личный опыт выпускницы магистратуры по компьютерной лингвистике Erasmus+

Анастасия Серебрянникова разрабатывает компьютерные программы в немецкой компании – и не перестает себе удивляться: «Никогда не думала, что я, девочка с филфака, смогу быть компьютерщиком».

В 2016 году она закончила отделение теоретической и прикладной лингвистики филологического факультета МГУ — а потом поступила в магистратуру Erasmus+ по компьютерной лингвистике Language & Communication Technologies (LCT). О том, как она училась и как магистратура изменила ее жизнь, Анастасия рассказала «Европульсу».

Что такое компьютерная лингвистика

Компьютерная лингвистика – это прежде всего математика и программирование. Специалист в этой области пишет настоящие компьютерные программы на разных языках программирования или строит полноценные математические модели. Только описывают они довольно специфический объект – естественную человеческую речь. То есть от теоретической лингвистики и тем более классической филологии компьютерная лингвистика достаточно далеко.

Специалист по компьютерной лингвистике должен разбираться в том, как устроен живой язык, но при этом он должен уметь программировать. Эти навыки нужны, например, чтобы учить роботов распознавать человеческую речь и говорить самим, переводить тексты или автоматически их аннотировать, создавать поисковые системы.

Сейчас я разрабатываю софт, который сможет генерировать красивый текст на основе сухих данных. Например, описание товаров в интернет-магазине или отелей на туристическом сайте. Все описания должны быть достаточно интересными и отличаться друг от друга: у вас 100 тысяч наименований, человеку с такой работой не справиться, и ее надо автоматизировать.

Как попасть на программу

Мне нравилось учиться в МГУ. В программе помимо теоретической лингвистики была математика, а еще мы каждое лето ездили в экспедиции по России, чтобы изучать языки различных коренных народов — алтайские, финно-угорские и так далее. Это было весело. Но что я буду делать после окончания бакалавриата, я плохо представляла.

Все изменилось, когда на третьем курсе я поехала на стажировку в Берлин и поняла, что дальше я хочу учиться только в Европе. Примерно тогда же пришло осознание того, что я хочу найти прикладное занятие, имеющее связь с реальным миром. А в МГУ скорее готовят теоретических лингвистов, которые потом уходят в науку.

Компьютерная лингвистика показалась мне отличным вариантом. У меня уже был приличный бэкграунд в лингвистике, надо было только подтянуть программирование.

Поэтому весь четвертый курс я искала варианты магистратуры в Европе. И программа LCT по Erasmus+ мне просто идеально подошла.

Единственный экзамен, который нужно сдавать, чтобы поступить – это английский язык. Студентам нужен сертификат TOEFL или IELTS. В остальном отбор идет на основании документов: диплома, рекомендаций преподавателей из «домашнего» университета и длинной анкеты-резюме, где нужно указать все свои достижения и знания разных дисциплин.

Мне кажется, координаторы LCT смотрят в основном именно на математические навыки, потому что гуманитарные знания добрать легко, а вот если ты не знаешь, что такое теория вероятности, в компьютерной лингвистике будет очень тяжело.

При подаче заявки кандидаты указывают, в каких двух из семи университетов консорциума LCT они хотели бы учиться. По правилам программы Erasmus+ ты один год учишься в одном университете, второй год – в другом. Ты указываешь свои пожелания, но решение принимают координаторы, исходя из твоей подготовки.

Мне повезло, я попала в оба университета, которые выбрала — Карлов университет в Праге (Charles University in Prague) и нидерландский университет Гронингена (University of Groningen). А выбирать было из чего. У каждого из семи университетов консорциума есть своя специализация, например, на нейронных сетях или на распознавании речи.

Разница между двумя университетами одной магистратуры

Первый год я провела в Карловом университете. Там очень сильная математика и программирование. Если студенты программы жалуются на этот университет – то из-за того, что там сложно. Претензии студентов в других университетах, скорее, относятся к организационной части – преподаватели плохо говорят на английском или координаторы недостаточно помогают студентам.

После самого адового курса за всю магистратуру — по структурам данных — я почувствовала себя настоящим программистом. Курс был очень сложным и теоретически, и практически. Первое же задание, которое нам дали, требовало знаний об устройстве памяти и работе процессора, которых у меня и в помине не было: за последние три года я вообще не программировала, и именно этому меня никогда не учили. Зато, когда я сдала этот курс, я знала, что теперь могу все – программировать уж точно.

Про университет Гронингена можно сказать, что он самый междисциплинарный из всех. Там наша программа была прикреплена к факультету искусств, и можно было брать самые разные курсы. Я опять старалась выбрать более практические, связанные с программированием (лингвистики мне хватило в бакалавриате). Но можно было выбрать гуманитарные курсы — например, в области психологии.

Подходы к преподаванию в этих двух университетах заметно различаются. В Праге система больше похожа на российскую. Там много обязательных предметов, и тебе стараются дать фундаментальные, общие знания. Например, те теоремы, которые мы доказывали на курсе по структурам данных, мне никак не пригодились с тех пор. Но именно благодаря этому курсу я поняла принципы работы многих алгоритмов, применяемых в информатике, и перестала шарахаться от формул с интегралами.

А в Гронингене более европейская система – она готовит очень узких специалистов. И в какой области быть узким специалистом – решать должен сам студент в процессе учебы. Там целый курс может быть посвящен одной узкой теме – например, одному лингвистическому корпусу (так называется специально организованная база данных для лингвистов) и как с ним работать.

 

Летняя стажировка с нейронной сетью

Лето после первого курса я решила посвятить стажировке и начала искать ее в университетах-партнерах программы. В LCT есть два не европейских университета, которые раньше были в консорциуме, а сейчас считаются просто партнерскими – один в Мельбурне, другой в Шанхае.

Я попала в Шанхай и провела там полтора месяца летом. Я помогала одному докторанту с его исследованием в сфере оценки тональности текста – это когда компьютер должен распознать, положительную или отрицательную оценку дает автор в своем тексте. Например, в рецензии – похвалил автор фильм или обругал?

На стажировке я написала небольшую нейронную сеть, которая помогала анализировать тональность текстов.

«Вам пойдут навстречу»

Последний семестр вместе с написанием магистерской диссертации я провела тоже в Карловом университете. Вообще-то такое поведение не очень одобряется руководством программы: нам выдают двойной диплом, и по правилам надо провести одинаковое количество времени в обоих университетах.

Но мне так понравилось в Карловом университете и особенно в Праге, что я убедила координаторов, что должна писать диссертацию именно там. И мне пошли навстречу. Вообще координаторы программы к студентам прислушиваются и стараются решить все такие проблемы.

Этот семестр был самым классным за всю магистратуру. Я выбрала интересную тему – как новости влияют на фондовый рынок. Итогом моей работы стала программа, которая на основании новостей от Bloomberg и Reuters могла предсказывать изменения индекса S&P 500. Небольшой спойлер: действительно важных закономерностей найти не удалось, изменения фондового рынка часто носят случайный характер, а если и не случайный, то предсказать это по новостям у вас вряд ли получится. Но было весело!

У меня было два научных руководителя – из обоих университетов. Обычно ты работаешь с одним, а второй присутствует только как подпись на обложке. Но мне удалось заинтересовать своей темой обоих, и в результате каждую неделю я обсуждала работу – во вторник с профессором из Праги, в среду – из Гронингена. Я боялась, что они будут на меня давить и предлагать диаметрально противоположные подходы к решению проблемы, но они оба мне только помогали.

Для меня это было новым и необычным опытом, потому что во время бакалавриата в МГУ я писала работу в полной изоляции. С научным руководителем я встречалась всего 3 раза: когда утверждали тему, когда намечали направление исследования и когда я сдавала работу.

Что можно получить в европейской магистратуре помимо образования

На магистратуре я, конечно, не только забивала голову математикой. В какой-то момент я поняла, что у меня очень круто прокачался английский язык. Раньше, чтобы позвонить и поговорить на английском, надо было долго собираться с духом и морально готовиться. А уже через пару месяцев после начала программы казалось, что ничего естественнее и быть не может.

Еще я много занималась спортом. В Европе потрясающая система поддержки спорта в университетах, особенно в Нидерландах. Студент может купить карточку на год за 60 евро, и в эту сумму входит неограниченное количество занятий на кампусе всем, что только можно. Там я попробовала фехтование, полденс, кикбоксинг, занималась воздушными полотнами – воздушной гимнастикой. Мне кажется, в спорткомплекс я ходила чаще, чем в сам университет.

И, конечно, магистратура – это отличная возможность путешествовать. Для студентов билеты очень дешевые, а когда у тебя появляются друзья по всей Европе, к ним очень удобно ездить в гости. На меня большое впечатление произвел Сан-Себастьян в Испании. Это город прямо на море, и посередине – огромный пляж. Я не представляю, как мои друзья умудрялись там учиться.

 

После магистратуры

Со второго года магистратуры я точно знала, что после выпуска пойду работать. В том, чтобы продолжать академическую карьеру и идти в докторантуру, конечно, тоже есть свои плюсы. Например, очень здорово остаться в студенческой среде. Но я решила, что надо посмотреть, чего стоят в «реальном мире» навыки, которые я получила. К тому же, мне хотелось попробовать что-нибудь новое: училась я к тому моменту уже шестой год, а вот работы у меня никогда не было.

Я готовилась к худшему, поэтому стала искать заранее — еще в марте (а магистратура заканчивается в сентябре). Но мне повезло, и работу я нашла месяца за три.

Когда я только подавалась на эту вакансию, мне показалось, что это не совсем моя тема – требовался программист. Но в итоге я занимаюсь именно компьютерной лингвистикой – правда, с более хардкорной стороны программирования. Лингвистики здесь совсем немного, на уровне «в немецком четыре падежа».

Многие из моих одногруппников пошли в аспирантуру и сейчас учатся в разных университетах Европы и Америки. Я им немного завидую, потому что очень люблю университетскую атмосферу, и мне ее сейчас не хватает. С другой стороны, мне очень нравится моя работа, и я рада, что сделала именно такой выбор. Примерно половина моих одногруппников устроилась на работу, многие оказались в стартапах, занимающихся разработкой искусственного интеллекта.

Мне кажется, основное преимущество, которая дала мне магистратура в Европе — это не знания, а свобода выбора, изменение самоощущения и отношения к миру. Свобода от предрассудков, свобода от клише и возможность заниматься тем, что тебе нравится.

В Германии, например, полно тридцати- и сорокалетних дядечек, которые учатся в бакалавриате — и никто, ни одна живая душа, их за это не осуждает. За то, что они до тридцати с лишним лет «искали себя», не имели постоянной работы и не стремились к некоему «успеху». И это потрясающе. Ехать в Европу учиться нужно прежде всего потому, что там ты перенимаешь это отношение к жизни — легкое, радостное. Ты там учишься тому, что никакое занятие не зазорно, ты волен делать то, что тебе нравится, и то, к чему у тебя лежит душа.