Open space для компьютерных лингвистов

В минувшую субботу, 14 апреля, в Петербурге состоялась первая конференция по компьютерной лингвистике, организованная по принципу «открытого пространства» (open space). Основная идея встречи – собрать в одном месте студентов, преподавателей вузов и представителей ИТ-компаний для обсуждения проблем на рынке компьютерной лингвистики и нахождения способов эффективного взаимодействия научных, образовательных и коммерческих структур. Инициаторами мероприятия стали проект Mathlingvo и отдел молодых филологов филологического факультета Санкт-Петербургского государственного университета (СПбГУ). Прошло оно при поддержке СПбГУ и «Клуба директоров Санкт-Петербурга». Спонсором выступила компания Sun Microsystems.

Компьютерная лингвистика – это прикладное направление, ориентированное на использование компьютерных инструментов (ПО, компьютерных технологий организации и обработки данных и т.д.) для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д. Сюда относят практически все, что связано с использованием ИТ в языкознании. В списке задач компьютерной лингвистики – распознавание и синтез речи, анализ и генерация текстов, диалоговые системы, машинный перевод, составление электронных онтологий и словарей и т.п. Сегодня компьютерная лингвистика востребована при построении диалоговых интерфейсов, систем машинного перевода и в таких задачах как информационный поиск и анализ и генерация текстов.

Проект Mathlingvo работает в соответствии с инновационной образовательной концепцией Ad-hoc Education, целью которого является создание и поддержка образовательных междисциплинарных студенческих проектов по компьютерной лингвистике. Данная инициатива основывается на применении образовательной модели Project-based learning (PBL). Среди задач этой инициативы - исследовательская работа с возможной последующей коммерциализацией разработок, привлечение студентов в реальные проекты, выполнение научно-исследовательских работ, дополнительная подготовка кадров и т.д.

Встреча 14 апреля проводилась в формате «открытого пространства». Такой подход подразумевает разделение участников на группы, каждая их которых обсуждает определенные тематики. Вопросы для обсуждения были предложены перед стартом мероприятия, и задать их мог любой желающий. В дальнейшем слушатели могли принять участие в любой из предложенных дискуссий, а также менять группы. Всего в рамках субботней встречи было рассмотрено 15 вопросов. Она была разбита на две сессии, каждая из которых длилась один час. Среди вопросов, которые были обсуждены на встрече – уровень обучения и подготовки специалистов по компьютерной лингвистике, взаимодействие ИТ-компаний со студентами данной специальности, создание открытых лингвистических ресурсов и программ, взаимодействие технологий Open Source и компьютерной лингвистики и т.п.

Общий замысел организаторов встречи – создать площадку, где могли бы встретиться все три стороны, участвующие в процессе формирования данного рынка: будущие специалисты, вузы, которые их готовят, и потенциальные работодатели. «Компьютерная лингвистика является направлением ИТ-рынка, которое, несомненно, будет расти. За последнее время появилось и продолжает появляться большое число электронных текстов, в частности, в сети Интернет. В связи с этим средства для распознавания текстов и речи становятся все более актуальными и востребованными», - отметил специалист по компьютерной лингвистике проекта Mathlingvo Виктор Бочаров. Указанная встреча стала первым мероприятием, посвященным компьютерной лингвистике, такого масштаба, которое было организовано при участии проекта Mathlingvo. Из предыдущих его инициатив можно упомянуть небольшую конференцию, прошедшую в июле прошлого года. На ней обсуждались возможности применения технологий компьютерной лингвистики для бизнеса. По словам Виктора Бочарова, один из выводов, сделанных тогда, – констатация существования большого разрыва между научными разработками в этой области и их практическим применением.

Спонсором мероприятия выступила корпорация Sun Microsystems. Помимо этого в встрече приняли участие такие ИТ-компании, как PROMT, ABBYY, «Центр речевых технологий», Vocative, Speereo, AudiTech, Alt Linux и др. Основной причиной участия в мероприятии для них стал кадровый вопрос. «Поиск специалистов – это всегда актуальная задача. Но, кроме того, нам было интересно понять, как и в каком направлении сегодня развивается лингвистическое сообщество», - отметил вице-президент компании SpeeReo Олег Малеев. «Встреча собрала всех тех, кто занимается проблемами языка, обсудить которые было очень полезно. Кроме того, мы пытаемся найти заинтересованных студентов, которых в дальнейшем можно было бы принять на работу. Компьютерная лингвистика сейчас набирает обороты. Толчком к этому стал перевод большого числа тестов в электронный формат и развитие ИТ-рынка в целом», - прокомментировал научный директор компании AudiTech Андрей Викторов. «На этом мероприятии нас интересуют два момента. В первую очередь это возможность познакомиться и пообщаться с партнерами. Во-вторых, нам интересна сама по себе идея проведения такой встречи, т.к. компьютерная лингвистика – перспективное направление», - резюмировал генеральный директор компании Vocative Валентин Смирнов.

Автор: Наталья Чумарова.

Тематики: Интернет, Маркетинг, ПО, Кадры, Web

Ключевые слова: