Компьютерная лингвистика: изучаем язык запросов

Лекция / семинар сайт события http://events.yandex.ru/events/science-seminars/Plakhov-apr-18/

Добавить в календарь:
Поделиться:

Информационные технологии меняют жизнь людей, привнося в них новое. Некоторые изменения становятся настоящей неожиданностью. Например, поисковые запросы пользователей, которые раньше никак не отличались от естественного русского языка, со временем образовали своего рода отдельный язык. Он отличается от привычного нам языка общения синтаксисом, своим набором идиом и даже собственными «частями речи».

На научно-техническом семинаре 18 апреля Андрей Плахов, разработчик Яндекса, расскажет про язык русских поисковых запросов и его свойства. Слушатели также узнают о том, что такое модели усвоения языка и что получится, если эти модели применить к языку поисковых запросов.

Участие в семинаре бесплатное, однако регистрация обязательна.

В день семинара на этой странице будет вестись видеотрансляция. Для просмотра трансляции регистрироваться не нужно.


Тезисы и спикеры

Интернет-математика

Язык поисковых запросов как естественный язык

Языки, на которых пользователи интернет-поиска составляют свои поисковые запросы, появились на наших глазах. Лексически они слабо отличимы от более привычных нам языков, например, русского или английского, и в начале своего существования совпадали с родительскими языками. Но языки поисковых запросов быстро отошли от родительских и обзавелись собственными наборами идиом, синтаксисом и даже особыми «частями речи». Небольшой размер и простота их грамматик, а также возможность изучать полное множество высказываний, порожденных на таких языках, делают их идеальными модельными объектами для тестирования моделей усвоения языка.

В докладе будут рассмотрены свойства языка русских поисковых запросов и приведены результаты тестирования на нём различных моделей усвоения языка.

Андрей Плахов, Яндекс

Закончил с отличием механико-математический факультет МГУ в 2002 году. Защитил кандидатскую диссертацию по программированию в Институте прикладной математики им. Келдыша РАН. В Яндексе — пять лет, всё это время занимается повышением качества веб-поиска. Автор поискового релиза «Спектр». До Яндекса в течение семи лет делал компьютерные видеоигры. Внерабочие интересы: P-NP проблема, квантовые вычисления, структурная лингвистика, системная биология, рисование слонов шариковой ручкой.

Во весь экран
  • Основной критерий отбора данных – это степень близости примера к текущей оцениваемой границе классов #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:53
  • При обучении на всех данных наиболее информативным примерам назначаются метки, остальные участвуют в обучении без меток #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:50
  • Получение новых меток должно способствовать уменьшению ошибки обучающегося на новой информации классификатора #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:46
  • При обучении нейронной сети попутно с задачей классификации стоит решать и задачу аппроксимации плотности #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:33
  • При недостаточно количестве меток при обучении нейронной сети возникают большие проблемы как на входе, так и на выходе #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:31
  • На #yascience сегодня подозрительно мало людей, при очень интересной лекции. Artem @mMaxy85 25.04.2013 19:25
  • Гибридные алгоритмы на графах: узлами служат все обучающие примеры, а ребрами соединены пары ''близких'' примеров #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:22
  • В гибридном обучении предположения о характере данных позволяют эффективно использовать примеры без меток #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:16
  • Основные вопросы: пространство входных признаков, использование примеров без меток, стратегия сбора новых данных о выходах #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:15
  • Решил остаться на работе и посмотреть доклад online, крайне растроен тем, что не грузятся трансляция и слайды #yascience #ML Igor Karbachinsky @karbachinsky 25.04.2013 19:11
  • Сегодня Андрей рассказывает про активное обучение при малой доле примеров с известными ответами #yascience #ML Яндекс.Events @ya_events 25.04.2013 19:05
  • @btromanova @fantasy1408 Ну прошлый доклад был дельный в #yascience, пожалел, что не сходил -было что поспрашивать) И 25 тема клевая Andrey Murashev @Nord786 18.04.2013 22:28
Показать еще

Комментарии (0):

Оставлять комментарии могут только зарегистрированные пользователи

Для получения embed кода необходимо кликнуть правой
кнопкой мыши на видео и выбрать пункт меню
'Сгенерировать HTML код'

Забыли пароль? Регистрация