Eng

17-21 июня 2024 г. курс "Введение в неасимптотическую статистику", Максим Федотов (Университет Помпеу Фабра, ЭФ-21)

17-21 июня 2024 г. курс "Введение в неасимптотическую статистику", Максим Федотов (Университет Помпеу Фабра, ЭФ-21)

17-21 июня 2024 г. на экономическом факультете МГУ мини-курс "Введение в неасимптотическую статистику" прочитает Максим Федотов (аспирант Университета Помпеу Фабра (Барселона), выпускник ПАН-группы ЭФ МГУ-2021).

Регистрация до 18:00 16.06.24 по ссылке: https://forms.gle/dzKEe3new4QLbZjL7

Контакты: smu.econ218@yandex.ru

Описание курса

В эпоху больших данных, размеры массивов информации неустанно растут. Случается даже так, что количество факторов в регрессии – современном двигателе индустрии и многих наук – может оказаться сравнимым с числом наблюдений и иногда даже превышать его. В такой ситуации, стандартные асимптотические результаты из статистики, при выводе которых количество факторов зачастую принимается фиксированным, а число наблюдений – растущим, попросту не могут быть применены. Эта проблема возникает в большом количестве важных областей применения, таких как биомедицинская статистика, финансы и обработка сигналов. Таким образом, гарантии для методов оценивания и вывода на высокоразмерных данных просто необходимы. 

Здесь нам поможет неасимптотический подход. Он являет собой весьма грозное оружие в борьбе за статистическую истину и широко применим сам по себе, тогда как высокоразмерные задачи представляют одно из его увлекательных приложений. Именно поэтому мы начнем с основ неасимптотической статистики, а именно – с концентрационных неравенств, служащих верными проводниками в поиске изящных вероятностных аргументов. Мы рассмотрим задачу минимизации эмпирического риска и подходы к описанию классов предсказательных моделей с точки зрения максимального отклонения от наилучшего теоретического результата. В дополнение, мы обсудим концепцию минимаксной нижней границы ошибки оценивания, достижимой вне рамок конкретных методов или алгоритмов. Завершим мы тем, с чего начиналось это описание курса – статистическим оцениванием и выводом в пространствах высокой размерности, и особое внимание уделим вероятностным гарантиям для регрессии Lasso.

Пререквизиты (для кого курс)

Для комфортного освоения курса студентам нужно уверенно владеть базовыми концепциями из курсов теории вероятностей и математической статистики. Пройденный курс по эконометрике будет полезен, так как он вводит, среди прочего, асимптотические результаты для регрессии и помогает развить необходимую интуицию. Однако, может быть достаточно и поверхностного ознакомления с задачей регрессии и классификации.

Формат: очные занятия в здании экономического факультета МГУ, без трансляции, без записи

Расписание

Курс проходит с 17 по 21 июня:

День 1: 17 июня Лекция – 16:30-18:30, аудитория 539 (5 этаж)

День 2: 18 июня Лекция + Семинар – 15:40-18:50, аудитория 541 (5 этаж)

День 3: 19 июня Лекция – 16:30-18:30, аудитория 541 (5 этаж)

День 4:  20 июня Лекция + Семинар – 15:40-18:50, аудитория 541 (5 этаж)

День 5: 21 июня Лекция – 16:30-18:30, аудитория 541 (5 этаж)

Литература:

  1. Bach, Francis. "Learning theory from first principles." Draft of a book, version of December 25, 2023.
  2. Boucheron, Stéphane, Gábor Lugosi, and Pascal Massart. Concentration Inequalities: A Nonasymptotic Theory of Independence Oxford, 2013; online edition, Oxford Academic, 23 May 2013.
  3. Devroye, Luc, László Györfi, and Gábor Lugosi. A probabilistic theory of pattern recognition. Vol. 31. Springer Science & Business Media, 2013.
  4. Giraud, Christophe. Introduction to high-dimensional statistics. Chapman and Hall/CRC, 2021.
  5. Vershynin, Roman. High-dimensional probability: An introduction with applications in data science. Vol. 47. Cambridge university press, 2018.
  6. Wainwright, Martin J. High-dimensional statistics: A non-asymptotic viewpoint. Vol. 48. Cambridge university press, 2019.

Лекции:

  1.  “High Dimensional Statistics” at MIT] Rigollet, Philippe and Hutter, Jan-Christian. High-Dimensional Statistics. Lecture notes, October 29, 2023.
  2. “Algorithmic foundations of learning” at Oxford] Patrick Rebeschini, 2021.
  3. “Advanced Statistical Theory” at CMU] Alessandro Rinaldo, 2019.


11 June 2024