Финансовые технологии и анализ данных
Содержание:
- Бонусы за соревнования
- Соревнования
- Соревнования
- План курса
- Задание 3
- Задание 4
- Полезные материалы
- Сроки контрольных мероприятий
- Научно-исследовательский семинар
- Семинары групп 181, 182
- Преподаватели и ассистенты
- Аттестация и оценки
- Course Description
- Программирование и анализ данных на Python (часть 3)
- Литература
- О курсе
Бонусы за соревнования
За успешное участие в соревнованиях по анализу данных могут быть выставлены бонусные баллы, которые можно прибавить к оценке за любое практическое или теоретическое домашнее задание, а также за самостоятельную работу. Под успешным участием понимается попадание в топ-10% мест; если соревнование особо сложное и крупное, может рассматриваться и попадание в топ-20% мест. Конкретное число баллов определяется преподавателями и зависит от сложности соревнования и занятого места. За одно соревнование можно получить не более 5 баллов. Для получения оценки необходимо предоставить краткий отчёт о решении задачи.
Соревнования
Правила участия и оценивания
В соревновании по анализу данных вам предлагается по имеющимся данным решить некоторую задачу, оптимизируя указанную метрику, и отправить ответы для заданного тестового множества. Максимальное количество посылок в сутки ограничено (как правило, разрешается сделать 2 посылки), ближе к концу соревнования вам будем необходимо выбрать 2 посылки, которые вы считаете лучшими. Тестовые данные делятся на публичные и приватные в некотором соотношении, на основе которых строятся публичный и приватный лидерборды соответственно, при этом публичный лидерборд доступен в течение всего соревнования, а приватный строится после его окончания для выбранных вами посылок.
В лидербордах каждого из соревнований присутствуют несколько базовых решений (бейзлайнов), каждое из которых соответствует определённой оценке. Например, для получения оценки не ниже 8 баллов необходимо, чтобы ваше решение на приватном лидерборде оказалось лучше соответствующего бейзлайна. Далее для студента, преодолевшего бейзлайн на N_1 баллов, но не преодолевшего бейзлайн на N_2 балла, итоговая оценка за соревнование рассчитывается по равномерной сетке среди всех таких студентов в зависимости от места в приватном лидерборде среди них; если быть точными, то по следующей формуле:
N_2 — (N_2 — N_1) * i / M,
где M — количество студентов (из всех студентов, изучающих курс), преодолевших бейзлайн на N_1 баллов, но не преодолевших бейзлайн на N_2 балла;
i — место (начиная с 1) студента в приватном лидерборде среди всех таких студентов.
Единственное исключение из формулы — студенты, преодолевшие самый сильный бейзлайн, получают прибавку 1/M к своей оценке.
Чтобы вас не пропустили при проверке решений соревнования, необходимо использовать следующий формат для имени команды (вкладка Team):
« Имя Фамилия номер_группы»
В течение 3 суток после окончания соревнования в соответствующее задание на anytask необходимо прислать код, воспроизводящий ответы для посылки, фигурирующей в приватном лидерборде. При оформлении кода предполагайте, что данные лежат рядом с ним в папке data, а в результате выполнения кода ответы должны быть записаны в файл solution-N-Username.csv, где N — номер соревнования, Username — ваша фамилия. У нас должна быть возможность запустить код и получить те же ответы, что и в вашей посылке, — в частности, это означает, что:
1. Если вы отправляете файл *.py, мы будем запускать его при помощи команды python *.py в вышеуказанном предположении о местонахождении данных.
2. Если вы отправляете ноутбук *.ipynb, мы последовательно запустим все ячейки ноутбука и будем ожидать в результате его работы формирование файла с ответами.
3. Если вы отправляете код с использованием другого языка программирования, в том же письме направьте нам инструкцию по его запуску с тем, чтобы получить тот же файл с ответами.
В случае отсутствия кода, воспроизводящего результат, в установленный срок студенту выставляется 0 в качестве оценки за соревнование. Студенты, попавшие в топ-3 согласно приватному лидерборду, смогут получить бонусные баллы, если в течение недели после окончания соревнования сдадут в anytask отчет о получении решения, фигурирующего в приватном лидерборде. Если не оговорено иное, использовать любые внешние данные в соревнованиях запрещено. Под внешними данными понимаются размеченные данные, где разметка имеет прямое отношение к решаемой задаче. Грубо говоря, сборник текстов с википедии не считается внешними данными.
В некоторых соревнованиях данные взяты из завершившегося соревнования на Kaggle.
Категорически запрещено использовать данные из оригинального соревнования для восстановления целевой переменной на тестовой выборке.
Соревнование 1
Задача: выявление мошеннических тразнакций
Это соревнование на бонусные баллы, оно не является обязательным.
Дедлайн: 15.12.2020 23:59MSK
В задании всего один бейзлайн (lightgbm), ненулевые баллы получают решения, преодолевшие его на приватном лидерборде.
Все решения выше этого бейзлайна оцениваются по равномерной шкале от 0 до 5.
Обратите внимание на раздел Baselines на Kaggle — там можно найти много полезного.
Соревнования
Правила участия и оценивания
В соревновании по анализу данных вам предлагается по имеющимся данным решить некоторую задачу, оптимизируя указанную метрику, и отправить ответы для заданного тестового множества. Максимальное количество посылок в сутки ограничено (как правило, разрешается сделать 2 посылки), ближе к концу соревнования вам будем необходимо выбрать 2 посылки, которые вы считаете лучшими. Тестовые данные делятся на публичные и приватные в некотором соотношении, на основе которых строятся публичный и приватный лидерборды соответственно, при этом публичный лидерборд доступен в течение всего соревнования, а приватный строится после его окончания для выбранных вами посылок.
В лидербордах каждого из соревнований присутствуют несколько базовых решений (бейзлайнов), каждое из которых соответствует определённой оценке. Например, для получения оценки не ниже 8 баллов необходимо, чтобы ваше решение на приватном лидерборде оказалось лучше соответствующего бейзлайна. Далее для студента, преодолевшего бейзлайн на N_1 баллов, но не преодолевшего бейзлайн на N_2 балла, итоговая оценка за соревнование рассчитывается по равномерной сетке среди всех таких студентов в зависимости от места в приватном лидерборде среди них; если быть точными, то по следующей формуле:
N_2 — (N_2 — N_1) * i / M,
где M — количество студентов (из всех студентов, изучающих курс), преодолевших бейзлайн на N_1 баллов, но не преодолевших бейзлайн на N_2 балла;
i — место (начиная с 1) студента в приватном лидерборде среди всех таких студентов.
Единственное исключение из формулы — студенты, преодолевшие самый сильный бейзлайн, получают прибавку 1/M к своей оценке.
Чтобы вас не пропустили при проверке решений соревнования, необходимо использовать следующий формат для имени команды (вкладка Team):
« Имя Фамилия номер_группы»
В течение 3 суток после окончания соревнования в соответствующее задание на anytask необходимо прислать код, воспроизводящий ответы для посылки, фигурирующей в приватном лидерборде. При оформлении кода предполагайте, что данные лежат рядом с ним в папке data, а в результате выполнения кода ответы должны быть записаны в файл solution-N-Username.csv, где N — номер соревнования, Username — ваша фамилия. У нас должна быть возможность запустить код и получить те же ответы, что и в вашей посылке, — в частности, это означает, что:
1. Если вы отправляете файл *.py, мы будем запускать его при помощи команды python *.py в вышеуказанном предположении о местонахождении данных.
2. Если вы отправляете ноутбук *.ipynb, мы последовательно запустим все ячейки ноутбука и будем ожидать в результате его работы формирование файла с ответами.
3. Если вы отправляете код с использованием другого языка программирования, в том же письме направьте нам инструкцию по его запуску с тем, чтобы получить тот же файл с ответами.
В случае отсутствия кода, воспроизводящего результат, в установленный срок студенту выставляется 0 в качестве оценки за соревнование. Студенты, попавшие в топ-3 согласно приватному лидерборду, смогут получить бонусные баллы, если в течение недели после окончания соревнования сдадут в anytask отчет о получении решения, фигурирующего в приватном лидерборде. Если не оговорено иное, использовать любые внешние данные в соревнованиях запрещено. Под внешними данными понимаются размеченные данные, где разметка имеет прямое отношение к решаемой задаче. Грубо говоря, сборник текстов с википедии не считается внешними данными.
В некоторых соревнованиях данные взяты из завершившегося соревнования на Kaggle.
Категорически запрещено использовать данные из оригинального соревнования для восстановления целевой переменной на тестовой выборке.
Соревнование 1
Задача: выявление мошеннических тразнакций
Это соревнование на бонусные баллы, оно не является обязательным.
Дедлайн: 13.12.2021 23:59MSK
В задании всего один бейзлайн (lightgbm), ненулевые баллы получают решения, преодолевшие его на приватном лидерборде.
Все решения выше этого бейзлайна оцениваются по равномерной шкале от 0 до 5.
Обратите внимание на раздел Baselines на Kaggle — там можно найти много полезного.
План курса
Еженедельные тесты
В начале каждого семинаре будет проходить короткий тест по теме лекции с предыдущей недели.
На первом семинаре (19.01.21) пройдет пробный тест, за который не будет выставляться баллов.
Подробнее о правилах проведения будет рассказано на первом семинаре.
Домашние задания
Выдаются каждые 2 или 3 недели.
Домашнее задание 1
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook (не забудьте дополнительно скачать видеофайлы из папки).
Выдается: 18.01.21.
Дедлайн (строгий): 08.02.21 в 21:59.
Домашнее задание 2
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook.
Выдается: 09.02.21.
Дедлайн (строгий): 24.02.21 в 23:59.
Домашнее задание 3
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook (не забудьте дополнительно скачать папку data).
Дедлайн (строгий): 24.03.21 в 23:59.
Домашнее задание 4
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook (не забудьте дополнительно скачать файл cameraman.tif).
Дедлайн (строгий): 29.04.21 в 23:59.
Домашнее задание 5
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook. resistors.svg — справочный материал, скачивать не обязательно.
Дедлайн (строгий): 16 мая 2021 в 23:59.
Домашнее задание 6
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook.
Дедлайн (строгий): 31 мая 2021 в 23:59.
Домашнее задание 7
Задание состоит из теоретических задач в .pdf-файле и практической задачи в Jupyter Notebook.
Дедлайн (строгий): 15 июня 2021 в 23:59.
Итоговая оценка за курс
Итог = Округление(min(10, 0.4 * ДЗ + 0.1 * Б + 0.1 * ПР + 0.2 * КР + 0.3 * Э))
ДЗ –– средняя оценка за домашние задания
Б –– средняя оценка за бонусные задачи в ДЗ,
ПР — средняя оценка за самостоятельные работы на семинарах,
КР –– оценка за контрольную работу (проводится в первой половине 4-го модуля),
Э –– письменный экзамен.
Округление арифметическое.
Автоматы не предусмотрены.
Задание 3
Дедлайн 29.09.2017 23:59.
Формат файла task_1.txt:
Первые четыре строки должны содержать описание того, что Вы делали, чтобы решить каждое задание. Например:1 строка: Использовал регулярное выражение: … заменил все вхождения на …2 строка: Использовал регулярное выражение: … заменил все вхождения на …3 строка: Использовал регулярное выражение: … Всего упоминаний о князьях нашел: (число)
4 строка: Использовал регулярное выражение: … Всего упоминаний Новгорода нашел: (число)
На следующих строках должна быть летопись после обработки.
Внимание: При нарушении правил сдачи задание может быть оценено в 0 баллов!
Задание 4
Бонусная часть — извлечение данных из исходника с помощью регулярных выражений
Имя, Фамилия | Должность | Начало службы | Окончание службы, найденное в тексте | Предполагаемое окончание службы | Длительность |
---|---|---|---|---|---|
Амирев Артемий | подьячий | 1646 | 1648 | 1648 | 2 |
Амирев Василий | дьяк | 1529 | 1530 | 1 |
Чтобы ее построить, решите вспомогательные задания:1
Обратите внимание на записи, где для одного человека указаны несколько должностей, например Путилов Спиридон — подьячий Потешного двора, 15 июля 1670 г. по 1671 г.; 8 июля 1671 г
подьячий.
С помощью регулярных выражений замените каждую такую запись на две отдельные записи:Путилов Спиридон — подьячий Потешного двора, 15 июля 1670 г. по 1671 г.;Путилов Спиридон — 8 июля 1671 г. подьячий.
(Совет: используйте обратные ссылки \1 \2 и.т.д.)2. С помощью регулярных выражений из текста, измененного 1 заданием, получите столбец с именами и фамилиями.3. С помощью регулярных выражений из текста, измененного 1 заданием, получите столбец с должностями — дьяк или подьячий.
Давайте заметим, что теперь в каждой записи может быть либо два четырехзначных числа (вначале дата начала, потом дата окончания службы), либо одно четырехзначное (дата начала).4. С помощью регулярных выражений из текста, измененного 1 заданием, получите столбец с датами начала службы.5. С помощью регулярных выражений из текста, измененного 1 заданием, получите столбец с датами окончания службы. Обратите внимание, что таких может и не быть в записи. В этом случае, ячейка должна пустовать.6. Перенесите столбцы в Excel/Google Sheets.
Формат файла bonus.txt:
Первые пять строк должны содержать описание того, что Вы делали, чтобы решить задания 1—5 из . Например:1 строка: Использовал регулярное выражение: … заменил все вхождения на …
…4 строка: Использовал регулярное выражение: … заменил все вхождения на …
5 строка: Использовал регулярное выражение: … заменил все вхождения на …
Полезные материалы
Книги
- Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
- Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
- Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.
- Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.
Сроки контрольных мероприятий
группа 191: 21 сентября
группа 192: 19 сентября
группа 194: 21 сентября
группа 191: 7 откября
группа 192: 5 октября
группа 194: 5 октября
группа 191: 26 октября
группа 192: 22 октября
группа 194: 23 октября
группа 191: 23 ноября
группа 192: 24 ноября
группа 194: 22 ноября
группа 191:
группа 192: 12 декабря
группа 194: 13 декабря
Шестое домашнее задание: дедлайн для сдачи
группа 191:
группа 192: 26 декабря
группа 194: 26 декабря
Коллоквиум
Коллоквиум пройдёт 14, 15 и 17 декабря в промежуток времени 15:00-19:00.
Коллоквиум проводится на платформе Зум, каждому будет назначено время, в которое нужно явиться. В случае неявки без уважительной причины (причина уважительная, если таковой её считает учебный офис) студент получает 0 баллов.
В начале ответа Вы получите билет, в котором будет три вопроса. Первый
вопрос: определение или формулировка теоремы (без доказательства). Во втором вопросе надо будет решить простую задачу на понимание определения. Третий вопрос: доказательство какой-нибудь теоремы. Отвечать надо будет без подготовки в режиме реального времени: рассуждать и вспоминать нужно будет устно в присутствии экзаменатора. При доказательстве теоремы можно расшарить свою запись или конспект и аннотировать их при необходимости.
Оценка за коллоквиум формируется следующим образом. Полный ответ на каждый из первых двух вопросов оценивается в 3 балла,
а полный ответ на третий вопрос в 4 балла (всего 10 баллов). По правилам НИУ ВШЭ при обнаружении факта помощи извне за коллоквиум ставится 0 баллов.
Экзамен
Экзамен длится 90 минут. Во время экзамена студенты должны включить камеры. Во время экзамена разрешено смотреть на любые материалы, загруженные на компьютер до начала экзамена, писать на листах бумаги, а также смотреть на любые бумажные материалы на столе. Студенты могут пользоваться мышью и клавиатурой только для того, чтобы перелистывать загруженные материалы и условия задач. Если во время экзамена у студента возникнет вопрос по условию задачи, он может устно задать его и преподаватель даст на него ответ.
Если у студента случился один или два обрыва связи продолжительностью менее пяти минут, он может продолжить написание экзамена (дополнительное время при этом не предоставляется). Если случился обрыв связи продолжительностью дольше 5 минут или более двух пятиминутных, то считается, что студент пропустил экзамен. В этом случае ему будет предложено без штрафов сдать экзамен устно в течение недели с момента данного экзамена.
Научно-исследовательский семинар
Расписание
Индивидуальные беседы — 13:20 — 14:20
Темы
- Декабрь — Мировые ИТ компании
- Январь — Языки программирования
- Февраль — Интересное приложение
- Март — Цифровой стартап
- Апрель-май — История одной железки
- Сентябрь — Основы верстки научных тексов в Latex.
- Октябрь — Визуализация
Доклады
Выбрать определенный предмет изучения
Подготовить конспект (1-2 страницы)
Записать 15-20 минутный доклад (презентация + рассказ)
Задание в Latex
Необходимо выбрать пять заданий по математике и информатике, например, из ЕГЭ:
- два задания по алгебре, где требуется решения уравнений;
- два задания по геометрии, где для решения требуется построение чертежа;
- одно задание по информатике, где требуется написать код.
Ваша задача заключается в том, чтобы подготовить подробный текст в Latex условий и решений выбранных заданий с записью всех уравнений, графиков, чертежей и оформления кода:
Для каждой задачи запишите ее условие и подробное образцовое решение.
В результате Вам необходимо подготовить и отправить:
- Архив tex файлом и всеми дополнительными файлами (в overleaf есть кнопка «Download» в списке проектов)
- Итоговый PDF файл (в overleaf при редактировании есть «Download PDF»)
Задание будет оцениваться по количеству задач и качеству оформления текста.
Задание на визуализацию
Вам необходимо выбрать пять каких-то понятий или явлений и построить для них диаграмму связей (mind map, ментальная карта).
Что такое диаграммы связей можно почитать, например, тут:
- и еще много где, загуглив «mind map»
Явления или понятия Вы можете выбрать сами, например, это может быть что-то из Ваших лицейских предметов, или просто вещи, которыми Вы интересуетесь, и в которых Вы разбираетесь.
Сделайте карты достаточно подробными, в каждой из них должно быть не менее 20 связных элементов. Если Вам кажется, что для данного явления или понятия нет 20 элементов, то:
- либо подумайте еще, скорее всего еще не до конца разобрались;
- либо выберете другое понятие или явление.
Семинары групп 181, 182
Неделя 1. 1 сентября. Миникр «Вспомнить всё» и МНК
- Домашнее задание:
ИП: 1.2, 1.3, 1.7, 1.8, 1.9, 1.10, 2.1, 2.2, 2.3, будет миникр по мотивам: 1.2, 1.3, 2.2, 2.3
БП: 1.1, 1.2, 1.3, 1.7, 1.8, 1.9, 1.10, будет миникр по мотивам: 1.2, 1.3, 1.4, 1.7
Неделя 2. 7 сентября. Геометрия МНК
- Домашнее задание:
ИП: 1.6, 1.15-1.18, 2.5, 3.1, будет миникр по мотивам 3.1, 3.3
БП: 1.5, 1.6, 1.15-1.18, 3.1, будет миникр по мотивам 3.1, 3.3
Неделя 3. 14 сентября. Матрица-шляпница и R^2
- Миникр-3: Нарисуйте картинку МНК, отметить 4 прямых угла и выписать 4 теоремы Пифагора. Выпишите матрицы X, X’X, X’y для данной модели и данной выборки.
- Домашнее задание: установите julia
Локальная установка julia
Тонкости с локальной настройкой расширения Julia Если вы установили Julia в стандартную папку на Mac или Windows, расширение Julia VS Code должно автоматически найти вашу установку Julia, и вам не нужно ничего настраивать. Если расширение не находит вашу установку Julia автоматически, вы можете установить julia.executablePath для того чтобы указать VS Code на исполняемый файл языка Julia. Чтобы изменить параметры конфигурации, выполните команду Preferences: Open User Settings (вы также можете получить доступ к ней через меню File->Preferences->Settings), а затем убедитесь, что ваши пользовательские настройки включают julia.executablePath. Если нет, то необходимо вручную указать на расположение исполняемого файла Julia. Формат адресной строки должен соответствовать вашей операционной системе и имейте в виду, что \ является escape-символом в JSON, поэтому вам нужно использовать \\ в качестве символа разделителя пути в Windows. |
Преподаватели и ассистенты
Пилотный поток
Лекции: Владимир Подольский
Семинары:
Алексей Леонидович Таламбуца, Владимир Владимирович Подольский, Артем Максимович Максаев
Основной поток
Лекции: Михаил Николаевич Вялый
Семинары: Никита Сергеевич Лукьяненко, Илья Глебович Райко, Михаил Николаевич Вялый, Артем Максимович Максаев, Алина Эдуардовна Хузиева
Учебные ассистенты: Арсений Алексеевич Абрамов, Аъзам Бехруз Хусан угли, Станислав Сергеевич Динер, Анна Тиграновна Енгоян, Александр Александрович Соколихин, Юлия Александровна Василевская, Даниэль Рустамович Хабиров, Елизавета Игоревна Шатская, Фома Александрович Шипилов, Владимир Сахатович Якшимамедов, Александр Всеволодович Крупецков, Даниил Иванович Иваник, Даниил Юрьевич Трошин
Распределение по группам
Официальная система наименования с этого года имеет вид ДМ_Б2020_ПМИИ_<номер группы>#Г#Дискретная математика. В наших материалах мы будем придерживаться более простого наименования 20<номер группы>
Группа | 201 | 202 | 204 | 203 | 205 | 206 (online) | 207 | 208 | 209 | 2010 | 2011 | 2012 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Лектор | Владимир Владимирович Подольский | Михаил Николаевич Вялый | ||||||||||
Семинарист | Алексей Леонидович Таламбуца | Владимир Владимирович Подольский | Артем Максимович Максаев | Никита Сергеевич Лукьяненко | Илья Глебович Райко | Никита Сергеевич Лукьяненко | Михаил Николаевич Вялый | Илья Глебович Райко | Артем Максимович Максаев | Алина Эдуардовна Хузиева | Алина Эдуардовна Хузиева | Артем Максимович Максаев |
Ассистент | Даниил Иванович Иваник | Павел Александрович Захаров | Владимир Сахатович Якшимамедов | Аъзам Бехруз Хусан угли | Даниэль Рустамович Хабиров | Александр Александрович Соколихин, Юлия Александровна Василевская | Анна Тиграновна Енгоян | Елизавета Игоревна Шатская | Даниил Юрьевич Трошин | Арсений Алексеевич Абрамов | Фома Александрович Шипилов | Станислав Сергеевич Динер |
Аттестация и оценки
Во 2-ом модуле производится промежуточная аттестация за
осенний семестр. В осеннем семестре проводятся две письменные контрольные работы (КР1 и
КР2); выдается и проверяется письменное домашнее задание (ДЗ2).
Домашнее задание выдается частями, каждую из которых следует сдавать в установленные
сроки. Преподаватель вправе потребовать от любого студента «защитить» (т.е. изложить устно,
отвечая на возникающие при этом вопросы) решение любой из зачтенных этому студенту задач ДЗ.
В случае неуспешной защиты, баллы за соответствующую часть ДЗ могут быть снижены, в т.ч. до нуля.
Оценка за контрольную работу выставляется в долях единицы без
округления (т.е. с максимальной доступной используемым вычислительным
средствам точностью). Оценка ДЗ2 также выставляется в долях единицы без
округления. Оценки за контрольные работы и домашние задания могут быть
больше единицы засчет «бонусных баллов».
Накопленная оценка НК2 за осенний семестр вычисляется по
формулам:
· НК2' = 10 * min (1, 0.35 * КР1 + 0.35 * КР2 + 0.3 * ДЗ2) |
· НК2 = ОКРУГЛ (НК2'). |
Здесь и далее ОКРУГЛение производится по обычным правилам, но полуцелые
числа округляются вверх.
Если НК2 >= 4, то промежуточная оценка за осенний семестр Э2 =
НК2. Если НК2 < 4, студенту предлагается выполнить итоговое
контрольное задание ИК2, оцениваемое по десятибалльной системе. В этом
случае промежуточная оценка за осенний семестр
Э2 = ОКРУГЛ (0.7 * ИК2 + 0.3 * НК2′).
Промежуточной оценкой по дисциплине является оценка Э2.
Промежуточная аттестация (4 модуль) :
В весеннем семестре проводятся две контрольные работы (КР3 и КР4); выдается и проверяется домашнее задание (ДЗ4). Оценки
выставляются так же, как и в осеннем семестре. Накопленная оценка НК4 за весенний семестр вычисляется по
формулам:
НК4′ = 10 * min (1, 0.35 * КР3 + 0.35 * КР4 + 0.3 * ДЗ4)
НК4 = ОКРУГЛ (НК4′).
Если НК4 >= 4, то итоговая оценка за весенний семестр Э4 = НК4.
Если НК4 < 4, студенту предлагается выполнить итоговое
контрольное задание ИК4, оцениваемое по десятибалльной системе. В этом
случае итоговая оценка за весенний семестр
Э4 = ОКРУГЛ (0.7 * ИК4 + 0.3 * НК4′).
Результирующей оценкой по дисциплине является оценка Э4.
Course Description
The course introduces students to the elements of linear algebra and analytic geometry, provides the foundations for understanding some of the main concepts of modern mathematics. There is a strong emphasis in this course on complete proofs of almost all results.
We will approach the subject from both a practical point of view (learning methods and acquiring computational skills
relevant for problem solving) and a theoretical point of view (learning a more abstract and theoretical approach that focuses on achieving a deep understanding of the different abstract concepts).
Topics covered include: matrix algebra, systems of linear equations, permutations, determinants, complex numbers, fields, abstract vector spaces, bilinear and quadratic forms, Euclidean spaces, some elements of analytic geometry, linear operators. It took mathematicians at least two hundred years to comprehend these objects. We plan to accomplish this in one year.
Программирование и анализ данных на Python (часть 3)
Откуда брать задания и куда их сдавать?
15.04.2021
Теория: Понятие матрицы, сложение и вычитание матриц, умножение матриц на число. Умножение матриц (размера до 3×3)
22.04.2021
Теория: Запись системы линейных уравнений в матричном виде. Обратная матрица. Связь обратной матрицы и определителя.
29.04.2021
Теория: Метод наименьших квадратов для построения прямой (полинома), расположенной наиболее близко к заданному множеству точке
02.09.2021
Теория: Понятие случайного события и случайной величины.
09.09.2021
Теория: Математическое ожидание и стандартное отклонение случайной величины. Среднее и стандартное отклонение выборки. Постановка задачи регрессии (определения положения кривой, наиболее близко проходящей к точкам) при помощи случайных величин.
16.09.2021
Теория: Функция плотности распределения. Плотность распределения равномерной случайной величины на отрезке.
23.09.2021
Теория: Нормальное распределение. Центральная предельная теорема. Экспоненциальное распределение.
30.09.2021
Теория: Бимодальные распределения
07.10.2021
Теория: Зависимость случайных величин. Корреляция.
14.10.2021
Теория: Задача линейной регрессии. Обучающая и тестовая выборки.
Литература
Наш курс опирается на разые источники. Вот некоторые полезные издания:
- Верещагин Н. К., Шень А. Лекции по математической логике и теории алгоритмов. Части 1—3. 5-е изд., М: МЦНМО, 2017.
- Виноградов И. М. Основы теории чисел. 9-е изд., М.: Наука, 1981.
- Гаврилов Г. П., Сапоженко А. А. Задачи и упражнения по дискретной математике. 3-е изд., М.: ФИЗМАТЛИТ, 2004.
- Зубков А. М., Севастьянов Б. А., Чистяков В. П. Сборник задач по теории вероятностей. 2-е изд., М.: Наука, 1989.
- Ландо С. К., Лекции о производящих функциях. 3-е изд, М.: МЦНМО, 2007.
- Мельников О. И. Теория графов в занимательных задачах. 5-е изд., М.: Книжный дом «ЛИБРОКОМ», 2013.
О курсе
Проводится с 2016 года.
Полезные ссылки
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.cs.ml+<номер группы>@gmail.com (например, hse.cs.ml+171@gmail.com)
Семинары
Группа | Преподаватель |
---|---|
191 (МОП) | Хрушков Павел Вадимович |
192 (МОП) | |
193 (МОП) | |
194 (АДИС) | |
195 (РС) | Каюмов Эмиль Марселевич |
196 (РС) | Шабалин Александр Михайлович |
197 (АПР) | |
198 (ТИ) | |
199 (МИ) | |
1910 (ПР) | |
ФЭН | |
Пермь (БИ) | |
Пермь (ПИ) |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
- Практические домашние работы на Python
- Письменная контрольная работа
- Письменный экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Итог = Округление(0.15 * ПР + 0.4 * ДЗ + 0.15 * КР + 0.3 * Э)
ПР — средняя оценка за самостоятельные работы на семинарах
ДЗ — средняя оценка за практические домашние работы на Python
КР — оценка за контрольную работу
Э — оценка за экзамен
Округление арифметическое.
Правила сдачи заданий
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее. Есть исключение: в течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.