Giter Club home page Giter Club logo

danisyuma / gb_theory-of-probability-and-mathematical-statistics Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 1.0 88.54 MB

Теория вероятностей и математическая статистика

Python 95.28% Cython 2.82% C 0.83% C++ 0.31% Fortran 0.08% Forth 0.01% PowerShell 0.03% Batchfile 0.01% Jupyter Notebook 0.47% Shell 0.01% HTML 0.09% JavaScript 0.05% CSS 0.01% VBScript 0.01% XSLT 0.01% Classic ASP 0.01% Roff 0.01% Lua 0.01%

gb_theory-of-probability-and-mathematical-statistics's Introduction

GB_Theory-of-Probability-and-Mathematical-Statistics

Теория вероятностей и математическая статистика

Урок 1. Расчет вероятности случайных событий

Seminar

  1. В партии 10 деталей. Среди них 3 бракованные. Какова вероятность, что среди 5 ,взятых на удачу, 4 хорошие детали?
  2. Разработали спам-фильтр на основании часто встречающихся фраз. 70% всех писем –это спам. В 10 % писем со спамом встречается фраза: «вся правда о» и в 0.5% она встречается в хороших письмах. Какова вероятность, что пришедшее на почту письмо является спамом, если в нем есть данная фраза?
  3. В ящике находится 10 красных, 5 черных, 5 зеленых шаров. Наудачу вынимают 6 шаров. Какова вероятность, что вынуты 3 красных, 2 черных, 1 зеленый?
  4. На 5 одинаковых карточках написаны буквы Ч, А, Й ,К, И. Какова вероятность, что получится слова ЧАЙКИ
  5. На 5 одинаковых карточках написаны буквы Ч, А, Й ,К, И. Какова вероятность, что получится слова ЧАЙКА
  6. Какое количество семизначных номеров можно придумать, если в качестве первой цифры не может быть 0,1,7

Homework

  1. Из колоды в 52 карты извлекаются случайным образом 4 карты. a) Найти вероятность того, что все карты – крести. б) Найти вероятность, что среди 4-х карт окажется хотя бы один туз.
  2. На входной двери подъезда установлен кодовый замок, содержащий десять кнопок с цифрами от 0 до 9. Код содержит три цифры, которые нужно нажать одновременно. Какова вероятность того, что человек, не знающий код, откроет дверь с первой попытки?
  3. В ящике имеется 15 деталей, из которых 9 окрашены. Рабочий случайным образом извлекает 3 детали. Какова вероятность того, что все извлеченные детали окрашены?
  4. В лотерее 100 билетов. Из них 2 выигрышных. Какова вероятность того, что 2 приобретенных билета окажутся выигрышными?

Урок 2. Дискретные распределения вероятностей

Seminar

  1. Найдите математическое ожидание случайной величины X, распределенной по биномиальному закону с параметрами n =100, р=0.3.
  2. Найти ско СВ Х, распределенной по биномиальному закону с параметрами n=50, p=0.6
  3. Вероятность события А в каждом независимом испытании 0.0015. Какова вероятность того, что при 2000 испытаниях событие А появится 3 раза.
  4. Подбрасывают 4 одинаковые монеты. Какова вероятность, что решка выпадет не более 1 раза Максимальная биномиальная вероятность
  5. Найдите наиболее вероятное число выпадения числа герба при 25 подбрасываниях монеты.
  6. Сколько раз надо подбросить игральный кубик, чтобы наивероятнейшее число выпаданий тройки было 30
  7. Какова вероятность наступления события B в каждом отдельном испытании, если наивероятнейшее число число наступлений события B в 120 испытаниях составило 32.
  8. Вероятность рождения мальчиков 0.515. Найти наивероятнейшее число девочек из 600 новорожденных.

Homework

  1. Вероятность того, что стрелок попадет в мишень, выстрелив один раз, равна 0.8. Стрелок выстрелил 100 раз. Найдите вероятность того, что стрелок попадет в цель ровно 85 раз.
  2. Вероятность того, что лампочка перегорит в течение первого дня эксплуатации, равна 0.0004. В жилом комплексе после ремонта в один день включили 5000 новых лампочек. Какова вероятность, что ни одна из них не перегорит в первый день? Какова вероятность, что перегорят ровно две?
  3. Монету подбросили 144 раза. Какова вероятность, что орел выпадет ровно 70 раз?
  4. В первом ящике находится 10 мячей, из которых 7 - белые. Во втором ящике - 11 мячей, из которых 9 белых. Из каждого ящика вытаскивают случайным образом по два мяча. Какова вероятность того, что все мячи белые? Какова вероятность того, что ровно два мяча белые? Какова вероятность того, что хотя бы один мяч белый?

Урок 3. EDA (exploratory data analysis) или Разведочный анализ

Lesson

  1. Смещенные стандартное отклонение и дисперсия
  2. Несмещенные стандартное отклонение и дисперсия
  3. Медиана
  4. Первый и третий квартили. Интерквартильное расстояние

Seminar

  1. Найти среднее арифметическое для выборки: 77, 79, 67, 95, 87, 91, 98, 100, 104, 105. Найти медиану. Найти интерквартильное расстояние
  2. Партия лампочек на 25% изготовлена 1м заводом, на 35% вторым и на 40% 3м. Вероятность выпуска бракованной лампочки равны: q1 = 0.03, q2 = 0.02, q3 = 0.01. Какова вероятность того что случайная лампа бракованная.
  3. В урне a красных и b голубых шаров, одинаковых по размеру и весу. Чему равна вероятность того, что наудачу извлеченный шар из этой урны окажется голубым? Записать ответ в виде буквенного выражения.
  4. Партия деталей изготовлена тремя рабочими, причем первый изготовил 35% всех деталей, второй – 40% всех деталей, третий – всю остальную продукцию. Брак в их продукции составляет: у первого -2%, у второго - 3%, у третьего – 4%. Случайно выбранная для контроля деталь оказалась бракованной. Найти вероятность того, что она изготовлена третьим рабочим.
  5. В ящике 15 шаров, из которых 5 голубы и 10 красных. Из ящика последовательно вынимают 2 шара; первый шар в ящик не возвращают/ Найти вероятность, что первый вытащенный шар - красный , а второй – голубой.
  6. Известно, что в принятой для сборки партии из 1000 деталей имеются 4 дефектных. Найдите вероятность, что среди 50 случайно взятых деталей нет дефектных

Homework

  1. Даны значения зарплат из выборки выпускников: 100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 24, 57, 55, 70, 75, 65, 84, 90, 150. Посчитать среднее арифметическое, среднее квадратичное отклонение, смещенную и несмещенную оценки дисперсий для данной выборки.
  2. В первом ящике находится 8 мячей, из которых 5 - белые. Во втором ящике - 12 мячей, из которых 5 белых. Из первого ящика вытаскивают случайным образом два мяча, из второго - 4. Какова вероятность того, что 3 мяча белые?
  3. На соревновании по биатлону один из трех спортсменов стреляет и попадает в мишень. Вероятность попадания для первого спортсмена равна 0.9, для второго — 0.8, для третьего — 0.6. Найти вероятность того, что выстрел произведен: a). первым спортсменом б). вторым спортсменом в). третьим спортсменом.
  4. В университет на факультеты A и B поступило равное количество студентов, а на факультет C студентов поступило столько же, сколько на A и B вместе. Вероятность того, что студент факультета A сдаст первую сессию, равна 0.8. Для студента факультета B эта вероятность равна 0.7, а для студента факультета C - 0.9. Студент сдал первую сессию. Какова вероятность, что он учится: a). на факультете A б). на факультете B в). на факультете C?
  5. Устройство состоит из трех деталей. Для первой детали вероятность выйти из строя в первый месяц равна 0.1, для второй - 0.2, для третьей - 0.25. Какова вероятность того, что в первый месяц выйдут из строя: а). все детали б). только две детали в). хотя бы одна деталь г). от одной до двух деталей?

Урок 4. Непрерывная случайная величина

Seminar

  1. Веса изделий следуют нормальному распределению с дисперсией 9 и средним арифметическим 50. Веса ниже 45 г считаются браком. Какая доля изделий бракованная
  2. Дана та же генеральная совокупность из задачи №3 со редним арифметическим 50 и дисперсией 9. В скольких стандартных отклонениях лежит вес 56 г?
  3. Найдите математическое ожидание случайной величины X, равномерно распределенной на отрезке (-3, 3]
  4. Найдите среднее квадратичное отклонение случайной величины X, равномерно распределенной на отрезке [-2, 7]

Homework

  1. Случайная непрерывная величина A имеет равномерное распределение на промежутке (200, 800]. Найдите ее среднее значение и дисперсию.

  2. О случайной непрерывной равномерно распределенной величине B известно, что ее дисперсия равна 0.2. Можно ли найти правую границу величины B и ее среднее значение зная, что левая граница равна 0.5? Если да, найдите ее.

  3. Непрерывная случайная величина X распределена нормально и задана плотностью распределения f(x) = (1 / (4 * sqrt(2pi))) * exp((-(x+2)**2) / 32) Найдите: а). M(X) б). D(X) в). std(X) (среднее квадратичное отклонение)

  4. Рост взрослого населения города X имеет нормальное распределение. Причем, средний рост равен 174 см, а среднее квадратичное отклонение равно 8 см. Какова вероятность того, что случайным образом выбранный взрослый человек имеет рост: а). больше 182 см б). больше 190 см в). от 166 см до 190 см г). от 166 см до 182 см д). от 158 см до 190 см е). не выше 150 см или не ниже 190 см ё). не выше 150 см или не ниже 198 см ж). ниже 166 см.

  5. На сколько сигм (средних квадратичных отклонений) отклоняется рост человека, равный 190 см, от математического ожидания роста в популяции, в которой M(X) = 178 см и D(X) = 25 кв.см?

Урок 5. Тестирование гипотез

Seminar

  1. Ниже приведены диаметры коронарных артерий после приема нифедипина и плацебо. Позволяют ли приводимые ниже данные утверждать, что нифедипин влияет на диаметр коронарных артерий? а. Выполнить расчеты в Python б. Сделайте расчет в ручную в. Сравните критерий Стьюдента и p-value со значениями, полученными в Python   x = np.array([2.5, 2.2, 2.6, 2, 2.1, 1.8, 2.4, 2.3, 2.7, 2.7, 1.9]) y = np.array([2.5, 1.7, 1.5, 2.5, 1.4, 1.9, 2.3, 2.0, 2.6, 2.3, 2.2])

  2. Утверждается, что средний рост мужчин национальности Х 179,5.Была взята выборка из 100 человек, по которой получилось среднее арифметическое 178,5. Проверить это утверждение с помощью одностороннего теста, если известно, что стандартное отклонение генеральной совокупности 3 см. А уровень статистической значимости принять за 1%

Homework

  1. Когда используется критерий Стьюдента, а когда Z –критерий?
  1. Проведите тест гипотезы. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв. мм.
  2. Проведите тест гипотезы. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%? (Провести двусторонний тест.)

Урок 6. Сравнение долей. Построение доверительного интервала

Seminar

  1. На препарате А положительный результат лечения наблюдается у 17 из 32 пациентов, а на препарате В у 9 из 22. Построить 95% доверительный интервал для разности долей. Обнаружены ли статистически значимые различия? Уровень статистической значимости принять за 0.05

  2. Было проведено исследование научных статей на количество авторов в разные годы. Построить 90% и 95% интервалы

  3. Найдите 95% доверительные интервалы для долей больных, которые не чувствовали боли при включенном и выключенном приборе. Можно ли по этим интервалам оценить статистическую значимость различий?

Homework

  1. Известно, что генеральная совокупность распределена нормальносо средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.

  2. В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные:6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.

3 Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170 Рост матерей 178, 165, 165, 173, 168, 155, 160, 164, 178, 175 Используя эти данные построить 95% доверительный интервал для разности среднего роста родителей и детей.

Урок 7. Непараметрические тесты

  • Критерий Манна-Уитни. Для сравнения двух групп при НЕзависимых выборках
  • Критерий Уилкоксона. Для сравнения двух групп при зависимых выборках
  • Критерий Крускала –Уоллиса. НЕзависимые выборки для множественных сравнений
  • Критерий Фридмана. зависимые выборки для множественных сравнений

Seminar

  1. Средние расходы на обследование одного больного до ознакомления с расходами коллег X= np.array([20,17, 14, 42, 50, 62, 8, 49, 81, 54, 48, 55, 56]) Y= np.array ([20, 26, 1, 24, 1, 47, 15, 7, 65, 9, 21, 36, 30]) Средние расходы на лечение одного больного до ознакомления с расходами коллег X= np.array([ 32, 41, 51, 29, 76, 47, 60, 58, 40, 64, 73, 66, 73]) Y= np.array ([42, 90, 71, 47, 56, 43, 137, 63, 28, 60, 87, 69, 50]) Произошли ли изменения на расходы и лечение?

  2. При исследовании препарата для снижения кровяного давления у больных 3 раза измерялся сердечный выброс. Менялся ли сердечный выброс?

  3. Даны значения проницаемости сосудов сетчатки gr1 (здоровые пациенты), gr 2 ( поражение в области центральной ямки), gr3 (в области центральной ямки и на периферии). Сравнить данные, относящиеся к разным видам поражения.

Homework

Выберете тест и проверьте, есть ли различия между выборками:

  1. Даны две независимые выборки. Не соблюдается условие нормальности x1 380,420, 290 y1 140,360,200,900 Сделайте вывод по результатам, полученным с помощью функции
  2. Исследовалось влияние препарата на уровень давления пациентов. Сначала измерялось давление до приема препарата, потом через 10 минут и через 30 минут. Есть ли статистически значимые различия? 1е измерение до приема препарата: 150, 160, 165, 145, 155 2е измерение через 10 минут: 140, 155, 150, 130, 135 3е измерение через 30 минут: 130, 130, 120, 130, 125
  3. Сравните 1 и 2 е измерения, предполагая, что 3го измерения через 30 минут не было.
  4. Даны 3 группы учеников плавания. В 1 группе время на дистанцию 50 м составляют: 56, 60, 62, 55, 71, 67, 59, 58, 64, 67 Вторая группа : 57, 58, 69, 48, 72, 70, 68, 71, 50, 53 Третья группа: 57, 67, 49, 48, 47, 55, 66, 51, 54
  5. Заявляется, что партия изготавливается со средним арифметическим 2,5 см. Проверить данную гипотезу, если известно, что размеры изделий подчинены нормальному закону распределения. Объем выборки 10, уровень статистической значимости 5% 2.51, 2.35, 2.74, 2.56, 2.40, 2.36, 2.65, 2.7, 2.67, 2.34

Урок 8. Корреляционный анализ

  • Коэффициент корреляции коэффициент Пирсона.
  • Ковариация
  • Коэффициент корреляции Спирмена

Homework

Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks): zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110], ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832]. Найдите ковариацию этих двух величин с помощью элементарных действий, а затем с помощью функции cov из numpy Полученные значения должны быть равны. Найдите коэффициент корреляции Пирсона с помощью ковариации и среднеквадратичных отклонений двух признаков, а затем с использованием функций из библиотек numpy и pandas.

Измерены значения IQ выборки студентов, обучающихся в местных технических вузах: 131, 125, 115, 122, 131, 115, 107, 99, 125, 111. Известно, что в генеральной совокупности IQ распределен нормально. Найдите доверительный интервал для математического ожидания с надежностью 0.95.

Известно, что рост футболистов в сборной распределен нормально с дисперсией генеральной совокупности, равной 25 кв.см. Объем выборки равен 27, среднее выборочное составляет 174.2. Найдите доверительный интервал для математического ожидания с надежностью 0.95.

Урок 9. Линейная регрессия Логистическая регрессия

  • Подбор коэффициентов модели линейной регрессии.
    • Математические формулы
      • Расчет коэффициентов по формулам
      • Функция потерь
    • Матричный метод
    • Метод градиентного спуска
  • Функция predict()
  • Коэффициент детерминации 𝑹^2
  • Оценка значимости математической модели. Критерий Фишера
    • F-критерий Фишера позволяет оценить значимость модели линейной регрессии
  • Оценка значимости отдельных коэффициентов. Критерий Стьюдента
    • t-критерий Стьюдетнта позволяет оценить значимость отдельных коэффициентов модели линейной регрессии
  • Логистическая регрессия
    • Логистическая регрессия применяется, когда 𝑦 является бинарной переменной (0 или 1). Т.е. с помощью этого метода мы можем решить задачу бинарной классификации.

Homework

  1. Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks): zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110], ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832]. Используя математические операции, посчитать коэффициенты линейной регрессии, приняв за X заработную плату (то есть, zp - признак), а за y - значения скорингового балла (то есть, ks - целевая переменная). Произвести расчет как с использованием intercept, так и без.
  2. Посчитать коэффициент линейной регрессии при заработной плате (zp), используя градиентный спуск (без intercept).
  3. Произвести вычисления как в пункте 2, но с вычислением intercept. Учесть, что изменение коэффициентов должно производиться на каждом шаге одновременно (то есть изменение одного коэффициента не должно влиять на изменение другого во время одной итерации).

Урок 10. Дисперсионный анализ

Провести дисперсионный анализ для определения того, есть ли различия среднего роста среди взрослых футболистов, хоккеистов и штангистов. Даны значения роста в трех группах случайно выбранных спортсменов: Футболисты: 173, 175, 180, 178, 177, 185, 183, 182. Хоккеисты: 177, 179, 180, 188, 177, 172, 171, 184, 180. Штангисты: 172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170.

gb_theory-of-probability-and-mathematical-statistics's People

Contributors

danisyuma avatar

Watchers

 avatar

Forkers

andrewmatveev

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.