Теория вероятностей и математическая статистика
- В партии 10 деталей. Среди них 3 бракованные. Какова вероятность, что среди 5 ,взятых на удачу, 4 хорошие детали?
- Разработали спам-фильтр на основании часто встречающихся фраз. 70% всех писем –это спам. В 10 % писем со спамом встречается фраза: «вся правда о» и в 0.5% она встречается в хороших письмах. Какова вероятность, что пришедшее на почту письмо является спамом, если в нем есть данная фраза?
- В ящике находится 10 красных, 5 черных, 5 зеленых шаров. Наудачу вынимают 6 шаров. Какова вероятность, что вынуты 3 красных, 2 черных, 1 зеленый?
- На 5 одинаковых карточках написаны буквы Ч, А, Й ,К, И. Какова вероятность, что получится слова ЧАЙКИ
- На 5 одинаковых карточках написаны буквы Ч, А, Й ,К, И. Какова вероятность, что получится слова ЧАЙКА
- Какое количество семизначных номеров можно придумать, если в качестве первой цифры не может быть 0,1,7
- Из колоды в 52 карты извлекаются случайным образом 4 карты. a) Найти вероятность того, что все карты – крести. б) Найти вероятность, что среди 4-х карт окажется хотя бы один туз.
- На входной двери подъезда установлен кодовый замок, содержащий десять кнопок с цифрами от 0 до 9. Код содержит три цифры, которые нужно нажать одновременно. Какова вероятность того, что человек, не знающий код, откроет дверь с первой попытки?
- В ящике имеется 15 деталей, из которых 9 окрашены. Рабочий случайным образом извлекает 3 детали. Какова вероятность того, что все извлеченные детали окрашены?
- В лотерее 100 билетов. Из них 2 выигрышных. Какова вероятность того, что 2 приобретенных билета окажутся выигрышными?
- Найдите математическое ожидание случайной величины X, распределенной по биномиальному закону с параметрами n =100, р=0.3.
- Найти ско СВ Х, распределенной по биномиальному закону с параметрами n=50, p=0.6
- Вероятность события А в каждом независимом испытании 0.0015. Какова вероятность того, что при 2000 испытаниях событие А появится 3 раза.
- Подбрасывают 4 одинаковые монеты. Какова вероятность, что решка выпадет не более 1 раза Максимальная биномиальная вероятность
- Найдите наиболее вероятное число выпадения числа герба при 25 подбрасываниях монеты.
- Сколько раз надо подбросить игральный кубик, чтобы наивероятнейшее число выпаданий тройки было 30
- Какова вероятность наступления события B в каждом отдельном испытании, если наивероятнейшее число число наступлений события B в 120 испытаниях составило 32.
- Вероятность рождения мальчиков 0.515. Найти наивероятнейшее число девочек из 600 новорожденных.
- Вероятность того, что стрелок попадет в мишень, выстрелив один раз, равна 0.8. Стрелок выстрелил 100 раз. Найдите вероятность того, что стрелок попадет в цель ровно 85 раз.
- Вероятность того, что лампочка перегорит в течение первого дня эксплуатации, равна 0.0004. В жилом комплексе после ремонта в один день включили 5000 новых лампочек. Какова вероятность, что ни одна из них не перегорит в первый день? Какова вероятность, что перегорят ровно две?
- Монету подбросили 144 раза. Какова вероятность, что орел выпадет ровно 70 раз?
- В первом ящике находится 10 мячей, из которых 7 - белые. Во втором ящике - 11 мячей, из которых 9 белых. Из каждого ящика вытаскивают случайным образом по два мяча. Какова вероятность того, что все мячи белые? Какова вероятность того, что ровно два мяча белые? Какова вероятность того, что хотя бы один мяч белый?
- Смещенные стандартное отклонение и дисперсия
- Несмещенные стандартное отклонение и дисперсия
- Медиана
- Первый и третий квартили. Интерквартильное расстояние
- Найти среднее арифметическое для выборки: 77, 79, 67, 95, 87, 91, 98, 100, 104, 105. Найти медиану. Найти интерквартильное расстояние
- Партия лампочек на 25% изготовлена 1м заводом, на 35% вторым и на 40% 3м. Вероятность выпуска бракованной лампочки равны: q1 = 0.03, q2 = 0.02, q3 = 0.01. Какова вероятность того что случайная лампа бракованная.
- В урне a красных и b голубых шаров, одинаковых по размеру и весу. Чему равна вероятность того, что наудачу извлеченный шар из этой урны окажется голубым? Записать ответ в виде буквенного выражения.
- Партия деталей изготовлена тремя рабочими, причем первый изготовил 35% всех деталей, второй – 40% всех деталей, третий – всю остальную продукцию. Брак в их продукции составляет: у первого -2%, у второго - 3%, у третьего – 4%. Случайно выбранная для контроля деталь оказалась бракованной. Найти вероятность того, что она изготовлена третьим рабочим.
- В ящике 15 шаров, из которых 5 голубы и 10 красных. Из ящика последовательно вынимают 2 шара; первый шар в ящик не возвращают/ Найти вероятность, что первый вытащенный шар - красный , а второй – голубой.
- Известно, что в принятой для сборки партии из 1000 деталей имеются 4 дефектных. Найдите вероятность, что среди 50 случайно взятых деталей нет дефектных
- Даны значения зарплат из выборки выпускников: 100, 80, 75, 77, 89, 33, 45, 25, 65, 17, 30, 24, 57, 55, 70, 75, 65, 84, 90, 150. Посчитать среднее арифметическое, среднее квадратичное отклонение, смещенную и несмещенную оценки дисперсий для данной выборки.
- В первом ящике находится 8 мячей, из которых 5 - белые. Во втором ящике - 12 мячей, из которых 5 белых. Из первого ящика вытаскивают случайным образом два мяча, из второго - 4. Какова вероятность того, что 3 мяча белые?
- На соревновании по биатлону один из трех спортсменов стреляет и попадает в мишень. Вероятность попадания для первого спортсмена равна 0.9, для второго — 0.8, для третьего — 0.6. Найти вероятность того, что выстрел произведен: a). первым спортсменом б). вторым спортсменом в). третьим спортсменом.
- В университет на факультеты A и B поступило равное количество студентов, а на факультет C студентов поступило столько же, сколько на A и B вместе. Вероятность того, что студент факультета A сдаст первую сессию, равна 0.8. Для студента факультета B эта вероятность равна 0.7, а для студента факультета C - 0.9. Студент сдал первую сессию. Какова вероятность, что он учится: a). на факультете A б). на факультете B в). на факультете C?
- Устройство состоит из трех деталей. Для первой детали вероятность выйти из строя в первый месяц равна 0.1, для второй - 0.2, для третьей - 0.25. Какова вероятность того, что в первый месяц выйдут из строя: а). все детали б). только две детали в). хотя бы одна деталь г). от одной до двух деталей?
- Веса изделий следуют нормальному распределению с дисперсией 9 и средним арифметическим 50. Веса ниже 45 г считаются браком. Какая доля изделий бракованная
- Дана та же генеральная совокупность из задачи №3 со редним арифметическим 50 и дисперсией 9. В скольких стандартных отклонениях лежит вес 56 г?
- Найдите математическое ожидание случайной величины X, равномерно распределенной на отрезке (-3, 3]
- Найдите среднее квадратичное отклонение случайной величины X, равномерно распределенной на отрезке [-2, 7]
-
Случайная непрерывная величина A имеет равномерное распределение на промежутке (200, 800]. Найдите ее среднее значение и дисперсию.
-
О случайной непрерывной равномерно распределенной величине B известно, что ее дисперсия равна 0.2. Можно ли найти правую границу величины B и ее среднее значение зная, что левая граница равна 0.5? Если да, найдите ее.
-
Непрерывная случайная величина X распределена нормально и задана плотностью распределения f(x) = (1 / (4 * sqrt(2pi))) * exp((-(x+2)**2) / 32) Найдите: а). M(X) б). D(X) в). std(X) (среднее квадратичное отклонение)
-
Рост взрослого населения города X имеет нормальное распределение. Причем, средний рост равен 174 см, а среднее квадратичное отклонение равно 8 см. Какова вероятность того, что случайным образом выбранный взрослый человек имеет рост: а). больше 182 см б). больше 190 см в). от 166 см до 190 см г). от 166 см до 182 см д). от 158 см до 190 см е). не выше 150 см или не ниже 190 см ё). не выше 150 см или не ниже 198 см ж). ниже 166 см.
-
На сколько сигм (средних квадратичных отклонений) отклоняется рост человека, равный 190 см, от математического ожидания роста в популяции, в которой M(X) = 178 см и D(X) = 25 кв.см?
-
Ниже приведены диаметры коронарных артерий после приема нифедипина и плацебо. Позволяют ли приводимые ниже данные утверждать, что нифедипин влияет на диаметр коронарных артерий? а. Выполнить расчеты в Python б. Сделайте расчет в ручную в. Сравните критерий Стьюдента и p-value со значениями, полученными в Python x = np.array([2.5, 2.2, 2.6, 2, 2.1, 1.8, 2.4, 2.3, 2.7, 2.7, 1.9]) y = np.array([2.5, 1.7, 1.5, 2.5, 1.4, 1.9, 2.3, 2.0, 2.6, 2.3, 2.2])
-
Утверждается, что средний рост мужчин национальности Х 179,5.Была взята выборка из 100 человек, по которой получилось среднее арифметическое 178,5. Проверить это утверждение с помощью одностороннего теста, если известно, что стандартное отклонение генеральной совокупности 3 см. А уровень статистической значимости принять за 1%
- Когда используется критерий Стьюдента, а когда Z –критерий?
- Проведите тест гипотезы. Утверждается, что шарики для подшипников, изготовленные автоматическим станком, имеют средний диаметр 17 мм. Используя односторонний критерий с α=0,05, проверить эту гипотезу, если в выборке из n=100 шариков средний диаметр оказался равным 17.5 мм, а дисперсия известна и равна 4 кв. мм.
- Проведите тест гипотезы. Продавец утверждает, что средний вес пачки печенья составляет 200 г. Из партии извлечена выборка из 10 пачек. Вес каждой пачки составляет: 202, 203, 199, 197, 195, 201, 200, 204, 194, 190. Известно, что их веса распределены нормально. Верно ли утверждение продавца, если учитывать, что доверительная вероятность равна 99%? (Провести двусторонний тест.)
-
На препарате А положительный результат лечения наблюдается у 17 из 32 пациентов, а на препарате В у 9 из 22. Построить 95% доверительный интервал для разности долей. Обнаружены ли статистически значимые различия? Уровень статистической значимости принять за 0.05
-
Было проведено исследование научных статей на количество авторов в разные годы. Построить 90% и 95% интервалы
-
Найдите 95% доверительные интервалы для долей больных, которые не чувствовали боли при включенном и выключенном приборе. Можно ли по этим интервалам оценить статистическую значимость различий?
-
Известно, что генеральная совокупность распределена нормальносо средним квадратическим отклонением, равным 16. Найти доверительный интервал для оценки математического ожидания a с надежностью 0.95, если выборочная средняя M = 80, а объем выборки n = 256.
-
В результате 10 независимых измерений некоторой величины X, выполненных с одинаковой точностью, получены опытные данные:6.9, 6.1, 6.2, 6.8, 7.5, 6.3, 6.4, 6.9, 6.7, 6.1 Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины X при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.
3 Рост дочерей 175, 167, 154, 174, 178, 148, 160, 167, 169, 170 Рост матерей 178, 165, 165, 173, 168, 155, 160, 164, 178, 175 Используя эти данные построить 95% доверительный интервал для разности среднего роста родителей и детей.
- Критерий Манна-Уитни. Для сравнения двух групп при НЕзависимых выборках
- Критерий Уилкоксона. Для сравнения двух групп при зависимых выборках
- Критерий Крускала –Уоллиса. НЕзависимые выборки для множественных сравнений
- Критерий Фридмана. зависимые выборки для множественных сравнений
-
Средние расходы на обследование одного больного до ознакомления с расходами коллег X= np.array([20,17, 14, 42, 50, 62, 8, 49, 81, 54, 48, 55, 56]) Y= np.array ([20, 26, 1, 24, 1, 47, 15, 7, 65, 9, 21, 36, 30]) Средние расходы на лечение одного больного до ознакомления с расходами коллег X= np.array([ 32, 41, 51, 29, 76, 47, 60, 58, 40, 64, 73, 66, 73]) Y= np.array ([42, 90, 71, 47, 56, 43, 137, 63, 28, 60, 87, 69, 50]) Произошли ли изменения на расходы и лечение?
-
При исследовании препарата для снижения кровяного давления у больных 3 раза измерялся сердечный выброс. Менялся ли сердечный выброс?
-
Даны значения проницаемости сосудов сетчатки gr1 (здоровые пациенты), gr 2 ( поражение в области центральной ямки), gr3 (в области центральной ямки и на периферии). Сравнить данные, относящиеся к разным видам поражения.
Выберете тест и проверьте, есть ли различия между выборками:
- Даны две независимые выборки. Не соблюдается условие нормальности x1 380,420, 290 y1 140,360,200,900 Сделайте вывод по результатам, полученным с помощью функции
- Исследовалось влияние препарата на уровень давления пациентов. Сначала измерялось давление до приема препарата, потом через 10 минут и через 30 минут. Есть ли статистически значимые различия? 1е измерение до приема препарата: 150, 160, 165, 145, 155 2е измерение через 10 минут: 140, 155, 150, 130, 135 3е измерение через 30 минут: 130, 130, 120, 130, 125
- Сравните 1 и 2 е измерения, предполагая, что 3го измерения через 30 минут не было.
- Даны 3 группы учеников плавания. В 1 группе время на дистанцию 50 м составляют: 56, 60, 62, 55, 71, 67, 59, 58, 64, 67 Вторая группа : 57, 58, 69, 48, 72, 70, 68, 71, 50, 53 Третья группа: 57, 67, 49, 48, 47, 55, 66, 51, 54
- Заявляется, что партия изготавливается со средним арифметическим 2,5 см. Проверить данную гипотезу, если известно, что размеры изделий подчинены нормальному закону распределения. Объем выборки 10, уровень статистической значимости 5% 2.51, 2.35, 2.74, 2.56, 2.40, 2.36, 2.65, 2.7, 2.67, 2.34
- Коэффициент корреляции коэффициент Пирсона.
- Ковариация
- Коэффициент корреляции Спирмена
Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks): zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110], ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832]. Найдите ковариацию этих двух величин с помощью элементарных действий, а затем с помощью функции cov из numpy Полученные значения должны быть равны. Найдите коэффициент корреляции Пирсона с помощью ковариации и среднеквадратичных отклонений двух признаков, а затем с использованием функций из библиотек numpy и pandas.
Измерены значения IQ выборки студентов, обучающихся в местных технических вузах: 131, 125, 115, 122, 131, 115, 107, 99, 125, 111. Известно, что в генеральной совокупности IQ распределен нормально. Найдите доверительный интервал для математического ожидания с надежностью 0.95.
Известно, что рост футболистов в сборной распределен нормально с дисперсией генеральной совокупности, равной 25 кв.см. Объем выборки равен 27, среднее выборочное составляет 174.2. Найдите доверительный интервал для математического ожидания с надежностью 0.95.
- Подбор коэффициентов модели линейной регрессии.
- Математические формулы
- Расчет коэффициентов по формулам
- Функция потерь
- Матричный метод
- Метод градиентного спуска
- Математические формулы
- Функция predict()
- Коэффициент детерминации 𝑹^2
- Оценка значимости математической модели. Критерий Фишера
- F-критерий Фишера позволяет оценить значимость модели линейной регрессии
- Оценка значимости отдельных коэффициентов. Критерий Стьюдента
- t-критерий Стьюдетнта позволяет оценить значимость отдельных коэффициентов модели линейной регрессии
- Логистическая регрессия
- Логистическая регрессия применяется, когда 𝑦 является бинарной переменной (0 или 1). Т.е. с помощью этого метода мы можем решить задачу бинарной классификации.
- Даны значения величины заработной платы заемщиков банка (zp) и значения их поведенческого кредитного скоринга (ks): zp = [35, 45, 190, 200, 40, 70, 54, 150, 120, 110], ks = [401, 574, 874, 919, 459, 739, 653, 902, 746, 832]. Используя математические операции, посчитать коэффициенты линейной регрессии, приняв за X заработную плату (то есть, zp - признак), а за y - значения скорингового балла (то есть, ks - целевая переменная). Произвести расчет как с использованием intercept, так и без.
- Посчитать коэффициент линейной регрессии при заработной плате (zp), используя градиентный спуск (без intercept).
- Произвести вычисления как в пункте 2, но с вычислением intercept. Учесть, что изменение коэффициентов должно производиться на каждом шаге одновременно (то есть изменение одного коэффициента не должно влиять на изменение другого во время одной итерации).
Провести дисперсионный анализ для определения того, есть ли различия среднего роста среди взрослых футболистов, хоккеистов и штангистов. Даны значения роста в трех группах случайно выбранных спортсменов: Футболисты: 173, 175, 180, 178, 177, 185, 183, 182. Хоккеисты: 177, 179, 180, 188, 177, 172, 171, 184, 180. Штангисты: 172, 173, 169, 177, 166, 180, 178, 177, 172, 166, 170.