Лабораторные работы по дисциплине "Методы обработки информации"
Формат - Microsoft Excel.
Задание:
1. Постройте эмпирические функции распределения (относительные и накопленные частоты) для роста (в см) группы из 20 мужчин: 181, 169, 178, 178, 171, 179, 172, 181, 179, 168, 174, 167, 169, 171, 179, 181, 181, 183, 172, 176.
2. Найдите распределение по абсолютным частотам для следующих результатов тестирования в баллах: 79, 85, 78, 85, 83, 81, 95, 88 и 97 (используйте границы интервалов 70, 79, 89).
3. Постройте эмпирические функции распределения (абсолютные и накопленные частоты) успеваемости в группе из 20 студентов: 4, 4, 5, 3, 4, 5, 4, 5, 3, 5, 3, 3, 5, 4, 5, 4, 3, 5, 3, 5.
Задание:
1. Найдите среднее значение и стандартное отклонение результатов бега на дистанцию 100 м у группы студентов: 12,8; 13,2; 13,0; 12,9; 13,5; 13,1.
2. Найдите выборочные среднее, медиану, моду, дисперсию и стандартное отклонение для следующей выборки 26, 35, 29, 27, 33, 35, 30, 33, 31, 29.
3. Определите верхнюю (0,75) и нижнюю (0,25) квартили для выборки результатов измерений роста группы студенток: 164,160,157,166,162,160,161,159, 160, 163, 170, 171. Определите выборочные асимметрию и эксцесс.
4. Найдите наиболее популярный туристический маршрут из четырех фирмой (моду), если за неделю последовательно были реализованы маршруты (приводятся номера маршрутов): 1, 3, 3, 2, 1, 1, 4, 4, 4, 1, 4, 4, 3, 1, 2, 3, 4, 1, 1, 3.
5. В рабочей зоне производились замеры концентрации вредного вещества. Ряд значений (в мг/м3): 12, 16, 15, 14, 10, 20, 16, 14, 18, 14, 15. Необходимо определить основные выборочные характеристики.
6. Стоимость набора из 25 продуктов питания по некоторым городам северного Казахстана по состоянию на декабрь 1998 г. приведена на рисунке 8.
Рисунок 8. Исходные данные
Необходимо рассчитать основные показатели описательной статистики и сделать соответствующие выводы.
Задание:
1. Для определения средней цены свинины в розничной торговле города предполагается организовать выборочную регистрацию цен. Известно, что цены на говядину колеблются от 600 до 1000 тг. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены свинины не превышало 400 тг. за 1 кг. Известно, что в городе продажу мяса осуществляют 500 торговых точек.
2. На предприятии с числом работающих 2500 человек провели выборочный опрос о занятиях спортом в выходные дни. Из 500 опрошенных 100 человек регулярно занимаются спортом в выходные дни. Какова численность работников предприятия, занимающихся спортом? Ответ дайте с вероятностью 0,90.
3. На основе случайной выборки 500 постоянных курильщиков установлено, что они тратят в среднем на сигареты 1800 тг. в неделю при стандартном отклонении ± 200 тг. Укажите: а) точечную оценку недельных затрат на сигареты; б) доверительные границы недельных затрат на сигареты с вероятностью 95%.
4. Двое рабочих на одинаковых станках изготавливают одинаковые детали. Было взято случайным образом по 200 деталей, изготовленных каждым из них, и оказалось, что число бракованных деталей у первого рабочего составило 12, а у второго – 18. Определите: есть ли существенная разница в проценте допускаемого ими брака; б) сколько нужно взять деталей, изготовленных каждым рабочим, чтобы обнаружить разницу в доле брака по крайней мере в 4%.
5. Аудитору для проверки нужно отобрать каждый 20-й файл с документами из 1000, начиная с 5-го файла. Какие номера файлов подлежат аудиторской проверке и можно ли назвать такую выборку просто случайной выборкой?
6. Из партии в 4800 шт. отобрано методом случайного бесповторного отбора 800 деталей. Результаты выборки оказались следующие: средний диаметр отобранных деталей – 200 мм; среднее квадратическое отклонение – 7 мм. Определите с вероятностью 0,954.
Границы, в которых можно ожидать средний диаметр детали во всей партии.
7. При обследовании бюджета времени студентов были учтены затраты времени на обед в столовой института. Обследовано 60 студентов, отобранных в порядке случайной выборки. Из них: 5 студентов затратили на обед 21 мин, 10 студентов – 27, 30 студентов – 33, 12 студентов – 39, 3 студента – 45 мин. Определить среднее затраты времени на обед студентами института (с вероятностью 0,97).
8. Абсолютная предельная ошибка выборки при определении среднего размера диаметра деталей составила 0,75 мм, что в процентах к средней составляет 10%-ную относительную ошибку. Определить, в каких пределах находится средний размер диаметра деталей в генеральной совокупности.
9. При обследовании жилищ в городе был произведен механический отбор по списку всех домов с долей отбора, равной 1/50. Из общего числа домов в выборке, равного 8491, нуждались в ремонте 627 домов. Сколько домов в городе нуждается в ремонте? Ответ дайте с вероятностью 0,997.
10. Случайная выборка 800 домохозяек в центре города и их опрос, проведенный утром, показатели, что 450 из них хотели, чтобы торговый центр города был пешеходной зоной. Определите доверительные пределы доли всех домохозяек, кто бы придерживался того же мнения ( с вероятностью 90%).
1. Определите, лежит ли значение 19 внутри границ 95%-ного доверительного интервала выборки 2, 3, 5, 7, 4, 9, 6, 4, 9, 10, 4, 7, 19.
2. Определите с уровнем значимости α= 0,05 максимальное отклонение среднего значения генеральной совокупности от среднего выборки 3, 4, 4, 2, 5, 3, 4, 3, 5, 4, 3, 5, 6.
3. Найдите соответствие экспериментальных данных нормальному закону распределения для следующей выборки весов детей (кг): 21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26,26, 26, 26, 26, 26, 26, 27, 27.
4. Даны результаты бега на дистанции 100 м в секундах в двух группах студентов. Студенты первой группы в течение года посещали факультативные занятия по физкультуре. Определите, достоверны ли отличия по результатам бега в этих группах таблица 4.
Таблица 4 - Исходные данные
Посещавшие факультатив | Не посещавшие |
12,6 | 12,8 |
12,3 | 13,2 |
11,9 | 13,0 |
12,2 | 12,9 |
13,0 | 13,5 |
12,4 | 13,1 |
5. В ходе социологического опроса на вопрос о перенесенном в детстве заболевании ответы распределились следующим образом таблица 5:
Таблица 5 - Исходные данные
Да | Нет | Не помню | |
Мужчины | 58 | 11 | 10 |
Женщины | 35 | 25 | 23 |
Есть ли достоверные отличия в ответах женщин и мужчин?
6. Приведены данные ежемесячной результативности (количество голов) фут больной команды в двух сезонах таблица 6:
Таблица 6 - Исходные данные
Месяц | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
2000г. | 3 | 4 | 5 | 8 | 9 | 1 | 2 | 4 | 5 |
2001г. | 6 | 19 | 3 | 2 | 14 | 4 | 5 | 17 | 1 |
Определите, есть ли статистические различия в ежемесячной результативности команды в рассматриваемых сезонах?
7. Определите, имеют ли выборки {6; 7; 9; 15; 21} и {20; 28; 31; 38; 40} различные уровни разнородности (отличаются ли дисперсии)?
8. Определите, достоверны ли различия в количестве приобретаемых туристских путевок семейными парами и отдельными туристами таблицы 7.
Таблица 7- Исходные данные
Количество приобретаемых путевок | ||||||
Месяцы | 1 | 2 | 3 | 4 | 5 | 6 |
Пары | 67 | 75 | 58 | 89 | 96 | 94 |
Одиночки | 43 | 56 | 78 | 87 | 85 | 90 |
9. В таблице приведены результаты группы студентов по скоростному чтению до и после специального курса по быстрому чтению таблица 8.
Таблица 8 - Исходные данные
Студент | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
До курса | 86 | 83 | 86 | 70 | 66 | 90 | 70 | 85 | 77 | 86 |
После | 82 | 79 | 91 | 77 | 68 | 86 | 81 | 90 | 85 | 94 |
Произошли ли статистически значимые изменения скорости чтения у студентов?
10. Даны выборочные данные о расходе сырья при производстве продукции по старой и новой технологиям таблица 9.
Таблица 9 - Исходные данные
Номер изделия | Старая технология | Новая технология |
1 | 2 | 3 |
1 | 308 | 308 |
2 | 308 | 304 |
3 | 307 | 306 |
4 | 308 | 306 |
5 | 304 | 306 |
6 | 307 | 304 |
7 | 307 | 304 |
8 | 308 | 304 |
9 | 307 | 306 |
10 | 304 |
продолжение таблицы 9
1 | 2 | 3 |
11 | 303 | |
12 | 304 | |
13 | 303 |
При уровне значимости α = 0,05 требуется проверить гипотезу Н0:ах = ау, предположив, что соответствующие генеральные совокупности Х и Y имеют нормальные распределения:
1) с одинаковыми дисперсиями и ;
2) с различными дисперсиями и .
11. Выборочные данные о расходе сырья по старой и новой технологиям приведены в таблице 10. Можно ли при уровне значимости α = 0,05 считать статистически незначимым различие между оценками и , рассчитанными и приведенными на рисунке 20.
Таблица 10 - Исходные данные
Старая | Новая | |
Среднее | 307,111 | 304,769 |
Дисперсия | 1,611 | 2,192 |
Наблюдения | 9 | 13 |
Объединенная дисперсия | 1,960 | |
Гипотетическая разность средних | 0 | |
df | 20 | |
t-статистика | 3,858 | |
P(T<=t) одностороннее | 0,0005 | |
t критическое одностороннее | 1,725 | |
P(T<=t) двухстороннее | 0,001 | |
t критическое двухстороннее | 2,086 |
Задание:
1. Определите, влияет ли фактор образования на уровень зарплаты в гостинице на основании следующих данных таблица 16:
Таблица 16 – Исходные данные
Образование | Зарплата сотрудника | |||||
Высшее | 3200 | 3000 | 2600 | 2000 | 1900 | 1900 |
Среднее спец. | 2600 | 2000 | 2000 | 1900 | 1800 | 1700 |
Среднее | 2000 | 2000 | 1900 | 1800 | 1700 | 1700 |
2. Выборочные данные об объеме работ, выполненных на стройке (за смену) четырьмя бригадами, приведены в таблице 17.
Таблица 17 – Исходные данные
Объем выполненной работы | ||||
Номер бригады | Бригада 1 | Бригада 2 | Бригада 3 | Бригада 4 |
1 | 140 | 150 | 148 | 150 |
2 | 144 | 149 | 149 | 155 |
3 | 142 | 152 | 146 | 154 |
4 | 145 | 150 | 147 | 152 |
При уровне значимости α= 0,05 требуется выяснить, зависит ли объем выполненных работ от работающей бригады.
3. Выборочные данные о разрывной нагрузке пряжи, изготовленной на разных станках и из отличающегося некоторым образом друг от друга сырья, приведены в таблице 18.
Таблица 18 – Исходные данные
Тип станка | Вид сырья | |
Шелк натуральный | Шелк искусственный | |
JANOME | 10 | 50 |
HUSQVARNA | 20 | 60 |
SINGER | 30 | 100 |
Требуется при уровне значимости α = 0,05 выяснить, влияют ли на качество пряжи, измеряемое величиной разрывной нагрузки, тип станка и вид сырья, из которого пряжа производится.
Для решения задачи используем режим работы используйте режим «Двухфакторный дисперсионный анализ без повторений».
4. Выборочные данные об урожайности пшеницы, выращенной на участках, на которые вносились различные виды удобрений и которые подвергались различной химической обработке, приведены в таблице 19.
Требуется при уровне значимости α = 0,05 выяснить, влияют ли на урожайность пшеницы вид удобрения и способ химической обработки почвы.
Рассматриваемый в задаче эксперимент представляет собой факторный эксперимент типа 4х4, при котором четыре вида удобрений (фактор А) пересекаются с использованием четырех способов химической обработки почвы (фактор В). Таким образом, в плане эксперимента имеется 16 условий. Но в отличие предыдущей задачи здесь каждому условию соответствует не одно, а три значения (3 участка земли, засеянных пшеницей).
Для решения задачи используем режим работы «Двухфакторный дисперсионный анализ с повторениями».
Таблица 19 – Исходные данные
Номер участка | Вид удобрения | Способ химической обработки | |||
Способ 1 | Способ 2 | Способ 3 | Способ 4 | ||
Участок 1 | Удобрение 1 | 21,4 | 20,9 | 19,6 | 17,6 |
Участок 2 | 21,2 | 20,3 | 18,8 | 16,6 | |
Участок 3 | 20,1 | 19,8 | 16,4 | 17,5 | |
Участок 1 | Удобрение 2 | 12,0 | 13,6 | 13,0 | 13,3 |
Участок 2 | 14,2 | 13,3 | 13,7 | 14,0 | |
Участок 3 | 12,1 | 11,6 | 12,0 | 13,9 | |
Участок 1 | Удобрение 3 | 13,5 | 14,0 | 12,9 | 12,4 |
Участок 2 | 11,9 | 15,6 | 12,9 | 13,7 | |
Участок 3 | 13,4 | 13,8 | 12,1 | 13,0 | |
Участок 1 | Удобрение 4 | 12,8 | 14,1 | 14,2 | 12,0 |
Участок 2 | 13,8 | 13,2 | 13,6 | 14,6 | |
Участок 3 | 13,7 | 15,3 | 13,3 | 14,0 |
1. Определить, имеется ли взаимосвязь между рождаемостью и смертностью (количество на 1000 человек) в Санкт - Петербурге таблица 21:
Таблица 21 - исходные данные
Годы | Рождаемость | Смертность |
1991 | 9,3 | 12,5 |
1992 | 7,4 | 13,5 |
1993 | 6,6 | 17,4 |
1994 | 7,1 | 17,2 |
1995 | 7,0 | 15,9 |
1996 | 6,6 | 14,2 |
2. Определить, имеется ли взаимосвязь между Годовым уровнем инфляции (%), ставкой рефинансировани (%) и курсом доллара (руб./$), по следующим данным ежегодных наблюдений таблица 22:
Таблица 22 - исходные данные
Уровень инфляции | Ставка рефинансирования | Курс доллара |
84 | 85 | 6,3 |
45 | 55 | 14 |
56 | 65 | 20 |
34 | 40 | 28 |
23 | 28 | 29 |
1. В отделе снабжения гостиницы имеется информация об изменении стоимости стирального порошка за длительный период времени. Сопоставляя его с изменениями курса доллара за этот же период времени, можно построить регрессионное уравнение. Ниже приведены стоимость пачки стирального порошка (в руб.) и соответствующий курс доллара (руб./USD таблицы 25).
Таблица 25 – Исходные данные
№ | Порошок | Курс |
1 | 5 | 6,3 |
2 | 7 | 9 |
3 | 9 | 12 |
4 | 12 | 15 |
5 | 15 | 19 |
6 | 16 | 21 |
7 | 20 | 25 |
8 | 25 | 29,3 |
Необходимо на основании этих данных построить регрессионное уравнение, позволяющее по курсу доллара определять предполагаемую стоимость пачки стирального порошка. Сделать результаты анализа.
2. Построить регрессионную модель для предсказания изменений уровня заболеваемости органов дыхания (Y) в зависимости от содержания в воздухе двуокиси углерода (Х1) и степени запыленности (Х2). В таблице 26 приведены данные наблюдений в течение 29 месяцев.
Таблица 26 – Исходные данные
X1 | X2 | Y |
1 | 1,3 | 1160 |
1 | 1,3 | 1155 |
1,1 | 1,4 | 1158 |
1,1 | 1,4 | 1157 |
1,1 | 1,5 | 1160 |
1,1 | 1,5 | 1161 |
1 | 1,4 | 1157 |
1 | 1,5 | 1159 |
1,2 | 1,6 | 1256 |
1,2 | 1,7 | 1260 |
0,6 | 1 | 1040 |
0,6 | 1 | 1039 |
0,7 | 1,1 | 1039 |
0,7 | 1,15 | 1040 |
0,75 | 1,2 | 1040 |
0,7 | 1,2 | 1039 |
0,7 | 1,3 | 1040 |
0,7 | 1,3 | 1039 |
0,8 | 1,4 | 1140 |
0,8 | 1,4 | 1138 |
0,78 | 1,5 | 1240 |
0,8 | 1,5 | 1239 |
0,78 | 1,5 | 1241 |
0,78 | 1,6 | 1240 |
0,8 | 1,7 | 1239 |
0,8 | 1,8 | 1239 |
0,75 | 1,8 | 1240 |
0,78 | 1,9 | 1238 |
0,75 | 1,9 | 1238 |
3. Постройте зависимость зарплаты (руб.) от возраста сотрудника гостиницы по следующим данным таблица 27.
Таблица 27 – Исходные данные
Возраст | Зарплата |
20 | 800 |
50 | 2500 |
45 | 2500 |
40 | 2000 |
25 | 1200 |
30 | 1800 |
4. Постройте зависимость жизненной емкости в литрах (Y) от роста в метрах (X1) и возраста в годах (X2) для группы мужчин таблица 28.
Таблица 28 – Исходные данные
X1 | X2 | Y |
1,85 | 18 | 5,4 |
1,8 | 25 | 5,7 |
1,75 | 20 | 4,8 |
1,7 | 24 | 5,1 |
1,68 | 21 | 4,5 |
1,73 | 19 | 4,8 |
1,77 | 22 | 5,1 |
1,81 | 23 | 5,6 |
1,76 | 18 | 4,7 |
5. Определите должное значение жизненной емкости легких для мужчины возраста 22 лет и роста 183 см из регрессионного уравнения, полученного в предыдущем упражнении.
6. Имеются данные о цене на нефть х (ден. ед.) и индексе акций нефтяных компаний у (усл. ед.) таблица 29.
Таблица 29 – Исходные данные
X | Y |
17,28 | 537 |
17,05 | 534 |
18,30 | 550 |
18,80 | 555 |
19,20 | 560 |
18,50 | 552 |
Постройте зависимость индекса акций нефтяных компаний от цены на нефть.
Найти модель методом полного факторного эксперимента (ПФЭ), включив в план эксперимента по 4 фактора и их взаимодействия, в зависимости от варианта (таблица 33) и выполнив следующие этапы:
- планирование эксперимента;
- проведение эксперимента на объекте исследования;
- проверка воспроизводимости (адекватности выборочных дисперсий) эксперимента;
- получение математической модели объекта с проверкой статистической значимости выборочных коэффициентов регрессии;
- проверка адекватности математического описания.
Таблица 33 – Взаимодействие факторов (ПФЭ)
№ варианта | Взаимодействия факторов | ||
1 | 2 | 3 | 4 |
0 | Z1Z2 | Z1Z4 | Z1Z2Z4 |
1 | Z1Z4 | Z2Z4 | Z1Z2Z4 |
2 | Z1Z2 | Z2Z4 | Z1Z2Z4 |
3 | Z1Z3 | Z2Z3 | Z1Z2Z3 |
4 | Z1Z2 | Z2Z3 | Z1Z2Z3 |
5 | Z1Z2 | Z1Z3 | Z1Z2Z3 |
6 | Z2Z3 | Z2Z4 | Z2Z3Z4 |
7 | Z1Z3 | Z3Z4 | Z1Z3Z4 |
8 | Z1Z3 | Z1Z4 | Z1Z3Z4 |
9 | Z1Z4 | Z3Z4 | Z1Z3Z4 |
10 | Z2Z3 | Z3Z4 | Z2Z3Z4 |
Комментариев нет:
Отправить комментарий