Студопедия
Новини освіти і науки:
Контакти
 


Тлумачний словник






Генеральною називають сукупність об’єктів, з якої зроблено вибірку. Об’єм генеральної сукупності позначають .

Простим випадковим (простою випадковою вибіркою)називають такий відбір із статистичної сукупності, при якому кожний об’єкт, що відбирається, має однакову імовірність потрапити до вибірки. Об’єм вибіркової сукупності (вибірки) – це кількість об’єктів цієї сукупності.Варто відмітити, що альтернативою для простої випадкової вибірки в статистиці є розшарована випадкова вибірка.

Такі множини однорідних об’єктів називають статистичною сукупністю.

Наприклад, якщо досліджують партію деталей, то якісною ознакою може бути стандартність або нестандартність кожної деталі, а кількісною ознакою– розмір деталі. Кількісні ознаки бувають дискретними та неперервними.

Перевірку статистичної сукупності можна провести двома способами:

1) перевірити усі об’єкти сукупності (суцільна перевірка або перепис);

2) перевірити лише певну частину об’єктів сукупності (вибірка).

Перевагами вивчення вибірки є малі затрати коштів, обладнання та часу. Вибірку можна ефективно застосовувати для вивчення відповідної ознаки усієї сукупності лише тоді, коли дані вибірки вірно відображають цю ознаку, тобто вибірка повинна бути репрезентативною (представницькою, показною).Згідно із законом великих чисел теорії імовірностей можна стверджувати , що вибірка буде репрезентативною лише тоді, коли її здійснюють випадково.

Вибірки бувають повторні(при яких відібраний об’єкт повертається до генеральної сукупності перед відбором іншого об’єкта) та безповторні(при яких взятий об’єкт до генеральної сукупності не повертається). Найчастіше використовуються безповторні вибірки.

ДЖЕРЕЛА ДАНИХ У СТАТИСТИЦІ.

Дослідники і менеджери отримують дані, необхідні для прийняття рішень, в основному, з трьох джерел:

1) вибіркові обстеження;

2) спеціально поставлені експерименти;

3) результати повсякденної (рутинної) роботи у бізнесі.

Приклади: 1) дослідницький центр вибирає 1000 потенційних виборців для опитування з метою вивчення рейтингу певного кандидата на виборах; 2) проведення анкетування серед певної групи людей за спеціально розробленою анкетою; 3) аналіз даних рівня продажу певного виду товару, різноманітні офіційні джерела статистичних даних.

Джерела даних бувають первинними та вторинними.

Первинні дані збираються спеціально для статистичного дослідження. Для цих даних є відомості про методи збирання, точність даних тощо.

Вториннимиє дані, що використовуються у статистиці, але спочатку збирались для інших цілей. Очевидно, що рутинні записи про діяльність фірм, офіційні статистичні звіти є вторинними даними.

Безумовно, більш цінними є первинні дані, але їх не завжди можна отримати, тому часто використовуються вторинні дані.

СПОСОБИ ВІДБОРУ.

1. Вибір, який не потребує розділення генеральної сукупності на частини. До цього вибору відносять:

- простий випадковий безповторний відбір;

- простий випадковий повторний відбір.

2. Вибір, при якому генеральна сукупність розділяється на частини (розшарований випадковий відбір). До цього виду вибору відносять:

- типовий відбір;

- механічний відбір;

- серійний відбір.

Типовимназивають відбір, при якому об’єкти відбирають не із усієї генеральної сукупності, а лише із її типових частин. Наприклад, якщо однакові вироби виготовляються на різних підприємствах (або різними станками), то відбираються вироби кожного окремого підприємства (станка) тощо.

Механічнимназивають відбір, при якому генеральна сукупність механічно поділяється на стільки частин, скількимає бути об’єктів у вибірці. Із кожної частини випадковим чином відбирають один об’єкт. Наприклад, якщо потрібно перевірити 25% усіх виготовлених виробів, то відбирають кожний четвертий виріб. Зазначимо, що для репрезентативності механічного відбору потрібно враховувати специфіку технологічного процесу.

Серійнимназивають відбір, при якому об’єкти із генеральної сукупності відбирають не по одному, а серіями. Серійний відбір застосовують тоді, коли ознака, яку досліджують, мало змінюється у різних серіях.

Зауважимо, що в економічних дослідженнях застосовують і комбіновані відбори.

ПРОСТА ВИПАДКОВА ВИБІРКА.

Для здійснення простої випадкової вибірки необхідна наявність основи вибірки,тобто такого представлення генеральної сукупності, при якому її елементи були б принаймні перераховані.

Приклад. а) генеральна сукупність – всі клієнти банку. Основою вибірки можуть бути робочі списки клієнтів, що вів банк.

б) генеральна сукупність – всі мешканці міста,які мають телефон. Основою вибірки може бути телефонний довідник.

Як правило, дані для утворення простої випадкової вибірки подаються у вигляді деякої, заздалегідь складеної таблиці і тому основою вибірки є нумерація елементів цієї таблиці.

Основа вибірки повинна повністю відбивати ознаку генеральної сукупності, яка вивчається. Порушення цієї вимоги може зробити вибірку нерепрезентативною.

Приклад. Для обстеження молодих сімей міста на предмет наявності в них дітей дошкільного віку дослідник випадковим чином за допомогою телефонного довідника обзвонює сім’ї з 18.00 до 21.00 щодня. Чи буде така вибірка репрезентативною?

 

Приклад. Проста випадкова вибірка може використовуватись у наступних дослідженнях:

а) телефонна компанія перевіряє рахунки 10% всіх міжнародних телефонних переговорів з метою визначення їх середньої величини;

б) аудиторська перевірка 20% фірм регіону з метою контроля правильності сплати податків.

Загальновідомо, що найкращим способом здійснення простої випадкової вибірки є використання випадкових вибіркових чисел (їх таблиць або за допомогою стандартних комп’ютерних програм, зокрема, функції “выборка” електронних таблиць Excel).

 

 

СТАТИСТИЧНИЙ РОЗПОДІЛ ОЗНАКИ.

 

Дані у статистиці, отримані за допомогою спеціальних досліджень або із робочих (рутинних) записів у бізнесі, надходять до дослідника у вигляді неорганізованої маси (незалежно від того, чи є вони вибірковими, чи даними із генеральної сукупності). В математичній статистиці замість слова “дані” вживається термін “варіанти”. Характеристику варіанти (випадкову величину) при цьому називають ознакою.

Нехай із генеральної сукупності взята вибірка об’єктів об’єму , для вивчення ознаки . Тобто, значення є варіанти ознаки . Першим кроком обробки є впорядкування варіант. Розглянемо приклад:

 

Вибірка середньомісячної зарплати 100 співробітників фірми

 

Розташуємо дані у порядку зростання:

 

Впорядкована вибірка середньомісячної зарплати 100 співробітників фірми (у порядку зростання)

 

Варіанти, записані до таблиці у зростаючому (спадаючому) порядку, називають варіаційним рядом. При упорядкуванні (ранжуванні) можна отримати більше інформації, наприклад, про межі зміни середньомісячної зарплати.

РОЗПОДІЛ ЧАСТОТ.

Нехай у вибірці із варіант ознака прийняла значення раз, значення раз, …, значення раз.

Додатне число, що вказує, скільки раз та чи інша варіанта зустрічається в таблиці даних, називається частотою, а ряд називається рядом частот. Відмітимо, що сума усіх частот повинна дорівнювати об’єму вибірки: .

Статистичний розподіл вибірки встановлює зв’язок між рядом варіант, що зростає або спадає, і відповідними частотами. Як правило, його подають у вигляді таблиці:

 

Заданий такою таблицею розподіл називають простим незгрупованим статистичним розподілом або розподілом частоти варіанти (рядом розподілу частоти варіанти).

Розподіл частоти середньомісячної зарплати співробітників фірми

.

 

Подальшим кроком в обробці даних, що призводить до спрощення досліджень, є їх згрупування. Як видно із останньої таблиці максимальне та мінімальне значення варіанти будуть

.

Різниця цих чисел

називається варіаційним розмахом або розмахом варіант.

Введемо для варіанти інтервали зміни середньої зарплати: 280-290, 290-300,…, 380-390. Кожний інтервал називається класом інтервалів або класом, а число одиниць виміру у цих класах, тобто різниця , називається шириною класу. Використовуючи дані попередньої таблиці, отримуємо:

Згрупований розподіл частоти середньомісячної зарплати співробітників фірми
280-290
290-300
300-310
310-320
320-330
330-340
340-350
350-360
360-370
370-380
380-390
сума

 

Така таблиця, яка встановлює зв’язок між згрупованим рядом варіант, що зростає або спадає, та сумами їхніх частот по класах, називається згрупованим розподілом частоти варіанти. У нашому прикладі ширина класів однакова і дорівнює , а кількість класів . Зазначимо, що введені величини варіаційний розмах, ширина класів та їх кількість пов’язані співвідношенням

.

Зауваження. Інколи неможливо або небажано вибирати ширину класів однаковою. Неоднакова ширина класів бажана, наприклад, коли значення частоти одного чи декількох класів набагато більша (менша) значень частот інших інтервалів. Як правило, ширина інтервалів зростає (або спадає) і може містити інтервали відкритого типу “більше ніж…”, “менше ніж…”.

 

ЗГРУПОВАНИЙ РОЗПОДІЛ НАКОПИЧЕНОЇ ЧАСТОТИ.

Часто поряд із розподілом частоти варіанти необхідно мати розподіл пакопиченої (кумулятивної) частоти. Такий розподіл одержується послідовним додаванням частот чергового інтервалу, починаючи з першого і зікінчуючи останнім (див.таблицю):

Згрупований розподіл частоти середньомісячної зарплати співробітників фірми
інтервали платні частоти платня накопичені частоти
280-290 <290
290-300 <300
300-310 <310
310-320 <320
320-330 <330
330-340 <340
340-350 <350
350-360 <360
360-370 <370
370-380 <380
380-390 <390
сума    

 

Розподіл накопиченої частоти дозволяє відповісти на питання: “Скільки існує варіант, менших, наприклад, 350?” Із таблиці знаходимо: .

 

РОЗПОДІЛ ЧАСТКИ (ВІДНОСНОЇ ЧАСТОТИ АБО ЧАСТОСТІ).

Часто замість значень частот використовуються відношення частоти варіанти до об’єму вибірки :

,

які називаються частками (відносними частотами або частостями), причому .

Залежність між впорядкованим рядом варіант і відповідними їм частками також називають статистичним розподілом вибірки (див.таблицю):

Згрупований розподіл частки та накопиченої частки середньомісячної зарплати співробітників фірми
інтервали платні частоти частки платня накопичені частоти накопичені частки
280-290 0,01 <290 0,01
290-300 0,1 <300 0,11
300-310 0,14 <310 0,25
310-320 0,14 <320 0,39
320-330 0,25 <330 0,64
330-340 0,16 <340 0,80
340-350 0,07 <350 0,87
350-360 0,04 <360 0,91
360-370 0,07 <370 0,98
370-380 0,00 <380 0,98
380-390 0,02 <390
сума      

 

Розподіл накопиченої частки дозволяє відповісти на питання: “Яка частка варіант, що менші, наприклад, 350?” Із таблиці знаходимо: частка цих варіант становить 0,87.

 

ЗГРУПОВАНИЙ РОЗПОДІЛ ЩІЛЬНОСТЕЙ ЧАСТОТИ ТА ЧАСТКИ.

 

Якщо поділити всі частоти на ширину інтервалу, то отримаємо розподіл щільності частотивибірки:

.

Якщо поділити всі частки на ширину інтервалу, то отримаємо розподіл щільності часткивибірки:

.

Відзначимо, що поняття щільностей мають глибокий імовірністний смисл.

Уведемо до попередньої таблиці стовпці щільностей частот та часток:

 

 

інтервали платні часто-ти частки щіль-ність часто-ти щіль-ність частки платня накопичені частоти накопичені частки
280-290 0,01 0,1 0,001 <290 0,01
290-300 0,1 1,0 0,010 <300 0,11
300-310 0,14 1,4 0,014 <310 0,25
310-320 0,14 1,4 0,014 <320 0,39
320-330 0,25 2,5 0,025 <330 0,64
330-340 0,16 1,6 0,016 <340 0,80
340-350 0,07 0,7 0,007 <350 0,87
350-360 0,04 0,4 0,004 <360 0,91
360-370 0,07 0,7 0,007 <370 0,98
370-380 0,00 0,0 0,000 <380 0,98
380-390 0,02 0,2 0,002 <390
сума          

 

ЗАГАЛЬНА СХЕМА ПОБУДОВИ ЗГРУПОВАНОГО РОЗПОДІЛУ ЧАСТОТ.

1. Визначити найбільше та найменше значення варіанти і визначити варіаційний розмах .

2. Задатися певним числом класів , яке рекомендується брати непарним, при об’ємах вибірки доцільно , а при менших об’ємах вибірки можна .

3. Визначити ширину класів . Для спрощення розрахунків, отримане значення ширини класів слід округлити до найближчого цілого.

4. Встановити границі класів і підрахувати кількість варіант у кожному класі.

5. Визначити частоту для кожного класу і записати ряд розподілу.

 

ЕМПІРИЧНА ФУНКЦІЯ РОЗПОДІЛУ.

Нехай є статистичний розподіл частот деякої ознаки .

Означення. Емпіричною функцією розподілу (або функцією розподілу вибірки)називають функцію , яка визначає для кожного дійсного значення частість події , тобто:

,

де - кількість (частота) варіант, які менші від , а - об’єм вибірки.

Зауваження. Інтегральну функцію розподілу генеральної сукупності в математичній статистиці називають теоретичною функцією розподілу. Вона відрізняється від емпіричної функції розподілу тим, що визначає імовірність події , а не її частість. Із теореми Бернуллі випливає, що частість події прямує до імовірності цієї події. Тому доцільно використовувати емпіричну (вибіркову) функцію розподілу для представлення теоретичної фунції розподілу генеральної сукупності.

Між емпіричною функцією розподілу і функцією накопичених частот на кожному класі інтервалів:

.

 

ГРАФІЧНЕ ЗОБРАЖЕННЯ СТАТИСТИЧНИХ РОЗПОДІЛІВ.

Полігоном частотназивають ламану, відрізки якої з’єднують точки .

Полігоном часток (частостей або відносних частот)називають ламану, відрізки якої з’єднують точки .


Читайте також:

  1. H) інноваційний менеджмент – це сукупність організаційно-економічних методів управління всіма стадіями інноваційного процесу.
  2. Автоматизація водорозподілу регулюванням з перетікаючими об’ємами
  3. Адміністративні методи - це сукупність прийомів, впливів, заснованих на використанні об'єктивних організаційних відносин між людьми та загальноорганізаційних принципів управління.
  4. Алкени – вуглеводні, в молекулах яких є один подвійний зв’язок між атомами вуглецю . Алкені називають також олефінами або етиленовими вуглеводнями.
  5. Алкіни – вуглеводні, в молекулах яких є два атоми вуглецю, сполучені потрійним зв’язком - -. Алкіни називають також ацетиленовими вуглеводнями.
  6. Біоценоз – це сукупність усіх живих організмів в рамках даної екосистеми.
  7. Бюджетні установи отримують кошти на своє функціонування з бюджету виключно на основі фінансових документів, які називаються кошторисами.
  8. В 30-х роках було зроблено спробу систематизувати курс методики викладання літератури. Виходять такі праці.
  9. В цілому сукупність суспільного продукту – це сукупність благ і послуг, вироблених суспільством за певний період часу (як правило, за рік).
  10. Вади розвитку – це порушення внутрішньоутробного розвитку, відхилення від нормальної будови організму. Найлегші ступені вад розвитку називають аномаліями, найважчі – потворністю.
  11. Вибіркова дисперсія є ефективною, обгрунтованою, але ЗСУНУТОЮ точковою оцінкою для генеральної дисперсії .
  12. Визначення об’єму водосховища




<== попередня сторінка | наступна сторінка ==>
 | 

Не знайшли потрібну інформацію? Скористайтесь пошуком google:


 

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.008 сек.