Ви є тут

Методологічні принципи забезпечення надійності результатів вибіркових обстежень населення

Автор: 
Саріогло Володимир Георгійович
Тип роботи: 
Дис. докт. наук
Рік: 
2006
Артикул:
3506U000022
129 грн
Додати в кошик

Вміст

РОЗДІЛ 2
СТАТИСТИЧНЕ ОЦІНЮВАННЯ ВПЛИВУ ДИЗАЙНУ ВИБІРКИ
НА НАДІЙНІСТЬ РЕЗУЛЬТАТІВ ОБСТЕЖЕНЬ НАСЕЛЕННЯ
У даному розділі висвітлюються особливості врахування дизайну реальних вибірок,
сформованих для обстежень населення, при визначенні рівня надійності їх
результатів. Розглядаються джерела, тип, структура та якість зовнішньої
інформації, що використовується при формуванні вибірки, вплив зовнішньої
інформації на похибки при визначенні ймовірностей відбору і, відповідно,
величини базової ваги та характеристик надійності. Увагу також приділено таким
порівняно новим методологічним підходам, як врахування при розрахунках системи
ваг схем ротації одиниць у вибірці та процедур інтеграції даних на мікрорівні,
тобто на рівні осіб або домогосподарств. Обговорюються окремі питання якості
первинних даних вибіркових обстежень.
2.1. Дизайн вибірки для комплексних обстежень домогосподарств
Вибіркові обстеження населення проводяться для досягнення різних цілей. Це
можуть бути обстеження, призначені для збирання інформації за декількома
ознаками, що характеризують, наприклад, здоров’я населення або поінформованість
населення з певних питань. Такі обстеження називають дескриптивними (описовими)
[51]. Інші обстеження є багатоцільовими, і в них збирається інформація за
сотнями і навіть тисячами ознак. Прикладом таких обстежень є обстеження робочої
сили, обстеження доходів і витрат та ін. Ці обстеження іноді називають
аналітичними. Обстеження можуть бути одноразовими або проводитися на постійній
основі (щорічно, щоквартально, щомісячно). Обстеження можуть мати складний
дизайн вибірки, коли вибірка формується як багатоступінчаста, стратифікована, з
нерівними ймовірностями відбору одиниць.
За одним з визначень, дизайн вибірки – це розподіл імовірностей для всіх
можливих вибірок з генеральної сукупності [21, 51]. Цей розподіл визначає
статистичні властивості для всіх прямих оціночних функцій, що відповідають
вибірці, побудованій за встановленою схемою. Теоретично певний дизайн вибірки,
визначений таким чином, може бути отриманий на базі різних процедур формування
вибірки. Іноді фахівці, які займаються вибірковими обстеженнями на практиці,
включають до поняття дизайну вибірки і процедури її формування [18, 19].
Детальний розгляд питань і проблем розробки дизайну вибірки для обстежень
населення виходить за межі даної дисертації. Питання організації вибіркових
обстежень і, зокрема, розробки дизайну вибірки розглянуті у роботах українських
вчених (див., наприклад, [32, 33, 81, 84, 134, 136]). Але найбільш
фундаментальними є роботи [18, 20, 21, 51, 55].
Представляється доцільним розглянути окремі методологічні засади формування
вибірок для обстежень населення, що необхідно для більш адекватного уявлення
про особливості впливу дизайну вибірок на надійність результатів обстежень.
Базовим принципом, на якому ґрунтується можливість використання вибіркових
обстежень для оцінювання показників генеральної сукупності, є те, що
математичне сподівання оцінки певного показника за результатами вибіркового
обстеження визначається за формулою [21]:
, (2.1)
де – математичне сподівання оцінки певного показника за всіма вибірками певного
дизайну та обсягу ;
– імовірність формування певної вибірки встановленого дизайну та обсягу;
– оцінка показника за вибіркою .
Звернемо увагу, що у формулі (2.1) підсумовування здійснюється за всіма
можливими вибірками даного дизайну та обсягу.
За таких умов імовірність включення до вибірки певної одиниці розраховується як
сума імовірностей формування всіх вибірок, що містять цю одиницю:
, (2.2)
де – імовірність включення до вибірки певної одиниці , =1,2,..., (– обсяг
генеральної сукупності).
Оцінка показника (оцінка Гурвіца-Томпсона) за певною вибіркою обсягу
розраховується за формулою:
(2.3)
де – значення ознаки для одиниці ;
– статистична вага одиниці , включеної до вибірки , що визначається за
формулою:
. (2.4)
Таким чином, зміст статистичної ваги (ваги дизайну або базової ваги) полягає в
тому, що вона є величиною, оберненою до загальної ймовірності включення певної
одиниці до всіх можливих вибірок заданого дизайну та обсягу, які містять цю
одиницю.
Для кожної одиниці , включеної до вибірки, виконується наступне співвідношення:
. (2.5)
Розглянемо приклад. Нехай генеральна сукупність складається з п’яти одиниць –
a,b,c,d,e. Необхідно побудувати вибірку обсягом 2 одиниці. Кількість можливих
вибірок обсягом 2 одиниці з генеральної сукупності обсягом 5 одиниць
розраховується за формулою [20]:

. (2.6)
Цікаво відмітити, що величина у фізиці, точніше у термодинаміці, називається
статистичною вагою певного стану системи [136]. Вона показує кількість
перестановок, які не призводять до зміни стану системи для зовнішнього
спостерігача. В даному випадку система розділена на дві частини – одиниці, що
потрапили до вибірки, і одиниці, що до неї не потрапили.
Таким чином у прикладі, що розглядається, можуть бути побудовані десять
безповторних (без повернення) різних вибірок. Тут приймається також, що порядок
елементів не має значення, тобто, наприклад, вибірка a,b ідентична вибірці b,a.
Наведемо ці десять вибірок (див. також рис. 2.1) :
1) a,b; 2) a,c; 3) a,d; 4) a,e; 5) b,c; 6) b,d; 7) b,e; 8) c,d; 9) c,e; 10)
d,e.
Базова статистична вага одиниці, якщо вона включена до вибірки, дорівнюватиме:
. Ця величина є кількістю випадків (перестановок), в яких одиниця d включається
до вибірки (статистична вага цього стану системи), і дорівнює чотирьом при
десяті можливих перестановках. На рис. 2.1 елементи, що потрапили до певної
вибірки, виділені темним кольором.
№ вибірки