Обработката на данните се извършва със статистически софтуер SPSS. Променливи за доходите Общия брутен и разполагаем доход на домакинството са изчислени според документ Doc065 за 2024 г. Всички лични и домакински доходи се събират чрез интервю. Където информацията е налична се ползват директно данните от административния източник. Националната агенция по приходите предоставя данни от данъчната декларация. Националният осигурителен институт предоставя данни за доходите от пенсии и други социално осигурителни плащания и от регистъра на осигурените лица. Агенцията за социално подпомагане предоставя данни за получените социални помощи и обезщетения. Интервюиращите и респондентите имат възможност за посочване на брутни или нетни компоненти на дохода. От 2012 г., доходите от работна заплата се събират само като нетни доходи. Формата, в която нетните суми се записват в базата данни са брутни доходи намалени с данък върху дохода при източника и социално-осигурителни вноски. Брутните доходи се получават чрез сумиране на нетните стойности, изчислените/посочени данъчни и осигурителни плащания. Ако липсва информация за платените данъци или осигуровки се прилагат разпоредбите на данъчното и осигурителното законодателство. Ако някои елементи на доходите са получени само брутни или само нетни се прилагат съоветните преизчисления за получаване на брутни от нетни доходи и обратно. Когато липсва информация за дохода се ползват данни от административните регистри на Националната агенция по приходите, Национален осигурителен институт и Агенция за социално подпомагане. Данните от административните източници се ползват и за валидиране на данните получени чрез интервю. Когато няма данни от административни източници се прилага регресионен метод за допълване на информацията Процедура по претегляне Базата данни съдържа следните тегла: - Домакинско тегло (целева променлива DB090) за получаване на действителния брой обикновени домакинства в страната;
- Персонално тегло (целева променлива RB050) за получаване на действителния брой лица на територията на страната;
- Персонално тегло за всеки член на домакинството на 16 и повече години (целева променлива PB040) за получаване на броя на лицата на 16 и повече години на територията на страната
Теглата са изчислени така че да се вземат предвид вероятността на единицата за попадане в извадката, липсата на отговор и адаптирането на извадката към външни данни, свързани с разпределението на домакинствата и лицата в целевата популация, местоживеене или административно-териториални области (NUTS 3). Претегляне на новата ротационна група Дизайн тегла За първата година от панела, всяко домакинство от новата ротационна група получава извадково тегло, обратно пропорционално на съответната вероятност за включване на домакинството в извадката. Тези тегла са дизайн теглата на домакинството DB080. - Корекция при липса на отговор
За коригиране на неотговорилите домакинства се използва процедурата “weigthing classes” - класове за претегляне. Домакинствата се разделят на класове, където се предполага, че вероятността за отговор е хомогенна в рамките на класовете. Поради липса на информация (демографски характеристики) за неотговорилите домакинства тези класове са извадковите страти. Изчислява се частното на теглата на отговорилите домакинства към теглата на всички домакинства в даденият клас. - Корекция спрямо външни данни (калибриране)
След отразяване на неотговорилите домакинства, базовите тегла за новата ротационна група се калибрират спрямо населението към 31.12.2023 година. За калибриране се използват следните променливи на индивидуално ниво и променливи на домакинско ниво: Индивидуално ниво | Домакинско ниво | Възраст*Пол: 6 групи (0-17, 18-64, 65+)*(мъже, жени) | Брой на домакинствата: 2 групи (градове, села) | Брой на лицата по области : 28 групи | |
Информацията за лицата към 31.12.2023 е налична от Информационна система Демография. Информацията за домакинствата е оценка от актуализираният файл на Преброяване 2021. Лицата родени през 2024 година не се включват в калибрирането, защото не са част от населението към края на 2023 година. За калибриране на теглата се използва SAS Macro Calmar 2. За калибриране се използва логистичният метод (М=3 в Calmar), като се задават горна и долна граница на g-теглата. G-теглата са частното на зададените тегла и крайните калибрирани тегла. Калибрираните тегла с отразени неотговорилите домакинства са базовите тегла (RB060) за новата ротационна група и ще бъдат използвани в следващите години в процедурата за претегляне. Тези тегла са и лонгитудиналните тегла (DB095) на домакинствата от новата ротационна група. Процедура за претегляне на ротационните групи от предишни вълни на наблюдение. Базовите тегла (RB060) за всяка ротационна група от предходната година се коригират с неотговорилите, за да се получат базовите тегла за настоящата година. Процедурата за корекция се прави на индивидуално ниво, а не на ниво домакинство. За коригиране на неотговорилите първо се маркират всички лица от регистъра (DB135 = 1 & RB110 in (1,2,3,4)) за 2023 и проследени през 2024 г., като отговорили (настоящи членове на домакинството). Лицата, които са напуснали домакинството между двете вълни на наблюдение се маркират като неотговорили. За изчисляване вероятността всяко лице да бъде проследено между двете вълни се използва логистична регресия. Теглата на проследените лица се поправят с вероятността за проследяване (резултат от логистичната регресия) и се получават базовите тегла (RB060) за 2024 година. Моделът се прилага за всяка ротационна група по отделно. Независимите променливи, които се прилагат в модела са: индикатори за бедност, образование, икономическа активност, възраст, пол, размер на домакинството, тип на домакинството, доход, тип на жилището. Зависимата променлива е дали лицето е проследено или не. Новодошлите лица след първата година, които не са част от извадката, получават базови тегла за настоящата година като следва: - Деца родени от извадкова майка, получават теглото на майката
- Лица дошли в извадково домакинство извън наблюдаваната съвкупност, получават базово тегло равно на средното базово тегло в това домакинство
- Лица дошли в извадково домакинство от друго не извадково домакинство от наблюдаваната съвкупност, получава базово тегло 0.
Споделяне на тегло. Според методологията на изследването, всички лица в дадено домакинство трябва да получат едно и също тегло (cross sectional weight). За целта всички лица в домакинството, включително и тези с нулеви тегла, получават средно тегло от базовите тегла на индивидите в рамките на съответното домакинство. След процедурите по отразяване на неотговорилите, всяка една от 5-те ротационни групи по отделно се калибрира по описания по-горе метод спрямо населението към 31.12.2023 година. Обединяване на 6-те под-извадки в една След приключване на описаните по-горе процедури по отразяване на неотговорилите и калибриране, отделните под-извадки (ротационни групи) трябва да бъдат обединени в една, тъй като всяка под-извадка по отделно възпроизвежда цялото население на страната към 31.12.2023 г. За обединяване на подизвадките всички тегла се умножават с подходящ „коригиращ“ фактор. Поради наличието на 6 ротационни групи за 2023 г., коригиращият фактор е 1/6. Крайни моментни (cross-sectional) тегла Калибриране на всички ротационни групи към текущото население След приключването на всички процедури теглата трябва да се калибрират спрямо населението към 31.12.2023 година. За калибриране се използват следните променливи на индивидуално ниво и променливи на домакинско ниво. Индивидуално ниво | Домакинско ниво | Възраст*Пол*Локация: 56 групи (14 възрастови групи)* (мъже жени)*(градове, села) | Брой на домакинствата: 2 групи (градове, села) | Области*Пол*Локация : 112 групи | | Брой пенсионери: 3 групи | |
Възрастовите групи са следните: (0-15) (16-19) (20-24) (25-29) (30-34) (35-39) (40-44) (45-49) (50-54) (55-59) (60-64) (65-69) (70-74) (75+) Използването на тези възрастови групи е препоръчано от ЕВРОСТАТ. От 2016 година се използва брой пенсионери, като калибрационна променлива. Променливата има 3 нива: - пенсионери получаващи пенсия за осигурителен стаж;
- пенсионери получаващи социални пенсии;
- всички останали.
За разпределяне на лицата към дадената съвкупност са използвани данни от НОИ - броят на личните пенсии към 31.12.2023 г. С добавянето на тази променлива се целят две неща. Първо да се подобрят оценките за пенсионерите и второ да се намали стохастичната грешка на индикатора AROPE. След калибрирането се получава крайното моментно (cross-sectional) тегло на домакинството DB090. Индивидуалното моментно (cross-sectional) тегло на едно лице (RB050) е равно на моментното тегло DB090 на неговото домакинство. (RB050=DB090). Родените през 2024 лица не участват в калибрирането. Те получават теглото на домакинството след калибрирането. Изчисляването на индивидуалните тегла на всички членове на домакинството на възраст 16 години и повече (PB040), се получават като се премахне възрастовата група (0-15) и се вземат предвид само отговорилите (или допълнените) на персоналния въпросник лица (RB250 in (11,14)). След това теглата се калибрират по описаните процедури и се получават персоналните тегла за лицата на 16 и повече години. |