Европейска SDMX структура за метаданни (ESMS)
Контакт | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Организация | Национален статистически институт | ||||||||||||||||||||
Отдел | „Статистика на условията на живот“ | ||||||||||||||||||||
Лице за контакт | Д-р Десислава Димитрова | ||||||||||||||||||||
Длъжност | началник отдел | ||||||||||||||||||||
Адрес | ул.“П. Волов“ № 2, София 1038 | ||||||||||||||||||||
Електронна поща | |||||||||||||||||||||
Телефон | +359 2 9857 183 | ||||||||||||||||||||
Факс | |||||||||||||||||||||
Актуализиране на метаданните | |||||||||||||||||||||
Дата на потвърждаване | 29 април 2024 г. | ||||||||||||||||||||
Дата на публикуване | 29 април 2024 г. | ||||||||||||||||||||
Дата на последно актуализиране | 29 април 2024 г. | ||||||||||||||||||||
Статистическо представяне | |||||||||||||||||||||
Описание на данните | Изследването за доходите и условията на живот (SILC) е инструмент за осигуряване на своевременни и съпоставими данни за разпределението на доходите, равнище и структура на бедността и социалната изолация. Наблюдението се осъществява по единна европейска методология и осигурява информация за моментното състояние (cross-sectional data) и от повторени във времето (longitudinal data) изменения в доходите, равнище и структура на бедността и социалната изолация. Изследването за доходите и условията на живот осигурява четири основни файла с целеви променливи основани на общи концепции и дефиниции. Данните за страните всяка година съдържат следните компоненти:
Всяка година към изследването се включват допълнителни теми, т.нар. модули. Данните от Изследването на доходите и условията на живот се ползват за изчисляване на индикатори за бедност и социално включване по утвърдена от Евростат методология за събиране на данни, получаване на целеви променливи за дохода и изчисляване на общи индикатори. Равнището на бедност е относителният дял на домакинствата под линията на бедност, определена като 60% от медианния общ разполагаем еквивалентен доход. | ||||||||||||||||||||
Използвани класификации |
| ||||||||||||||||||||
Обхват | В методологията на изследването са включени следните социални области:
| ||||||||||||||||||||
Понятия и дефиниции | Общ доход на домакинството: Прилагат се две основни концепции за общия доход:
Общият брутен доход на домакинството (НY010) представлява сумарна величина на всички индивидуални доходи на лицата членове на домакинството от следните източници:
Общият разполагаем доход на домакинството (НY020) се пресмята като Общия брутен доход на домакинството (НY010) се намали с:
Домакинство Домакинство са две или повече лица, които живеят на един адрес (в жилище или част от жилище), имат общ бюджет и се хранят заедно. Домакинство е и едно лице което живее в самостоятелно жилище, стая или част от нея към дадено жилище и има самостоятелен бюджет по отношение на разходите за хранене и разходите за задоволяване на други потребности. Еквивалентни скали За пресмятане на индикаторите за бедност и социално включване се използва общ разполагаем нетен доход на еквивалентна единица. Поради различния състав и брой лица в домакинствата се прилагат еквивалентни скали. Използва се модифицираната ОЕСД скала, според която първият възрастен на 14 и повече години получава тегло 1-ца, вторият възрастен на 14 и повече години получава тегло 0.5 и всяко дете под 14 години получава тегло 0.3. Теглата се присъждат на всеки член на домакинството и се сумират, за да се получи еквивалентен размер на домакинството. Общият разполагаем нетен доход за всяко домакинство се разделя на неговия еквивалентен размер и се формира общ разполагаем нетен доход на еквивалентна единица.
| ||||||||||||||||||||
Статистическа единица | Единици на наблюдение са домакинствата и техните членове. | ||||||||||||||||||||
Статистическа съвкупност | Целевата съвкупност в изследването (SILC) са всички обикновени домакинства и техните членове, живеещи на територията на страната в момента на наблюдение. Лицата живеещи в колективни домакинства и в институции са изключени като цяло от целевата съвкупност. | ||||||||||||||||||||
Географски обхват (територия) | За територията на Република България. | ||||||||||||||||||||
Времеви обхват | 2006 - 2023 година | ||||||||||||||||||||
Базисен период | Не се прилага. | ||||||||||||||||||||
Мерна единица | |||||||||||||||||||||
Лева, евро, процент (%), брой лица | |||||||||||||||||||||
Отчетен период | |||||||||||||||||||||
Изследването на доходите и условията на живот (EU-SILC) използва следните периоди за отделните променливи, включени в наблюдението:
Отчетният период на дохода е предходната календарна година;
| |||||||||||||||||||||
Нормативна база | |||||||||||||||||||||
Нормативни документи и други споразумения | Основен регламент
Регламенти за изпълнение
| ||||||||||||||||||||
Споделяне на данни | Не се прилага. | ||||||||||||||||||||
Конфиденциалност | |||||||||||||||||||||
Конфиденциалност - политика |
| ||||||||||||||||||||
Конфиденциалност - защита на данните | Индивидуални данни не се публикуват (подтискат се), спазвайки член 25 от Закона за статистиката. Разпространението на индивидуални данни се извършва само съгласно член 26 от Закона за статистиката. | ||||||||||||||||||||
Политика по разпространение | |||||||||||||||||||||
Календар за разпространение | Датата за публикуване на статистическата информация е посочена в Календара за разпространение на резултатите от статистическите изследвания на НСИ. | ||||||||||||||||||||
Достъп до календара за разпространение | Календарът е наличен на интeрнeт сайта на НСИ: https://www.nsi.bg/bg/node/488 | ||||||||||||||||||||
Достъп на потребителите | Данните се публикуват на интернет сайта на НСИ в рубрика "Социално включване и условия на живот" в съответствие със Закона за статистиката (Глава 5) и Кодекса на европейската статистическа практика, зачитайки професионалната независимост и с цел обективност, прозрачност, при което всички потребители са равнопоставени. | ||||||||||||||||||||
Честота на разпространение | |||||||||||||||||||||
Годишно. | |||||||||||||||||||||
Достъпност и яснота | |||||||||||||||||||||
Прессъобщения | Индикатори за бедност и социално включване. | ||||||||||||||||||||
Публикации | Не се прилага. | ||||||||||||||||||||
Онлайн база данни | Подробни резултати са достъпни до всички потребители на интернет сайта на НСИ в рубрика Социално включване и условия на живот - Индикатори за бедност и социално включване: https://www.nsi.bg/bg/node/8256 и информационна система "Инфостат". | ||||||||||||||||||||
Достъп до микроданни | Анонимизирани индивидуални данни могат да бъдат предоставени за научни и изследователски цели по индивидуална заявка, съгласно Правилника за предоставяне на анонимизирани индивидуални данни за научни и изследователски цели. | ||||||||||||||||||||
Други формати на разпространение | Информационна услуга по заявка, съгласно Правилника за разпространение на статистически продукти и услуги на НСИ. | ||||||||||||||||||||
Методологични документи |
Подробна информация за списъка с индикаторите за социално включване, използваните дефиниции и алгоритъм за тяхното изчисление на европейско ниво може да бъде намерена на следния сайт: | ||||||||||||||||||||
Документация за качеството | Национални доклади за качество съгласно Регламент за изпълнение (ЕС) 2019/2242 на Комисията. | ||||||||||||||||||||
Управление на качеството | |||||||||||||||||||||
Осигуряване на качеството | С Регламент за изпълнение (ЕС) 2019/2242 на Комисията са определени техническите елементи на масивите от данни, на техническите формати и на подробните изисквания и съдържанието на докладите за качеството във връзка с организацията на извадковото изследване в област „Доходи и условия на живот“ съгласно Регламент (ЕС) 2019/1700 на Европейския парламент и на Съвета | ||||||||||||||||||||
Оценка на качеството | Изготвят се доклади за качеството, чрез които се анализира точността, сравнимостта и съгласуваността на данните. | ||||||||||||||||||||
Приложимост | |||||||||||||||||||||
Потребности на потребителите | Основни потребители на статистическа информация от наблюдението Статистика на доходите и условията на живот (SILC) са:
| ||||||||||||||||||||
Удовлетвореност на потребителите | Не се прилага. | ||||||||||||||||||||
Пълнота | Изследването за доходите и условията на живот (SILC) обхваща само обикновени домакинства и техните членове, т.е. лицата живеещи в колективни домакинства и в институции са изключени като цяло от целевата съвкупност. | ||||||||||||||||||||
Точност и надеждност | |||||||||||||||||||||
Обща точност | Както при всяко извадково изследване резултатите са обременени от грешки, дължащи се на извадката, както и на други грешки, свързани с невъзможността да бъдат анкетирани някои от единиците в извадката, възможни грешки при регистрацията на отговорите, обработката и други. Регламент (EС) 2019/1700 на Европейския парламент и на Съвета определя изискванията за точност за всички масиви от данни. Изискванията за точност се изразяват в стандартни грешки и се определят като непрекъснати функции на действителните оценки и на размера на статистическата съвкупност в дадена държава или регион по NUTS 2. Прогнозната стандартната грешка на конкретна оценка не е по-голяма от следната стойност: Функцията f(N) има следната форма: f(N)=a√N+b Използват се следните стойности за параметрите N, a и b:
| ||||||||||||||||||||
Извадкови грешки | Изчисляването на стандартните грешки се извършва с използване на Complex Sample analysis - SPSS ver.27 и SAS програмата за пресмятане на грешки от индикаторите, разработена от Евростат.
| ||||||||||||||||||||
Неизвадкови грешки | Неизвадковите грешки са основно 4 типа:
| ||||||||||||||||||||
Навременност и точност на представяне | |||||||||||||||||||||
Навременност | Данните за моментното състояние (cross-sectional data) и повторени във времето (longitudinal data) изменения в доходите, равнище и структура на бедността и социалната изолация са налични 10 месеца след края на процеса по събиране на данни. | ||||||||||||||||||||
Точност на представяне | Не се прилага. | ||||||||||||||||||||
Съгласуваност и сравнимост | |||||||||||||||||||||
Географска сравнимост | Поради единството на използваните принципи, променливи, дефиниции и класификации е налице висока степен на сравнимост на резултатите от изследването на доходите и условията на живот между страните-членки на ЕС. Сравнимостта между различните региони на страната се счита за висока. | ||||||||||||||||||||
Сравнимост във времето | През 2023 г. в страната не се наблюдават съществени промени спрямо предходен период на наблюдение. През годината бяха приложени редица мерки за доходите, а именно:
| ||||||||||||||||||||
Съгласуваност между предметни области | Изследването на доходите и условията на живот (SILC) следва международни и национални стандарти: ISCO, NACE, ISCED, степен на урбанизация, препоръките на групата Canberra. Наличните теглата в масивите от данни за SILC са получени чрез използване на техники за калибриране, които осигуряват основна съгласуваност между оценките получени от масивите от микроданни и демографски преброявания. Няма надеждни данни от външни източници за четири- и шестгодишни лонгитудинални извадки. Провеждат се допълнителни анализи за съгласуваност с други изследвания като Наблюдение на работната сила, Наблюдение на домакинските бюджети и други статистически области. | ||||||||||||||||||||
Вътрешна съгласуваност |
| ||||||||||||||||||||
Разходи и натовареност | |||||||||||||||||||||
Средната продължителност на интервюто за едно домакинство е 65.9 минути, а за едно лице на 16 и повече години - 21.4 минути. | |||||||||||||||||||||
Ревизия на данните | |||||||||||||||||||||
Ревизия на данните - политика | Не се прилага. | ||||||||||||||||||||
Ревизия на данните - практика | Не се прилага. | ||||||||||||||||||||
Статистическа обработка | |||||||||||||||||||||
Източници на данни | Извадката за BG-SILC 2023 се избира от база данни Преброяване на населението през 2011 г. Базата данни включва всички обикновени домакинства и техните настоящи членове, на територията на страната. Лицата, живеещи в колективни домакинства и в институции, са изключени от целевото население. Студентските и работническите общежития са изключени на първия етап от подбора, тъй като тези домакинства рядко остават на едни и същи адреси и трудно могат да бъдат проследени. Рамката се актуализира редовно в съответствие с направените административни промени - починали и новородени. Данните за домакинствата в избраните гнезда се актуализират в съответствие с информационна система "Демография" (ISD). Лонгитудиналният компонент се състои от подизвадки R1, R2, R3, R4 и R6. Всички променливи за доходите на лицата / домакинството са събрани чрез CAPI интервю. В някои случаи, когато не е получена информация за дохода, се използват регистри за получаване на липсващите стойности. Националният осигурителен институт поддържа регистър на всички лица, за които работодателите плащат осигурителни вноски и на всички самоосигуряващи се лица. Този регистър съдържа някои данни за доходите от трудова дейност на лицата, но само за осигурените лица. От регистрите на НОИ се получава и информация за доходите от пенсии, обезщетения и помощи. От регистъра на Агенцията за социално подпомагане се получават данни за доходите от социални помощи и обезщетения. Дизайн на извадката Шестгодишен ротационен панел се използва за SILC2023 в България. Той съдържа 6 независими подизвадки чрез прилагане на двустепенна, гнездова извадка. Извадката е стратифицирана според административно-териториални области в страната (NUTS3) и по местоположението на домакинството. Размерът на новата ротационна група за 2023 г. е 2760 домакинства. Критерии за стратификация и под-стратификация Извадката се основава на административно-териториалното деление на страната и включва всички домакинства в страната. Като основа за извадката на последната ротационна група (R5) е използвана базата данни от Преброяване 2011. Базата данни Преброяване 2011 всяка година се актуализира с Информационна система „Демография”. Извадката е стратифицирана според административно-териториални области в страната (NUTS3) и по местоположението на домакинството. Като резултат са формирани 56 гнезда (28 от градски и 28 от селски тип). Общините и населените места са подредени според броя на населението им във всяко гнездо. Схеми за подбор на извадката Броят на основните извадкови единици се изчислява поотделно за всяко гнездо, включено в извадката. Гнездата от първия етап се избират с вероятност пропорционална на броя на населението (брой домакинства) в основните извадкови единици. Прилага се системно изготвяне на извадка от вторични единици (домакинства) за всяка основна единица. Всяка основна извадкова единица съдържа 5 домакинства.
Извадкови единици Двустепенната извадка на териториален принцип е приложена както следва:
Размер на извадката и критерии на разпределяне Регламент 2019/1700 определя минималните ефективни размери на извадката, които трябва да бъдат постигнати, за да се компенсират всички видове липса на отговор. Общият брутен размер на извадката (брой домакинства) е определен чрез анализ на нивата на липса на отговор и на отраженията на модела (дизайн ефектите) от предишните изследвания за доходите и условията на живот. Общият размер на извадката за 2023 г. е 9389 домакинства, от които:
Брой домакинства, които са успешно анкетирани и са включени в базата данни за 2023 година:
Брой лица на 16 и повече години, които са членове на домакинството и за които успешно е събрана информация и са включени в базата данни за 2023 година:
Размерът на извадката за лонгитудиналния компонент включва 27712 домакинства и 52731 лица на 16 и повече години. Брой домакинства и лица, успешно анкетирани и включени в лонгитудиналния компонент | ||||||||||||||||||||
Честота на събиране на данни | годишно | ||||||||||||||||||||
Събиране на данни | Данните се събират с електронни въпросници (CAPI) чрез провеждането на персонално интервю с домакинствата, включени в извадката, и с всички лица на възраст 16 и повече навършени години - членове на домакинството.
Средното времетраене на интервюто с цялото домакинство е 65.9 минути, а на индивидуално интервю е около 21 минути. | ||||||||||||||||||||
Валидиране на данни | В процеса на въвеждане на информация се извършва логически контрол за допустими стойности, попълнена информация по всички въпроси, проверки за съпоставимост на данните, връзки между отделните въпросници и регистрите. След обработка на първичните данни и получаване на целевите променливи се извършва проверка с предоставената от Евростат SAS програма за проверка и валидиране на данните. Преди публикуване на информацията се извършват допълнителни проверки за съвместимост. | ||||||||||||||||||||
Обработка на данни | Обработката на данните се извършва със статистически софтуер SPSS. Променливи за доходите Общия брутен и разполагаем доход на домакинството са изчислени според документ Doc065 за 2023 г. Всички лични и домакински доходи се събират чрез интервю. Където информацията е налична се ползват директно данните от административния източник. Националната агенция по приходите предоставя данни от данъчната декларация. Националният осигурителен институт предоставя данни за доходите от пенсии и други социално осигурителни плащания и от регистъра на осигурените лица. Агенцията за социално подпомагане предоставя данни за получените социални помощи и обезщетения. Интервюиращите и респондентите имат възможност за посочване на брутни или нетни компоненти на дохода. От 2012 г., доходите от работна заплата се събират само като нетни доходи. Формата, в която нетните суми се записват в базата данни са брутни доходи намалени с данък върху дохода при източника и социално-осигурителни вноски. Брутните доходи се получават чрез сумиране на нетните стойности, изчислените/посочени данъчни и осигурителни плащания. Ако липсва информация за платените данъци или осигуровки се прилагат разпоредбите на данъчното и осигурителното законодателство. Ако някои елементи на доходите са получени само брутни или само нетни се прилагат съоветните преизчисления за получаване на брутни от нетни доходи и обратно. Когато липсва информация за дохода се ползват данни от административните регистри на Националната агенция по приходите, Национален осигурителен институт и Агенция за социално подпомагане. Данните от административните източници се ползват и за валидиране на данните получени чрез интервю. Когато няма данни от административни източници се прилага регресионен метод за допълване на информацията Процедура по претегляне Базата данни за всяка страна съдържа следните тегла:
Теглата са изчислени така че да се вземат предвид вероятността на единицата за попадане в извадката, липсата на отговор и адаптирането на извадката към външни данни, свързани с разпределението на домакинствата и лицата в целевата популация, местоживеене или административно-териториални области (NUTS 3). Претегляне на новата ротационна група Дизайн тегла За първата година от панела, всяко домакинство от новата ротационна група получава извадково тегло, обратно пропорционално на съответната вероятност за включване на домакинството в извадката. Тези тегла са дизайн теглата на домакинството DB080.
За коригиране на неотговорилите домакинства се използва процедурата “weigthing classes” - класове за претегляне. Домакинствата се разделят на класове, където се предполага, че вероятността за отговор е хомогенна в рамките на класовете. Поради липса на информация (демографски характеристики) за неотговорилите домакинства тези класове са извадковите страти. Изчислява се частното на теглата на отговорилите домакинства към теглата на всички домакинства в даденият клас.
След отразяване на неотговорилите домакинства, базовите тегла за новата ротационна група се калибрират спрямо населението към 31.12.2022 година. За калибриране се използват следните променливи на индивидуално ниво и променливи на домакинско ниво:
Информацията за лицата към 31.12.2022 е налична от Информационна система Демография. Информацията за домакинствата е оценка от актуализираният файл на Преброяване 2011 и данни от изследването SILC за производните домакинства. Лицата родени през 2023 година не се включват в калибрирането, защото не са част от населението към края на 2022 година. За калибриране на теглата се използва SAS Macro Calmar 2. За калибриране се използва логистичният метод (М=3 в Calmar), като се задават горна и долна граница на g-теглата. G-теглата са частното на зададените тегла и крайните калибрирани тегла. Калибрираните тегла с отразени неотговорилите домакинства са базовите тегла (RB060) за новата ротационна група и ще бъдат използвани в следващите години в процедурата за претегляне. Тези тегла са и лонгитудиналните тегла (DB095) на домакинствата от новата ротационна група.
Процедура за претегляне на ротационните групи от предишни вълни на наблюдение. Базовите тегла (RB060) за всяка ротационна група от предходната година се коригират с неотговорилите, за да се получат базовите тегла за настоящата година. Процедурата за корекция се прави на индивидуално ниво, а не на ниво домакинство.
За коригиране на неотговорилите първо се маркират всички лица от регистъра (DB135 = 1 & RB110 in (1,2,3,4)) за 2022 и проследени през 2023 г., като отговорили (настоящи членове на домакинството). Лицата, които са напуснали домакинството между двете вълни на наблюдение се маркират като неотговорили. За изчисляване вероятността всяко лице да бъде проследено между двете вълни се използва логистична регресия. Теглата на проследените лица се поправят с вероятността за проследяване (резултат от логистичната регресия) и се получават базовите тегла (RB060) за 2023 година. Моделът се прилага за всяка ротационна група по отделно. Независимите променливи, които се прилагат в модела са: индикатори за бедност, образование, икономическа активност, възраст, пол, размер на домакинството, тип на домакинството, доход, тип на жилището. Зависимата променлива е дали лицето е проследено или не. Новодошлите лица след първата година, които не са част от извадката, получават базови тегла за настоящата година като следва:
Споделяне на тегло. Според методологията на изследването, всички лица в дадено домакинство трябва да получат едно и също тегло (cross sectional weight). За целта всички лица в домакинството, включително и тези с нулеви тегла, получават средно тегло от базовите тегла на индивидите в рамките на съответното домакинство.
След процедурите по отразяване на неотговорилите, всяка една от 5-те ротационни групи по отделно се калибрира по описания по-горе метод спрямо населението към 31.12.2022 година. Обединяване на 6-те под-извадки в една След приключване на описаните по-горе процедури по отразяване на неотговорилите и калибриране, отделните под-извадки (ротационни групи) трябва да бъдат обединени в една, тъй като всяка под-извадка по отделно възпроизвежда цялото население на страната към 31.12.2022 г. За обединяване на подизвадките всички тегла се умножават с подходящ „коригиращ“ фактор. Поради наличието на 6 ротационни групи за 2022 г., коригиращият фактор е 1/6. Крайни моментни (cross-sectional) тегла Калибриране на всички ротационни групи към текущото население След приключването на всички процедури теглата трябва да се калибрират спрямо населението към 31.12.2022 година. За калибриране се използват следните променливи на индивидуално ниво и променливи на домакинско ниво.
Възрастовите групи са следните: (0-15) (16-19) (20-24) (25-29) (30-34) (35-39) (40-44) (45-49) (50-54) (55-59) (60-64) (65-69) (70-74) (75+) Използването на тези възрастови групи е препоръчано от ЕВРОСТАТ. През 2016 година за пръв път е използван брой пенсионери, като калибрационна променлива. Променливата има 3 нива:
За разпределяне на лицата към дадената съвкупност са използвани данни от НОИ - броят на личните пенсии към 31.12.2022 г. С добавянето на тази променлива се целят две неща. Първо да се подобрят оценките за пенсионерите и второ да се намали стохастичната грешка на индикатора AROPE. След калибрирането се получава крайното моментно (cross-sectional) тегло на домакинството DB090. Индивидуалното моментно (cross-sectional) тегло на едно лице (RB050) е равно на моментното тегло DB090 на неговото домакинство. (RB050=DB090). Родените през 2023 лица не участват в калибрирането. Те получават теглото на домакинството след калибрирането. Изчисляването на индивидуалните тегла на всички членове на домакинството на възраст 16 години и повече (PB040), се получават като се премахне възрастовата група (0-15) и се вземат предвид само отговорилите (или допълнените) на персоналния въпросник лица (RB250 in (11,14)). След това теглата се калибрират по описаните процедури и се получават персоналните тегла за лицата на 16 и повече години.
| ||||||||||||||||||||
Изглаждане | Не се прилага | ||||||||||||||||||||
Коментар |