Лекция 10_Статистическое изучение структуры

Статистическое изучение структуры совокупности и ее изменений
Понятие структуры явления и ее виды
Графический сравнительный анализ структуры
Показатели структурных сдвигов и различий
Непараметрические методы анализа структуры
Изучение интенсивности изменения структуры с помощью индексов

Понятие структуры явления и ее виды
Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов этой системы, но также и в изменении ее структуры.
Понятие структуры очень тесно переплетается с понятием группировка и классификация.
Структура это строение, форма организации системы, состоящей из отдельных элементов и связей между ними.
13 SHAPE \* MERGEFORMAT 1415
Иерархической (древовидной) структурой называется сложная структура, образуемая при последовательном дроблении системы на все более однородные группы элементов. Она состоит из нескольких уровней («шагов» дробления).
13 SHAPE \* MERGEFORMAT 1415
Основное преимущество иерархической структуры заключается в ее большой информационной емкости (класс, подкласс, группа, подгруппа, вид, (разновидности), традиционности и привычности применения, хорошей приспособленности для различной обработки информации, а также возможности для создания при кодировании объектов классификации кодов, несущих смысловую нагрузку.
Недостатком является слабая гибкость ее структуры и заранее установленный порядок ступеней распределения, не допускающий включения при отсутствии резервной емкости новых объектов классификационных группировок и признаков. Вследствие этого изменение хотя бы одного признака ведет к перераспределению многих классификационных группировок.
Иерархическая структура характеризуется не только долями объема признака, но и дополнительными показателями.
1. Характеристикой степени сложности структуры, а именно числом уровней дробления («порядок» структуры).
2. Средним порядком структуры, т.е. средним номером уровня, взвешенным по долям объема признака, дробление которых завершилось на данном уровне. Эта величина характеризует среднее число дроблений объема признака.
3. Общим числом конечных (т.е. не дробящихся далее) ветвей структуры.
4. Средним числом конечных ветвей, приходящихся на один уровень.

Баланс (фр. balance буквально весы, равновесие) это особая форма сопоставления структуры одной и той же величины признака, характеризуемой с двух разных сторон или в двух различных аспектах.
В наиболее общей форме динамический баланс состоит из четырех составляющих: запас на начало периода, приход за период, расход за период, запас на конец периода.
Запас на начало + приход = расход + запас на конец периода.
Для аналитических целей каждая из четырех составляющих делится по различным классификационным признакам на части, группы или подгруппы.

Если общий объем признака подразделен по одному группировочному признаку, а затем каждый групповой и общий объемы снова подразделены по другому группировочному признаку, то образуется многомерная, в простейшем случае двухмерная структура с пересекающимися признаками.
Двухмерная пересекающаяся структура позволяет рассчитать пять видов структурных показателей (долей). При трех пересекающихся признаках группировки число разных видов структур достигает 19. В общем виде при n взаимопересекающихся признаках структура содержит (n3 - n2 + 1) видов долей.

Фасетный метод классификации - это метод, при котором заданное множество делится на группировки независимо, по различным признакам. Она не имеет жесткой структуры и заранее построенных конечных группировок. При ней множество объектов, характеризующихся некоторым набором одинаковых для всех объектов признаков (фасет), может делиться многократно и независимо. В классификаторах фасеты чаще всего располагаются в виде простого перечисления и имеют код.
Основное преимущество фасетной классификации - гибкость структуры ее построения, так как изменения в любом из фасетов не оказывает влияния на остальные. Фасетный метод классификации позволяет не только образовывать новые классификационные группировки из имеющихся фасетов, но и включать в классификатор без переделки новые и исключать старые фасеты.
Недостатком фасетной классификации следует считать недостаточно полное использование емкости вследствие отсутствия практически лишних из возможных сочетаний фасетов, непривычность применения, а также сложность использования этого метода для ручной обработки информации.

Для цели анализа структуры, а также сравнения двух (или более) структур в динамике используется большое количество статистических методов и подходов которые можно представить в виде следующей схемы:






13 SHAPE \* MERGEFORMAT 1415

Графический сравнительный анализ структуры
В социально-экономических исследованиях часто возникает ситуации, в которых необходимо анализировать структуры явлений или процессов за ряд периодов. Одним из способов анализа в данном случае является рассмотрение структурных диаграмм.
Самой распространенной структурной диаграммой является секторная или круговая
13 EMBED Excel.Chart.8 \s 1415
Рисунок - Состав и структура безработных по образованию в 2003г., %
Данный вид диаграмм удобнее всего использовать при иллюстрации структуры явления за один, два или три периода, но на практике может возникнуть ситуация когда необходимо сравнивать структуру за 5 и более периодов. В данном случае необходимо использовать кольцевую диаграмму.
13 EMBED Excel.Chart.8 \s 1415
Рисунок - Состав и структура безработных по образованию в 1992г. и 2003г., %
Данный вид структурной диаграммы рекомендуется использовать если необходимо проиллюстрировать данные за 2-3 периода, если периодов более 3 то необходимо использовать особый вид столбиковых диаграмм – нормированную гистограмму.
13 EMBED Excel.Chart.8 \s 1415
Рисунок - Состав и структура безработных по образованию в 1992г., 1998г., 2002-2003гг., %

Показатели структурных сдвигов и различий
Для оценки изменения структуры совокупности во времени и определения в структурах отдельных групп применяют показатели структурных различий и сдвигов. Простейшими показателями структурных различий являются [стр 37, Тимофеева]:
Линейный коэффициент структурных различий (сдвигов) или индекс Рэ:

где d1, dо - структура отчетного и базисного периодов, %
п – количество строк.
Показывает насколько в среднем структура отчетного периода не соответствует структуре базисного периода. В качестве недостатка показателя можно назвать тот факт, что его величина зависит от n. Если n мало, то индекс принимает маленькие значения и наоборот.
Квадратический коэффициент структурных сдвигов:

0 ( d ( 100 или 0 ( ( ( 100 (если данные измерены в %).
Чем ближе значение показателей к 0, тем меньше различия в структурах изучаемых совокупностей; либо тем меньше изменения, произошедшие в структуре совокупности в динамике.
Линейный и квадратический коэффициенты применяются в основном для изучения динамики показателей структуры, т.к. наглядно позволяют сделать выводы об интенсивности изменения структур в те или иные промежутки времени.
Индекс Гатева (Gatev index) различает структуры с равными суммами квадратов отклонений.

Индекс Рябцева (Ryabtsev index) незначительно отличается от индекса Гатева, принимает более низкие значения:

Индекс Салаи (Szalai index) был введен при исследовании различий в структуре использования бюджета времени у различных групп населения:

Индекс Салаи отличается от всех рассмотренных выше индексов данной группы. Он принимает близкие к единице значения, когда в сумме большое количество единиц.
Приведенные индексы принимает значения в интервале от 0 до 1. Если тот или иной индекс равен нулю, то наблюдается полное сходство структур, если единице –полное различие. Если более 0,5, то различия структуры отчетного и текущего периодов считаются существенными.

Непараметрические методы анализа структуры
Наряду с рассмотренным показателем для учета различия (подобия) структур возможно использование показателей корреляции. Но как правило воспользоваться обычными мерами измерения взаимосвязей (коэффициент корреляции Пирсона) невозможно, так как их применение предъявляет к анализируемым данным требование о нормальности. Выходом из положения является применение к имеющимся данным непараметрических методов, не предъявляющих требования о нормальности и большого числа единиц совокупности. В качестве непараметрических мер корреляции можно назвать коэффициент Спирмена, Гамма коэффициент, коэффициент Кендала-Тау и другие.
Коэффициент корреляции рангов Спирмена носит имя английского психолога разработавшего данный коэффициент Ч.Спирмена (1863-1945).
Вначале определяют величину:

Далее определяют само значение коэффициента по формуле:

Приведенная формула пригодна в случае отсутствия объединенных рангов. Для распространения этой формулы на случай присутствия объединенных рангов необходимо определить для каждой ранжировки величину:

где т - число групп совпадающих рангов, nk число совпадающих рангов в k-ой группе (при отсутствии объединенных рангов m=n, n1=n2=...=nn=1 и соответственно Т = 0).
С учетом последнего замечания ранговый коэффициент Спирмена между ранжировками Rx и Ry вычисляется по формуле:

Если ТX и ТY являются небольшими относительно 1/6(n3-n), то можно воспользоваться приближенным значением:

Коэффициент корреляции Спирмена может принимать значения в интервале от -1 до +1. Чем ближе данный показатель приближается к единице, тем более непохожи структуры отчетного и базисного периода.
Значимость ( оценивается с помощью t-статистики.

имеющей нормальное распределение при достаточно большом n (n (10).
Нулевая гипотеза H0 состоит в том, что прямой корреляционной связи между структурой отчетного и базисного периодов не наблюдается. Следовательно, можно применить односторонний критерий при n-2 степенях свободы.
Коэффициент Кендэла. Для расчета данного коэффициента необходимо значения рангов Rx расположить в порядке возрастания. В соответствии с этим порядком располагаются и ранги Ry. Затем рассчитываются величины Р и Т.
Если для каждого ранга Ry определить число следующих за ним значений рангов, превышающих его величину, то сумму таких превышений обозначают через Р.
Если для каждого ранга Ry определить число предшествующих ему значений рангов, превышающих его величину, то сумму таких превышений обозначают через Т. Далее определяем величину S = Р - Т.
Коэффициент Кепдэла рассчитывается по формуле:

При достаточно больших п значения ( и ( приблизительно связаны следующим соотношением, ( = 1,5((.
При наличии объединенных рангов коэффициент Кендэла определяется по формуле:

где U - поправочные коэффициенты, который вычисляются по формуле:

где m - число групп совпадающих рангов, nk - число совпадающих рангов в k-ой группе (при отсутствии объединенных рангов m=n, n1=n2=...=nn=1 и соответственно U = 0)
Значимость коэффициента ( оценивается с помощью u-статистики:

имеющей нормальное распределение при достаточно большом n (n (10).
Нулевая гипотеза H0 состоит в том, что прямой корреляционной связи между структурой отчетного и базисного периодов не наблюдается. Следовательно, можно применить односторонний критерий при n-2 степенях свободы.




Подсчет чисел Р и Т
для RY = 1 число рангов RY, предшествующих 1 и больше, равно 0, а последующих за 1 и больше, равно 9,
для RY = 2 число рангов RY, предшествующих 2 и больше, равно 0, а последующих за 2 и больше, равно 8;
для RY = 7 число рангов RY, предшествующих 7 и больше, равно 0, а последующих за 7 и больше, равно 3;
для RY = 5,5 число рангов RY, предшествующих 5,5 и больше, равно 1 (со знаком «-») (это RY = 7), а число рангов RY, последующих за 5,5 и больше, равно 3 и т. д.
RX
RY
Р
Т
Итого

1
1
9
0
9

2
2
8
0
8

3
7
3
0
3

4
5
4
-1
3

5
3
5
-2
3

6
4
4
-2
2

7
6
3
-1
2

8
9
1
0
1

9
8
1
-1
0

10
10
0
0
0

Итого
К
37
-7
S = 31

Из таблицы следует, что коэффициент Кендэла равен 2(31/10(9 = 0,689

Изучение интенсивности изменения структуры с помощью индексов
Специфической задачей индексного анализа является оценка влияния структурных сдвигов на изменение общих объемов явлений и средних уровней качественных показателей.
Вариант №1. Вначале индекс общего объема явления раскладывается:
Iобщего объема = Iобъема и структуры(Iкачественного показателя

Далее раскладывается индекс объема и структуры:
Iобъема и структуры = Iобъема( Iструктуры

Конечный вид разложения индекса общего объема следующий:
Iобщего объема = Iобъема( Iструктуры (Iкачественного показателя
Вариант №2. На первом этапе индекс общего объема явления рассматривается как произведение индексов объема совокупности и среднего уровня качественного показателя:
Iобъема и структуры = Iобъема( Iсреднего уровня качественного показателя

Поскольку уровень средней величины формируется под влиянием размера признака отдельных единиц структуры совокупности, на изменение среднего значения показателя оказывает влияние как изменение величины признака по отдельным единицам, так и изменение структуры совокупности. Соответственно на втором этапе индекс среднего уровня раскладывается на индекс размера признака и индекс структуры:
Iсреднего уровня качественного показателя = Iкачественного показателя (Iструктуры

В конечном итоге индекс общего объема раскладываться по схеме:
Iобщего объема = Iобъема(Iкачественного показателя ( Iструктуры

ВИДЫ СТРУКТУРЫ

Иерархическая (древовидная)

Баланс

Фасетная

Методы анализа структуры

Графические методы:
секторная диаграмма
кольцевая диаграмма
нормированная гистограмма

Относительный показатель структуры

Показатели структурных сдвигов и различий:
индекс Рябцева
индекс Гатева
индекс Салаи

Непараметрические методы анализа различия (сходства) структур:
коэффициент Спирмена
коэффициент Кендала

Индексный метод



Объект 12

Приложенные файлы

  • doc 25450228
    Размер файла: 605 kB Загрузок: 0

Добавить комментарий