написать

Cтатистика бедности

 

Однако после книги Идена "Страна бедных" следующими наиболее важными вехами в современных научных исследованиях бедности были, несомненно, исследования Чарльза Бута и Сибома Роунтри, задокументировавшие условия жизни английской бедноты (в Лондоне и Йорке соответственно) в конце XIX века. Это были новаторские исследования с использованием, казалось бы, тщательного обследования домашних хозяйств, которые показали небедным людям, как живут бедные люди. (См. Вставку 1.17, посвященную этим исследованиям). Их работа привлекла большое внимание. За последние пятьдесят лет жизнь английского рабочего класса заметно улучшилась, хотя бедность осталась (Это признавал не кто иной, как Фридрих Энгельс в предисловии 1892 года к английскому изданию своего описания условий жизни рабочего класса в Манчестере в 1844 году). Буту часто приписывают идею "черты бедности", хотя были и предшественники, в том числе "линия бедности" описанная Спинхемлендом на сто лет раньше. В то время английская общественность была шокирована тем, что миллион лондонцев - примерно треть населения города - жили ниже этой скромной линии. И это линия самых бережливых; по моим подсчетам, она была эквивалентна 1,5 фунтам хорошей пшеницы на человека в день, что не очень отличается от уровня, существующего в современных развивающихся странах (Маршалл (1907) подсчитал, что 21 шиллинг был эквивалентен трем четвертям бушеля хорошей пшеницы. При влажности 13,5% по весу бушель пшеницы весит 60 фунтов согласно записи Википедии по слову "бушель". Я предполагаю, что домашнее хозяйство состоит из 4,5 человек, что является нижней границей диапазона 4,5-5, данного Бутом (1993, гл. 4) для среднего размера семей работающих мужчин в то время. Линия Бута в 21 шиллинг в неделю для семьи, таким образом, эквивалентна чуть менее 700 г пшеницы на человека в день. Конечно, это всего лишь пшеничный эквивалент. Разумная диетическая разбивка будет составлять 400 г на человека для пшеницы, а остальное -  мясо, овощи и (очень минимальные) непродовольственные потребности. Таким образом, это похоже на национальную черту бедности Индии в 1993 году, которая, по моим расчетам, эквивалентна ежедневному набору продуктов питания на человека в 400 г грубого риса и пшеницы, 200 г овощей, бобовых и фруктов плюс скромное количество молока, яиц, пищевого масла, специй и чая (Всемирный банк 1997). После покупки такого набора продуктов питания у вас останется около 0,30 доллара в день (по паритету покупательной способности 1993 года) на непродовольственные товары).

Вставка 1.17 Обследования домохозяйств

Классический опрос домашних хозяйств аккумулирует данные полученные путём опроса случайной выборки домашних хозяйств. Общая схема выборки предполагает, что сначала берется случайная выборка Первичных Выборочных Единиц (ПВЕ), таких как деревни; ПВЕ выбираются с вероятностями, пропорциональными размеру популяции. На втором этапе берется случайная выборка домохозяйств в пределах выбранных деревень, как правило, после составления списка всех домохозяйств в ПВЕ. (Иногда используются более сложные образцы многоуровневых выборок, хотя следует быть осторожным, чтобы выборка не чрезмерно снижала точность окончательных оценок; на практике часто предпочтительнее использовать простой двухэтапный метод отбора проб).

Инструмент обследования (или вопросник) иногда разрабатывается с какой-то конкретной целью, а иногда является универсальным инструментом, таким как исследование Всемирного банка по Измерению Уровня Жизни (ИУЖ). Такие обследования будут включать подробные вопросы об источниках доходов и расходах на потребление (включая потребление в натуральном выражении, например, за счет собственного сельскохозяйственного производства). Эти подробные вопросы разработаны таким образом, чтобы их можно было суммировать для получения всеобъемлющей меры дохода и/или потребления.

Учреждение-исполнитель, как правило, готовит статистический реферат с кратким изложением результатов обследования. Однако он часто представляет весьма ограниченный аналитический и политический интерес. Большинство пользователей сегодня получают доступ к микроданным для изучения конкретных вопросов, таких как измерение бедности и неравенства, описание характеристик бедных людей, оценка частоты участия в программах борьбы с коррупцией и моделирование поведенческих реакций.

Дополнительная литература: в Главе 3 рассматриваются опросы о которых пользователи должны знать, включая основные методологические вопросы, и приводятся ссылки на литературу.

Исследование Бута отвечало требованиям по предъявляемых законодателями к прозрачности данных. Его эмпирические исследования бедности в пожилом возрасте и её географических вариаций повлияли на введение в Великобритании государственной пенсии в 1908 году и национального страхования в 1911 году (Thane (2000, ch. 9) and Himmelfarb (1984a, b). Исследования Бута и Роунтри также стимулировали дебаты о том, в каком городе или стране больше бедности. Около 1900 года было широко распространено мнение, что около 30% населения Англии было бедным. Это было основано на том факте, что Роунтри обнаружил, что 28% населения Йорка было бедным, в то время как Бут обнаружил, что 31% населения Лондона было бедным. Однако в качестве показателей абсолютной бедности эти два показателя были несопоставимы, поскольку они использовали разные черты бедности (Вставка 1.18).

Вставка 1.18 "30% населения Англии бедны": Первые уроки анализа бедности

Роунтри обнаружил, что 28% населения Йорка были бедными, в то время как Бут обнаружил, что это было верно для 31% населения Лондона. Не имея других данных, в 1900 году было распространено мнение, что 30% населения Англии было бедным. Однако оказывается, что черта бедности Роунтри была намного выше черты Бута. Вот расчеты, сделанные Макгрегором (1910):

% населения живущих за чертой бедности Йорк Лондон
Черта Бута 3 31
Черта Роунтри 28 50

Мы видим, что при использовании любой из этих линий уровень бедности в Лондоне был намного выше. Таким образом утверждение, что в Англии было 30% бедных, может быть поставлено под сомнение, как и то, что уровень бедности был почти так же высок в Йорке, как и в Лондоне.

Позднее, в Соединенных Штатах, Миллер (1964) сделал аналогичное наблюдение в определении того, как измеряется бедность в Соединенных Штатах. В 1935 году уровень бедности по современным стандартам составлял 28%, а к 1960 году снизился до 10%. Однако, реальное значение черты бедности, возросло с течением времени. Миллер подсчитал, что если использовать черту бедности 1960 года для 1935 года, то уровень бедности тогда составил бы 47%.

Любимым занятием масс-медиа было сравнение между странами. Например, через пятнадцать лет после выхода книг Бута Альфред Маршалл аргументированно утверждал, что в Германии было даже больше бедности, чем в Англии, как предполагали цифры Бута; это был ответ на мнение Маршалла (1907, 12) о том, что "одна из немногих вещей, которые каждый немец знает наверняка об Англии, заключается в том, что в Лондоне есть миллион людей, живущих в крайней нищете на грани голода".

Детальные наблюдения за бедностью, проведенные Бутом и Роунтри, оказали большое влияние на исследования в области социальных наук. Роберт Хантер (1904) последовал их примеру в изучении бедности в Соединенных Штатах и дал первую оценку уровня бедности в США.

Хантер подсчитал, что около 1900-х годов в Соединенных Штатах жили в бедности 10 миллионов человек, что оказалось очень близко к оценке приведённой на Рис.1.1, которая подразумевает, что 10,6 миллиона человек в Соединенных Штатах жили в 1900 году в бедности (это заключение основано на линейной интерполяции оценок за 1890 и 1910 годы, что дает 13,9%, а население США составляет 76 миллионов человек по переписи 1990 года), неявно подразумевая, что черта бедности Хантера была очень похожа на черту "1 доллар в день", лежащую в основе оценок на Рис. 1.1.

Влияние которое оказали Бут и Раунтри выдержало длительную проверку временем. Исследования деревень в Индии, проведенные Манном и его коллегами, были проведены под влиянием Бута и Раунтри (Thorner (1967). За этим последовала долгая и выдающаяся традиция количественно-экономических исследований отдельных деревень (В том числе опросы Рудры и Бардхана (Bardhan 1984a), Блисса и Стерна (1982), Уокера и Райана (1990) и Ланжоу и Стерна (1998). Подход Бута оказал влияние на развитие количественной социологии как в Великобритании, так и в США (О влиянии Бута см. статью Википедии "Чарльз Бут" и архив, который ведет Лондонская школа экономики). Эмпирическое исследование бедности в Англии, проведенное Питером Таунсендом (1979) около восьмидесяти лет спустя, несомненно, многим обязано Буту и Роунтри. То же самое сделала Чикагская школа социологии, которая начала изучать городскую бедность в Соединенных Штатах в 1930-х годах.

Конец XIX века ознаменовался также появлением статистических инструментов, которые впоследствии приобрели большое значение в экономике и социальных науках в целом, в том числе в исследованиях по проблемам бедности и политике по борьбе с бедностью. Примером может служить идея линейной регрессии, впервые возникшая в биологии, особенно в знаменитых исследованиях сэра Фрэнсиса Гальтона о наследственности (Об изобретении регрессии и корреляции см. Stanton (2001). Карл Пирсон (1896) разработал современную формулировку линии регрессии и коэффициента корреляции с целью минимизации дисперсии ошибок. Вставка 1.19 объясняет идею этого статистического инструмента, о котором мы часто будем слышать в остальной части этой книги. Вскоре после появления этих идей в биологии последовало их применение к экономическому и социальному поведению (Morgan (1990).

Вставка 1.19 Любимый статистический инструмент экономиста: Регрессия

Линия регрессии это апроксимирующая линия, связывающая зависимую переменную (y) с другими объясняемыми переменными (x). Внимание обычно ограничивается прямыми линиями. Совпадение не бывает идеальным, и остаётся некоторая ошибка (ε) остается. Линия "наилучшего соответствия" обычно определяется как та, которая дает наименьшую дисперсию ошибок - сумму квадратов ошибок при использовании этой линии для прогнозирования зависимой переменной. Измеренные значения, полученные с помощью ошибки, часто называют "остатками". Указывается коэффициент наклона регрессии  β, в то время как α это точка пересечения (при x = 0). Таким образом, уравнение линии регрессии для n наблюдений имеет вид:

yi = α + βxi + εi (i =1,...,n)

Первоначальная регрессия Гальтона имела вес дочерних семян душистого горошка (переменная y), регрессировавший на вес материнских семян (переменная x). Гальтон обнаружил положительный наклон, меньший, чем единица, подразумевая то, что стало известно как "регрессия к среднему значению" - свойство, что межпоколенческий прирост веса, как правило, выше для детей более легких родителей, так что со временем произойдет конвергенция к среднему значению. Сто лет спустя это свойство стало важным в литературе по экономическому росту (Глава 8).

Рисунок B1. 19. 1 Логарифмический уровень бедности, рассчитанный на основе логарифмического среднего потребления по странам

Чтобы привести пример, наиболее близкий к теме этой книги, на рис. B1. 19. 1 показан естественный логарифм уровня бедности (H) с использованием $1,25 в день в качестве черты бедности относительно логарифма среднего потребления или дохода (M) в развивающихся странах, для которых по крайней мере 1% населения является бедным по этому определению. На рисунке также показана подогнанная линия регрессии (n =76):

logH = 9.29 – 1.42 logM + ê

Здесь ê-регрессионный остаток. Наклон,  β = -1.42, может быть интерпретирован как говорящий о том, что более высокое среднее значение на 1% в среднем связано с более низким уровнем бедности на 1,4%.

Общее соответствие обычно оценивается по квадрату коэффициента корреляции (R2); для этих данных R2 = 0,67 (в то время как коэффициент корреляции равен 0,82). Это дает долю дисперсии в зависимой переменной, которая отвечает за выясняемую переменную; таким образом, здесь мы можем сказать, что две трети дисперсии в логарифме уровня бедности представлены дисперсией в логарифмическом среднем - остальная часть относится к дисперсии в остатках. При оценке регрессии мы часто также хотим знать, насколько точно оценивается наклон. Это определяется стандартной ошибкой наклона (se(βˆ)), которая в данном случае равна 0,12. 95% доверительный интервал для наклона это интервал, ограниченный снизу βˆ –2se(βˆ) и сверху  βˆ +2se(βˆ); таким образом, у нас есть вероятность 0,95, что истинное значение находится между -1,66 и -1,18. (Способ вычисления стандартной ошибки обычно предполагает, что дисперсия члена ошибки постоянна. На приведенном выше графике мы видим, что дисперсия имеет тенденцию расти вместе со средним значением. При корректировке для этого стандартная ошибка равна 0,10.) t-статистика t =  βˆ/se(βˆ) используется для проверки нулевой гипотезы при том, что β = 0.

Подгонка линии регрессии, конечно, не означает, что параметр x вызывает y. Корреляция не подразумевает причинности. Одна из причин, по которой причинно-следственная связь в этой регрессии сомнительна, заключается в том, что в обследованиях будут допущены ошибки измерения, так что, если переоценить среднее значение, то, вероятно, будет  недооценён показатель бедности.

Другая проблема заключается в том, что в регрессии могут присутствовать важные упущенные переменные. Практики часто озабочены пропущенными переменными, которые коррелируют с рассматриваемыми переменными. Очевидно, что это является источником смещения, поскольку мы не знаем, насколько оцененный коэффициент действительно отражает влияние переменной интереса, а не коррелированной упущенной переменной.

Дополнительная литература: В качестве хорошего введения в регрессионный анализ см. В Wooldridge (2013). В Главе 6 обсуждаются более продвинутые методы, которые пытаются решить проблемы вывода причинности получаемые на основе данных.