Новости, мнения, блоги
Выбрать регион
Воронежская область
  1. post
  2. Воронежская область
Воронежская область

Анализ сходства и различия между шестью базами данных по ВВП

Георгий Мацуга

В данном посте (ВК; ФБ) я рассказал о различиях в реальном ВВП на человека, которые наблюдаются в различных базах данных (всего я рассмотрел 6 различных баз данных). В качестве примеров я взял информацию для Монголии и России. Сегодня же я сосредоточился на анализе сходства и различия между этими шестью базами данных. Я рассматривал информацию только за 1994–2017 гг. Поскольку в ходе этого анализа я построил 15 графиков, то я решил представить их в виде гифки. Пояснения к графикам я привел в качестве отдельного кадра гифки (почему 15? Потому что (6*6-6)/2=15; для лучшего понимания этого см. таблицу в верхней части одного из кадров гифки). Если кто-нибудь решит тщательнее рассмотреть какой-нибудь из кадров, то можно приостановить смену кадров гифки, нажав на правую кнопку мыши, а затем выбрав в появившемся меню соответствующую команду.

Итак, какие выводы можно сделать, рассмотрев построенные графики?

1. Базы данных МВФ и Проекта Мэддисона (со множеством контрольных точек), как я и ожидал, не очень похожи друг на друга (коэффициент детерминации R^2 равен 0,9232; при абсолютной идентичности баз данных этот коэффициент будет равен единице; 0,9232 по меркам данного сопоставления баз данных — это небольшая величина). Это легко объяснимо: одна база данных основана на использовании множества контрольных точек, а вторая – на использовании только одной.

2. Базы данных МВФ и проекта Мэдисона (с одной контрольной точкой 2011 года) оказались несколько менее похожи, чем я ожидал: коэффициент детерминации оказался равен 0,9503. Да, сравнительно высокий, но как будет показано далее, базы данных Всемирного банка гораздо сильнее похожи на МВФовскую. Интересная особенность наблюдается у точечной диаграммы при сопоставлении баз данных МВФ и Проекта Мэдисона (с одной контрольной точкой): есть две страны, для которых группы точек отделяются от основной массы точек в виде двух видимых невооруженным глазом «лучиков». Эти два государства — Люксембург и Сингапур — два города-государства, офшорные зоны с очень высоким реальным ВВП на человека. Такие «лучики» могут возникать в тех случаях, когда обе базы данных разработаны на основе одной контрольной точки, но значения реального ВВП этих государств в контрольной точке (то есть в 2011 году) по разным базам данных сильно отличаются.

Правда, мне не понятно, откуда взялись такие различия? В файле проекта Мэдисона указано, что в качестве контрольной точки в 2011 г. использовалась информация Программы международных сопоставлений ВВП по ППС (ICP PPP). И, скорее всего, эта же информация использовалась МВФ и Всемирным банком (который, собственно, и реализует эту программу). По той информации, которую использовал проект Мэдисона, реальный ВВП на человека в Люксембурге в 2011 г. составлял 108,8% от аналогичного показателя для США. Согласно же результатам Глобального раунда сопоставлений ВВП по ППС по результатам 2011 г. реальный ВВП на человека в Люксембурге был 178% от США (см., например, информацию об этом на сайте Росстата). Согласну файлу проекта Мэдисона реальный ВВП на человека в Сингапуре в 2011 году составлял 124% от США. Согласно же глобальному раунду, он составлял 145% от США. Почему специалисты проекта Мэддисона выбрали для контрольных точек по Люксембургу и Сингапуру данные, сильно отличающиеся от результатов Глобального раунда 2011, мне не понятно. Также мне не понятно, почему они указали, что контрольной точкой для Сингапура и Люксембурга в 2011 г. является Программа международных сопоставлений ВВП по ППС, но взяли значения не из этой Программы, а из какого-то другого источника. Впрочем, может быть, и из этой Программы, но не из файла, посвященного Глобальному раунду 2011 года, а из какого-то другого файла (по-моему, публиковались какие-то предварительные результаты расчетов по Программе; может быть, оттуда).

3. Базы данных МВФ и Всемирного банка (в постоянных ценах 2011 года) почти идеально совпали между собой: коэффициент детерминации 0,9962. Это свидетельствует о близости выбранных методик (как я полагаю, одна контрольная точка - 2011 год).

4. Базы данных МВФ и Всемирного банка (в текущих международных долларах, которую я пересчитал в доллары 2011 года) оказались тоже весьма близки (коэффициент детерминации 0,9884). Даже ближе, чем я предполагал. Я думал, что в этой базе данных Всемирного банка для многих стран используется принцип множества контрольных точек (и, в частности, для России, судя по всему, так и есть). Но, судя по результату, принцип одной контрольной точки здесь, все-таки, используется чаще. По какому правилу здесь принимается решение, когда использовать одну контрольную точку, а когда — множество, мне не понятно.

5. Базы данных МВФ и Пенсильванских таблиц не очень похожи: коэффициент детерминации 0,9251. Этого и следовало ожидать: база МВФ, как я уже отмечал, скорее всего, основана на одной контрольной точке, а Пенсильванские таблицы — на множестве.

6. Две разные базы проекта Мэдисона (по одной и по множеству контрольных точек) не очень сходны между собой (R^2=0,9218), как и следовало ожидать.

7. Базы данных проекта Мэдисона (по множеству контрольных точек) и Всемирного банка (в постоянных ценах 2011 года) мало похожи (R^2=0,9291). Здесь тоже нет ничего неожиданного.

8. Базы данных проекта Мэдисона (по множеству контрольных точек) и Всемирного банка (в текущих международных долларах, пересчитанная в доллары 2011 г.) тоже не очень похожи (R^2=0,9323). Объяснение этого дано в пункте «4»: в базе Всемирного банка, похоже, в большинстве случаев использовался принцип одной контрольной точки.

9. Базы данных проекта Мэдисона (по множеству контрольных точек) и Пенсильванских таблиц близки друг к другу, но не очень (R^2=0,9592). Обе базы основаны на множестве контрольных точек. Но в каждом случае могут быть отличны как сами контрольные точки, так и методы экстраполяции и интерполяции. Кроме того, при разработке таких баз данных могут использоваться методы реконструкции значений реального ВВП на основе индикаторов развития (например, проект Мэдисона использует для этого данные о реальной зарплате и уровне урбанизации). В разных проектах для этих целей могут использоваться разные индикаторы развития.

10. Проект Мэдисона (одна контрольная точка) и данные Всемирного банка (в постоянных ценах 2011 г.) похожи, но не очень сильно (R^2=0,9485). Думаю, что для объяснения этого было достаточно сказано в пункте «2».

11. Проект Мэдисона (одна контрольная точка) и данные Всемирного банка (на основе текущих международных долларов, пересчитанные в цены 2011 г.): здесь примерно такой же уровень сходства (R^2=0,9457). В свете сказанного в пунктах «3», «4» и «10» здесь нет ничего неожиданного.

12. Проект Мэдисона (одна контрольная точка) и Пенсильванские таблицы оказались мало похожи друг на друга (R^2=0,854). Это тоже объяснимо: проекты, основанные на одной контрольной точке, как я уже говорил, должны сильно отличаться от проектов, основанных на множестве контрольных точек.

13. Две базы данных Всемирного банка очень похожи (R^2=0,9946). В свете сказанного в пунктах «3» и «4», здесь нет неожиданностей.

14. Всемирный банк (постоянные цены 2011 г.) и Пенсильванские таблицы — мало похожи (R^2=0,9261). Здесь тоже все объяснимо.

15. Всемирный банк (на основе текущих международных долларов, пересчитанных в цены 2011 года) и Пенсильванские таблицы — тоже мало похожи (R^2=0, 9288). Учитывая сходство между собой двух баз Всемирного банка (см. пункт «13»), в таком результате тоже уже нет неожиданностей.

16. Вспоминая то, чему меня учили в ВУЗе: экспертные оценки должны быть согласованными между собой. Судя по проведенному анализу, самая согласованная с другими база данных — это база Всемирного банка в постоянных ценах 2011 года (см. таблицу в верхней части 16-го кадра гифки, столбец H данной таблицы). На втором месте — база Всемирного банка в текущих международных долларах, пересчитанная в доллары 2011 года. На третьем — база МВФ. На четвертом — проект Мэдисона с множеством контрольных точек. На пятом — проект Мэдисона с одной контрольной точкой. На шестом — Пенсильванские таблицы. Означает ли это, что лучше всего взять за основу базу Всемирного банка или МВФ? Я в этом сомневаюсь, поскольку, как я говорил, лучше рассчитывать реальный ВВП по множеству контрольных точек. Однако альтернативные расчеты по множеству контрольных точек не очень согласованы между собой, поскольку на данный момент отсутствует единая устоявшаяся методика того, как эти расчеты проводить.

Я надеялся на то, что проект Мэдисона не принесет каких-то сюрпризов. Но, сегодня он мне, все же, преподнес сюрприз: расчеты по одной контрольной точке оказались не очень согласованы с данными Всемирного банка и МВФ. Не знаю, чем это объясняется: возможно, специалисты из проекта Мэдисона используют предварительные данные Программы международных сопоставлений и не успевают их вовремя обновлять. Это ставит под сомнение и качество исходных данных для расчетов по множеству контрольных точек. С другой стороны, высокая степень согласованности Пенсильванских таблиц и проекта Мэдисона — хорошая новость. Может быть, есть смысл использовать какой-нибудь «гибрид» Пенсильванских таблиц и проекта Мэдисона? Правда, если создавать такой «гибрид» из двух проектов, не понятно, в какой пропорции добавлять черты от каждого проекта.

 

Для того, чтобы из двух баз данных реального ВВП на человека выбрать какую-то одну, думаю, нужно посмотреть на то, насколько реалистично в них отображены процессы, с которыми я знаком хорошо. Для этого нет смысла в том, чтобы смотреть, как в них отображаются процессы, происходящие в Китае, Монголии или Венесуэле: я никогда не был ни в одной из этих стран. Но мне кое-что известно по личному опыту о происходящем в России, поэтому я сравню, насколько реалистично отображено в Проекте Энгаса Мэддисона (расчёт по множеству контрольных точек) и в Пенсильванских таблицах изменение реального ВВП на человека для нашей страны. Ещё добавлю сюда данные Всемирного Банка (те, которые я в свих предыдущих постах обозначал как WB, by cur. Int. $, 2011 constant – насколько я понимаю, в них для России расчёт произведён тоже по множеству контрольных точек).

На основании этих трёх баз данных я построил графики, характеризующие динамику российских реального ВВП (за 1990 – 2017 гг.) и инфляции (с 2000 по 2017 гг.).

Если рассмотреть первый из этих трёх графиков – тот, на котором представлены данные о величине реального ВВП на человека, то бросается в глаза следующее: наиболее драматично кризис 90-х годов выглядит согласно Проекту Мэддисона. Согласно данным Всемирного Банка и Пенсильванских таблиц в России начала 90-х годов наблюдался менее глубокий спад. Дело в том, что самая ранняя контрольная точка для России, которая использована в проекте Мэддисона – это 1996-й год. Для более ранних дат значения реального ВВП рассчитаны с помощью экстраполяции. Вероятно, в Пенсильванских таблицах и Всемирном банке для расчётов использованы какие-то контрольные точки, относящиеся к периоду до 1996-го года.

Любопытно отметить, что Пенсильванские таблицы показывают, что в 1992-м году в России был рост ВВП! И не просто рост, а рост на 9,12%. В то время я жил на Камчатке, и то, что там происходило, совсем не было похоже на рост в 9%. Скорее, это было похоже на спад на 90%. По крайней мере, субъективно это ощущалось именно так.

Как у Пенсильванских таблиц получился рост российского ВВП в 1992-м году – я не знаю. Могу сделать следующее предположение: специалисты из Пенсильванских таблиц решили тщательно измерить изменения ВВП в России начала 1990-х, и в качестве контрольных точек использовали и 1991-й, и 1992-й годы. Результаты таких расчётов зависят от наблюдавшихся изменений объёмов производства и цен на товары. А изменения тогда были поистине фантастические! Я уже в 2017 году публиковал пост  о том, что в СССР конца 1980-х годов цена тонны скота в живом весе была намного выше, чем тонны изготовленного из него мяса. В таких условиях, если вы в качестве индикатора развития используете покупательную способность доходов населения по скоту и, вообще, сельхозпродукции, то получите заниженное значение реального ВВП. А если в качестве индикатора развития используете покупательную способность доходов населения по мясу в магазине, то получите завышенное значение реального ВВП. Значит, для более обоснованной оценки реального ВВП позднего СССР нужно использовать оба эти индикатора. И, всё-равно, риск ошибки будет слишком велик: слишком высокой останется вероятность получить либо заниженное значение реального ВВП, либо завышенное. Поэтому, я предположу, что у специалистов Пенсильванских таблиц получилось заниженное значение реального ВВП для России 1991-го года – и, как следствие, появилась информация о несуществующем росте экономики в 1992-м году.

Поэтому, данные об экономическом спаде начала 1990-х по Проекту Мэддисона представляются мне более правдоподобными, чем по Пенсильванским таблицам.

Далее, я смотрю на данные по инфляции в 2015 году. И Всемирный Банк, и Пенсильванские таблицы показывают, что инфляция тогда сильно подскочила и достигла более 10% в год. Согласно же Проекту Мэддисона скачок инфляции тогда был не такой сильный, и инфляция не превысила 10-ти процентов. Здесь, по-моему, менее реалистичным оказался проект Мэддиссона.

Далее, согласно Всемирному Банку (по крайней мере, если верить именно этой базе данных), в 2006-м году цены по дефлятору ВВП выросли всего на 2%. Согласно официальной статистике индекс-дефлятор ВВП в России в 2006 году составил 15,2%. Ну никак не мог он тогда составить 2%! Так что здесь у Всемирного Банка в данных что-то не так. Базы данных Проекта Мэддисона и Пенсильванских таблиц в данном случае показывают более высокий рост цен и, в этом смысле оказываются более реалистичными.

Вообще, все три базы данных показывают какую-то странновато-низковатую инфляцию и странновато-высоковатый экономический рост (рост выше 10% в год) для России 2003 – 2008 годов. Это – общая особенность баз данных, основанных на использовании множества контрольных точек: они почему-то завышают темпы роста российского ВВП для того периода. Дело в том, что тогда произошло что-то загадочное: Глобальный раунд международных сопоставлений ВВП по ППС по итогам 2005-го года показал, что реальный ВВП на человека в России составляет где-то 28% от аналогичного показателя в США. Экстраполяция на будущее показывала, что реальный ВВП на человека в России в 2011 – 2014 гг. должен был увеличиться до 33 – 34% от аналогичного показателя США. Но вдруг вышли данные Глобального раунда сопоставлений ВВП по ППС по итогам 2011 года, и оказалось, что реальный ВВП на человека в России чуть ли не 50% от аналогичного показателя США, и что мы чуть ли не догнали Португалию по уровню жизни. Любая попытка построения базы данных реального ВВП по множеству контрольных точек стала приводить к каким-то странным данным об удивительно быстром росте российской экономики в 2005 – 2008 годах.

У меня, тем не менее, остаётся ощущение того, что что-то здесь не так. Не могло быть настолько быстрого роста экономики в 2005 – 2008 (или 2003 – 2008). Если бы наша экономика внезапно так вымахала, то к 2014-му году курс рубля, вообще, должен был бы оказаться заниженным, и доллар должен был бы рухнуть по отношению к рублю. Но произошло-то всё наоборот! Рухнул рубль, а не доллар! У меня есть предположение о том, что базы данных вроде тех трёх, которые я сейчас рассматриваю, несколько завышают нынешнее значение ВВП России, и несколько занижают значение ВВП России 2005-го года (не преднамеренно, а, скорее всего, из-за каких-то статистических искажений, которые могли сформироваться, например, под действием укрепления курса национальной валюты, спровоцированного наблюдавшимся в тот период ростом цен на нефть).

Но пока я не могу сказать на этот счёт что-либо определённое. Мне нужно будет провести расчёты, для которых, в свою очередь, нужно выбрать какую-то из баз данных со множеством контрольных точек. База Всемирного Банка для этого однозначно не подходит: в ней далеко не всегда выдерживается принцип использования множества контрольных точек. А из двух оставшихся баз, в свете сказанного выше, мне представляется более правдоподобной база Проекта Мэддисона. Да, в ней несколько занижена инфляция 2015-го года, но, думаю, что рост ВВП на 9% в 1992-м году – это гораздо более грубое искажение.

А вот и знаменитый пенсильванский эффект!: чем более развита страна - тем дороже в ней стоят товары. Не знаю, кто заметил это явление впервые. Может быть, Колумб, когда начал получать от коренных жителей Нового Света драгоценности в обмен на безделушки. А может быть и древние египтяне, когда установили торговые отношения с нубийцами. Но впервые это явление начало научно описываться и изучаться только во второй половине XX века.

Название этому явлению дал Пол Самуэльсон в честь Пенсильванских таблиц. Как видно из диаграммы, увеличение относительного подушевого реального ВВП на 1% приводит, в среднем, к росту относительного уровня цен на 0,25%. Коэффициент детерминации 0,3837 - не очень большой, но существенный. Среднеквадратическое отклонение довольно большое: 0,397. Это означает, что отклонения от прямой линии на 40% - это обычное дело. Да это и видно по ширине получившегося "облачка". Когда я вглядываюсь в его форму, у меня возникает ощущение, что зависимость здесь, всё-таки, нелинейная.

Я решил продолжить изучение пенсильванского эффекта, о котором я говорил в предыдущем посте, проанализировав зависимость уровня цен от величины реального ВВП на человека на нелинейность. Этот анализ я провёл так:

Во-первых, отсортировал данные по возрастанию значения относительного реального ВВП на человека (с помощью команд «данные», «сортировка» в Excel);

Во-вторых, выбрал число 50 (здесь главное, чтобы число было не очень маленьким);

В-третьих, в таблице с отсортированными данными рассчитал средние арифметические значения для первых 50-ти значений ln(относительного уровня цен) и первых 50-ти значений ln(относительного реального ВВП на человека) – то есть с 1-го по 50-й для каждого из этих двух показателей;

В четвёртых, аналогично со 2-го по 51-й для каждого из этих двух показателей;

В пятых, с 3-го по 52-й и так далее до конца таблицы;

В шестых, выбрал число 100, и аналогичные расчёты сделал для 100, потом для 200, для 300, 500 и 1000 (последнее число должно быть заметно меньше общего числа наблюдений, а поскольку число наблюдений – 3617, то 1000 явно меньше);

В седьмых, результаты расчётов представил в виде 6-ти графиков и объединил эти графики в гифку.

Эти графики и показывают наглядно нелинейный характер зависимости уровня цен от уровня развития страны. На первом графике можно заметить множество «зазубринок». На втором графике «зазубринки» становятся меньше, на третьем ещё меньше, на шестом графике – почти исчезают. На эти «зазубринки» можно не обращать внимание, они появляются в результате случайных флуктуаций: чем больше число наблюдений, на основе которых построены точки графика, тем менее выражена будет «зазубренность» графика.

Однако в форме графиков есть некий нелинейный элемент, который практически не зависит от числа наблюдений, на основе которых построены точки. Эта нелинейность выражается в том, что я бы назвал И-образной формой графиков: сначала графики идут по нисходящей, потом по возрастающей, потом – снова по нисходящей.

Рассмотрим, например, график для 50-ти точек (первый из этих 6-ти графиков). Можно легко заметить, что если двигаться по оси OX слева направо, начиная со значения x=-4,28 до значения x=-1,25 значения по оси y имеют тенденцию к убыванию; затем – от x=-1,25 до x=-0,16, в целом, наблюдается тенденция к росту значений y; затем – между x=-0,16 и x=0,21 имеет место некоторая неопределённость, и, начиная с x=0,21, значения y начинают быстро убывать. Чем объясняется наличие среднего – восходящего отрезка И-образной кривой – понять легко: тем самым пенсильванским эффектом, о котором уже было сказано. Но чем объясняется наличие левого и правого нисходящих крыльев И-образной кривой – над этим стоит поразмышлять. Я думаю, что левое нисходящее крыло объясняется существованием слаборазвитых стран, в которых правительства проводят политику множественных валютных курсов: из-за того что официальный курс национальной валюты оказывается завышен по сравнению с рыночным, цены на товары в таких странах при расчёте по официальному курсу представляются относительно высокими. Чуть позже я постараюсь тщательнее проверить это предположение.

Правое же нисходящее крыло объясняется ситуацией в небольших нефтедобывающих государствах (таких как Катар и ОАЭ). Если верить базе данных Энгаса Мэддисона, цены на товары в этих странах намного ниже, чем в обычных развитых странах, таких как Германия или США. Если посмотреть на статистику стоимости жизни (середина 2019 года) на сайте www.numbeo.com , то там мы увидим, что индекс стоимости жизни, рассчитываемый сайтом составляет: в Германии 66,57, в США 70,95, в Великобритании 65,33, во Франции 74,62 (в среднем, можно считать, 69,4). В Кувейте этот показатель составляет 50,33, в Катаре 62,22, в ОАЭ 63,58; в среднем в этих трёх странах получаем где-то 58,71. Да, дешевле, чем в развитых странах, но не сильно – где-то на 14,4%.

Если же посмотреть на результаты Глобального раунда сопоставлений ВВП по ППС, то там мы увидим данные, которые, в целом, согласуются с информацией Проекта Мэддисона: уровень цен для Кувейта 62% от США, для Катара 66%, для ОАЭ 69%. На сайте www.numbeo.com, вероятно, значения цен на товары для ОАЭ, Катара и Кувейта несколько завышены (этому есть простое объяснение: numbeo держится исключительно за счёт сил активистов, работающих в различных частях мира; есть определённые закономерности в развитии сайта: сначала к его работе подключаются активисты, живущие в наиболее крупных городах – там, где цены на товары более высоки, чем в среднем по стране, и только потом к проекту подключаются жители малых населённых пунктов; как следствие, для сравнительно недавно подключившихся к проекту экономик может возникать некоторое завышение цен).

Теперь возникает вопрос о том, почему в маленьких нефтедобывающих странах цены существенно ниже, чем в крупных развитых экономиках. У меня есть три возможных объяснения. Первое – возможно, популистская политика местных правительств. Например, если сопоставить цены на бензин, то в Катаре и ОАЭ они значительно ниже, чем в развитых странах: за литр в США (0,73$), в Великобритании (1,63$), во Франции (1,62$), в Германии (1,57$), в Катаре (0,52$), в ОАЭ (0,63$). Столь низкие цены на бензин у нефтедобытчиков – это следствие популистской политики, а не нефтяного изобилия (для сравнения – в нефтедобывающей Норвегии цена одного литра бензина составляет 1,75$; просто в Норвегии много нефти, но мало популизма).

Второе объяснение: многоукладность экономик у маленьких нефтедобывающих государств. То есть, там, с одной стороны, благодаря наплыву нефтяных денег создан относительно современный сектор экономики; с другой стороны, в каких-то секторах может сохраняться технологическая отсталость. Люди, которые переходят на работу из относительно отсталого сектора в относительно современный, часто соглашаются на более низкую оплату труда, чем их коллеги из Европы и США. Кроме того, маленькие нефтедобывающие государства активно привлекают в сектор услуг относительно дешёвую рабочую силу из развивающихся стран.

Третье объяснение: у маленьких государств очень высокое значение чистого экспорта: стоимость экспортируемых товаров намного выше, чем стоимость импортируемых. Как следствие, сумма конечного потребления и валового накопления оказывается намного ниже, чем ВВП. Возможно, что уровень цен больше зависит от суммы внутреннего накопления и потребления, чем от общей величины ВВП. Если это так, то это могло бы объяснить, почему в Кувейте и Катаре товары намного дешевле, чем в Германии или США

Оригинал

Материалы по теме
Комментарии (0)
или зарегистрируйтесь, чтобы оставить комментарий, как зарегистрированный пользователь.

Последние новости