Искаженная реальность или почему не стоит слепо доверять всякой статистике

Цифры обманчивы, особенно когда я сам ими занимаюсь;
по этому поводу справедливо высказывание, приписываемое Дизраэли:
«Существует три вида лжи: ложь, наглая ложь и статистика».

Марк Твен

Статистика всегда красива в своей подаче. В ней есть различные точные цифры, часто есть приятные глазу графики и диаграммы. Иногда нам подают какие-то выводы или прогнозы, основанные на всех этих данных.



И все это выглядит крайне убедительно. Хочется принять эти данные за некую опору в нашем динамично развивающемся и стремительно меняющемся мире. И вот тут я хочу предостеречь тех, кто читает эту статью и предложить им критически смотреть на ежедневно преподносимую нам всякого рода статистику.

Неясное происхождение исследований
В первую очередь нужно понять, что большинство предоставляемых нам данных вообще имеют непонятное происхождение. Нам не известны ни методики сбора данных, ни кто этим занимался.
Может оказаться так, что ее собирало некое заинтересованное лицо с определенной целью и среди определенных людей. В таком случае, конечный результат может вообще никак не отражать действительность, кроме той, которую вам хотели представить.

Манипулятивные цели
За любыми статистическими исследованиями всегда кто-то стоит, а это значит, что исследования носят определенные цели. И не всегда у этих целей независимый и незаинтересованный характер. Это может отразиться как на ходе самих исследований, так и на подаче данных и сделанных выводов.

Например, у некого предприятия 10 работников, трое из которых получают зарплату 100 долларов, еще трое 150, и еще трое 200, а один работник 5000 в месяц.
В среднем, зарплата на предприятии будет равна 635 долларам в месяц, а медианное значение зарплаты равняется 150 долларов в месяц. То есть разница между этими двумя значениями в 4.2 раза.
И если руководителю предприятия надо показать более высокую зарплату — он продемонстрирует среднее, а не медианное значение, как доказательство своих достижений.



Другими словами, вы должны понимать, что статистикой очень часто манипулируют на всех этапах. Способов манипуляции множество, но я не буду сильно останавливаться на всякого рода манипуляциях, искажениях и прочих вещах. Кому это интересно — то рекомендую к прочтению книгу «Как лгать с помощью статистики» Даррелла Хаффа. Там автор подробно разбирает множество таких способов с конкретными примерами.

Опросы вместо исследований
Зачастую нам подаются какие-то статистические данные и выводы на основе опросов, а не исследований. Однако, вы должны учитывать, что ответ на вопрос и то, что происходит в реальности – зачастую, очень разные вещи. В опросах люди могут врать, хотеть показаться лучше, могут бояться, отвечать так, какой думают, от них хотят получить ответ. Другими словами процент искаженных полученных данных может стремиться к 100%, что сводит смысл любых дальнейших действий и выводов к нулю.

Раздувание, неправильные выводы и несвязанные события
Так как большинство из нас вряд ли получает различного рода исследования из первоисточников – то, скорее всего, вам такого рода информацию доставляют различные посредники, вроде СМИ.
И каждый такой посредник любит что-нибудь приукрасить, раздуть или сделать собственные, зачастую необоснованные выводы. Ведь СМИ не нужны сухие цифры. Им нужны громкие заголовки, сенсации и прочие медийные заморочки, которые позволят им собрать большую аудиторию и заработать больше денег.

А некоторые еще и умудряются связывать несвязываемые вещи. Вроде того, что чем больше воды люди пьют — тем больше панд становится в мире. Не знаю, есть ли такая корреляция между цифрами, но если она есть — найдутся и те, кто захочет это преподнести, как взаимосвязанные события, я полагаю.

Общие выводы и отсутствие частных наблюдений
Пожалуй, один из главных недостатков разного рода статистики заключается в том, что она часто имеет общие выводы.
Допустим, по статистике 80 процентов бизнесов закрывается в первые 3 года работы. Что это значит для человека, который хочет открыть бизнес?



Выглядит все так, как будто это печальные цифры, говорящие ему, что не стоит заниматься бизнесом и рисковать. Ведь вероятность того, что он закроется крайне высока. Однако, эти цифры не говорят нам, по какой причине эти бизнесы закрылись. Возможно, что владельцы заработали достаточно денег на всю жизнь, обанкротились, нашли для себя лучший вариант или что-нибудь еще.
Даже если допустить, что 80% имели негативный опыт ( т.е. бизнес потратил их сбережения и ничего им не принес), то кто те люди, которые вошли в эти 80%? Какими качествами они обладали? Какие ресурсы имели? С какой целью открывали бизнес? Какие у них были способности? Есть множество других частных деталей, которые нам неизвестны. Возможно, человек, открывающий бизнес, вообще не входит по всем этим параметрам в 80% и имеет все шансы войти в 20% успешных бизнесов.
Да и с точки зрения частностей, нам особо не известно, что за бизнесы в этих 20%.

И даже более того, никто толком и не знает, на чем основана данная статистика: на какой-то конкретной сфере, на бизнесах определенного масштаба, региона или еще на чем то. Даже не считая мелочей, можно с определенной долей скепсиса отнестись к данным такого рода.

То же самое можно увидеть практически в любой области. Нам могут рассказывать, что какой-то продукт вредно есть, но никто не скажет вам, для каких конкретно людей вредно и в каком виде: сыром, жареном, вареном, печеном или еще каком-то. Как он был выращен и где, и так далее.

Или скажут, что какая-то методика не работает, так как 90% людей, использовавших ее не получили нужного результата. Но вам не расскажут, кто эти люди и как эту методику они использовали. Это вызывает скептическое отношение к любым статистическим цифрам такого рода.

Я не против статистики, как таковой. Я лишь предлагаю постараться относиться более критично к предлагаемой нам статистике различного рода и не воспринимать ее буквально, а задавать различные вопросы, вроде тех, которые я поднял в этом посте.
5 комментариев
avatar
Интересная статья, натолкнуло прочитать книгу «Как лгать с помощью статистики», которая упоминается в статье. Спасибо.
avatar
Еще могу добавить в качестве примеров такой же непонятной и общей статистики — это статистика разводов, там тоже приводятся какие-то большие проценты, но при этом абсолютно неясно никаких деталей: возраст, социальный, материальный статус, причины брака и прочее. Из-за чего многие строят выводы о несостоятельности института брака. Хотя, как по мне данная статистика вообще ничего не может сказать о браке, как таковом.
avatar
Пожалуй, соглашусь, действительно крайне неясные статистические данные, которые постоянно пихают во все бочки, привязывая к собственным выводам.
avatar
Хорошая статья и рисунки прикольные, в тему статьи, сами рисовали?
avatar
спасибо, да, иллюстрации были сделаны для статьи специально, но не мной.
Чтобы писать и задавать вопросы в комментариях – зарегистрируйтесь на сайте.
Если вы уже зарегистрированы, то авторизуйтесь на сайте.