Манипуляция статистикой: различия между версиями

Материал из Русского эксперта
Перейти к навигации Перейти к поиску
Строка 4: Строка 4:


=== Спутать априорную, условную и апостериорную вероятность ===
=== Спутать априорную, условную и апостериорную вероятность ===
Допустим, мы исследуем вероятность заболеть, если был [[прививка|привит]] и если не был. Тогда у нас:
* Априорная вероятность — вероятность заболеть (уколот ли — неизвестно).
* Условная вероятность — вероятность заболеть, если был привит. Или если не был.
* Апостериорная вероятность — вероятность, что ты привит, если ты заболел.
Априорная вероятность связана с условными по [[w:Формула полной вероятности|формуле полной вероятности]]. Апостериорная вероятность связана с условными по [[w:Формула Байеса|формуле Байеса]].
Например (цифры выдуманные): из 100 уколотых заболели 20. Из 10 отказавшихся заболели все. Тогда:
* Априорная вероятность — 30/110 ≈ 0,27.
* Условная вероятность, если привит — 0,2. Условная вероятность, если не привит — 1.
* Апостериорная вероятность быть привитым — 20/30 ≈ 0,67.
Вот мы смотрим на последнюю цифру и говорим: двое из трёх заболевших привиты! А ведь прививка превращает почти верную болезнь в 20%!
См. также: [[w:Парадокс Спящей красавицы]].


=== Метод техасского стрелка ===
=== Метод техасского стрелка ===

Версия от 01:16, 23 марта 2016

Манипуляция статистикой — способы заставить ложные данные выглядеть наукообразно и правдоподобно.

Манипуляция методикой

Спутать априорную, условную и апостериорную вероятность

Допустим, мы исследуем вероятность заболеть, если был привит и если не был. Тогда у нас:

  • Априорная вероятность — вероятность заболеть (уколот ли — неизвестно).
  • Условная вероятность — вероятность заболеть, если был привит. Или если не был.
  • Апостериорная вероятность — вероятность, что ты привит, если ты заболел.

Априорная вероятность связана с условными по формуле полной вероятности. Апостериорная вероятность связана с условными по формуле Байеса.

Например (цифры выдуманные): из 100 уколотых заболели 20. Из 10 отказавшихся заболели все. Тогда:

  • Априорная вероятность — 30/110 ≈ 0,27.
  • Условная вероятность, если привит — 0,2. Условная вероятность, если не привит — 1.
  • Апостериорная вероятность быть привитым — 20/30 ≈ 0,67.

Вот мы смотрим на последнюю цифру и говорим: двое из трёх заболевших привиты! А ведь прививка превращает почти верную болезнь в 20%!

См. также: w:Парадокс Спящей красавицы.

Метод техасского стрелка

Метод техасского стрелка: стрельнуть и нарисовать мишень там, куда стрельнул, а неудачные пробоины залатать. Это связано с другим методом демагогии: Свиногогия.

Ошибка выжившего

Передаточному звену выставить источник на посмешище

Набившие всем оскомину 146 %

Многие из нас могут сложить в уме два числа, а некоторые — знакомы с этими приёмами. Задача проста: делаем наглую манипуляцию данными, чтобы внимательный мог всё же увидеть, что цифры нечистые. В результате неверной обработки данных будет подорвано доверие к их источнику.

К сожалению, тут примером будут печально известные «146 %». Не будем выяснять, было это намеренно или просто ошибка в нехитрой программе, готовившей график, главное: ЦИК РФ был выставлен на посмешище.

Манипуляция графиками

Вообще никакого масштаба

Самый «дубовый» способ манипуляции статистикой: вообще никакого масштаба. Например, единица тут не равна единице там, или 10 тут больше, чем 20 там.

График без нуля

В биржевой спекуляции с высокими плечами важен рост или падение курса даже на один пункт[1]. Если в анализе временны́х рядов мы слишком далеко ушли от фактического размаха данных — плохой прогноз. Для всего этого графики могут и не иметь нуля.

Но это специфические задачи, и в большинстве задач всё-таки ордината пропорциональна величине. И если тихонько обрезать ось, чтобы 0 ординат был равен, например, тысяче, небольшие колебания будут казаться дикими скачками.

Разрыв в оси

Трёхмерность

Двойной масштаб

Линейный масштаб там, где нужен логарифмический, и наоборот

Масштаб определяется не закрашенной областью, а чем-то другим

Скрыть важную тенденцию за мелким масштабом

Скрыть важную тенденцию за неудачным срезом

Начхать на все договорённости

Примечания

  1. То, что с плечами в 1000 и более обычно торгуют на «форекс-лохотронах» — вопрос другой.