Манипуляция статистикой: различия между версиями
Строка 8: | Строка 8: | ||
* Априорная вероятность — вероятность заболеть (уколот ли — неизвестно). | * Априорная вероятность — вероятность заболеть (уколот ли — неизвестно). | ||
* Условная вероятность — вероятность заболеть, если был привит. Или если не был. | * Условная вероятность — вероятность заболеть, если был привит. Или если не был. | ||
* Апостериорная вероятность — вероятность, что ты привит, если ты заболел. | * Апостериорная вероятность — вероятность, что ты привит, если ты заболел (или если не заболел). | ||
Априорная вероятность связана с условными по [https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D1%83%D0%BB%D0%B0_%D0%BF%D0%BE%D0%BB%D0%BD%D0%BE%D0%B9_%D0%B2%D0%B5%D1%80%D0%BE%D1%8F%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8 формуле полной вероятности]. Апостериорная вероятность связана с условными по [https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%B0 формуле Байеса]. | Априорная вероятность связана с условными по [https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D1%83%D0%BB%D0%B0_%D0%BF%D0%BE%D0%BB%D0%BD%D0%BE%D0%B9_%D0%B2%D0%B5%D1%80%D0%BE%D1%8F%D1%82%D0%BD%D0%BE%D1%81%D1%82%D0%B8 формуле полной вероятности]. Апостериорная вероятность связана с условными по [https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%B0 формуле Байеса]. | ||
Строка 15: | Строка 15: | ||
* Априорная вероятность — 30/110 ≈ 0,27. | * Априорная вероятность — 30/110 ≈ 0,27. | ||
* Условная вероятность, если привит — 0,2. Условная вероятность, если не привит — 1. | * Условная вероятность, если привит — 0,2. Условная вероятность, если не привит — 1. | ||
* Апостериорная вероятность быть | * Апостериорная вероятность быть привитым, если заболел — 20/30 ≈ 0,67. | ||
Вот мы смотрим на последнюю цифру и говорим: двое из трёх заболевших привиты! А ведь прививка превращает почти верную болезнь в 20%! | Вот мы смотрим на последнюю цифру и говорим: двое из трёх заболевших привиты! А ведь прививка превращает почти верную болезнь в 20%! |
Версия от 01:21, 23 марта 2016
Манипуляция статистикой — способы заставить ложные данные выглядеть наукообразно и правдоподобно.
Манипуляция методикой
Спутать априорную, условную и апостериорную вероятность
Допустим, мы исследуем вероятность заболеть, если был привит и если не был. Тогда у нас:
- Априорная вероятность — вероятность заболеть (уколот ли — неизвестно).
- Условная вероятность — вероятность заболеть, если был привит. Или если не был.
- Апостериорная вероятность — вероятность, что ты привит, если ты заболел (или если не заболел).
Априорная вероятность связана с условными по формуле полной вероятности. Апостериорная вероятность связана с условными по формуле Байеса.
Например (цифры выдуманные): из 100 уколотых заболели 20. Из 10 отказавшихся заболели все. Тогда:
- Априорная вероятность — 30/110 ≈ 0,27.
- Условная вероятность, если привит — 0,2. Условная вероятность, если не привит — 1.
- Апостериорная вероятность быть привитым, если заболел — 20/30 ≈ 0,67.
Вот мы смотрим на последнюю цифру и говорим: двое из трёх заболевших привиты! А ведь прививка превращает почти верную болезнь в 20%!
См. также: Парадокс Спящей красавицы.
Метод техасского стрелка
Метод техасского стрелка: стрельнуть и нарисовать мишень там, куда стрельнул, а неудачные пробоины залатать. Это связано с другим методом демагогии: Свиногогия.
Ошибка выжившего
Передаточному звену выставить источник на посмешище
Многие из нас могут сложить в уме два числа, а некоторые — знакомы с этими приёмами. Задача проста: делаем наглую манипуляцию данными, чтобы внимательный мог всё же увидеть, что цифры нечистые. В результате неверной обработки данных будет подорвано доверие к их источнику.
Тут примером будут печально известные «146 %». Не будем выяснять, было это намеренно или просто ошибка в нехитрой программе, готовившей график, главное: ЦИК РФ был выставлен на посмешище.
Нерепрезентативная выборка
Скрыть малую выборку за лишними цифрами
Манипуляция графиками
Вообще никакого масштаба
Самый «дубовый» способ манипуляции статистикой: вообще никакого масштаба. Например, единица тут не равна единице там, или 10 тут больше, чем 20 там.
График без нуля
В биржевой спекуляции с высокими плечами важен рост или падение курса даже на один пункт[1]. Если в анализе временны́х рядов мы слишком далеко ушли от фактического размаха данных — плохой прогноз. Для всего этого графики могут и не иметь нуля.
Но это специфические задачи, и в большинстве задач всё-таки ордината пропорциональна величине. И если тихонько обрезать ось, чтобы 0 ординат был равен, например, тысяче, небольшие колебания будут казаться дикими скачками.
Разрыв в оси
Трёхмерность
Двойной масштаб
Линейный масштаб там, где нужен логарифмический, и наоборот
Масштаб определяется не закрашенной областью, а чем-то другим
Скрыть важную тенденцию за мелким масштабом
Скрыть важную тенденцию за неудачным срезом
Начхать на все договорённости
Примечания
- ↑ То, что с плечами в 1000 и более обычно торгуют на «форекс-лохотронах» — вопрос другой.