Обсуждение:Миф:Гауссиана на выборах

Материал из Русского эксперта
Версия от 12:30, 21 сентября 2016; Аноним (Политика конфиденциальности) (Новая страница: «Не хочу лезть своими руками, но скажу вот что. Про то, что голоса за какую-то партию будут …»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Не хочу лезть своими руками, но скажу вот что. Про то, что голоса за какую-то партию будут распредлены по гауссиане это конечно бред. Во-первых, на многих графиках смотрят процентное соотношение, что вообе никак не может соответсвовать распределению гаусса - по этому распределению возмоны как участки с голосами за любую партию выше 100% и меньше 0%. Т.е. оно отлетает сразу с порога.То же касается логнормального распределения. Реальное распределение за любую голосов партию на участках - биноминальное. Нужно сделать две гипотезы. Выделяется какая-то область, например юный район москвы, в котором население считается примерно равнородным по предпочтениям в политике. Пусть в этом районе за партию А голосует p процентов ибирателей. Тогда вероятность того, что сферический избиратель в вакууме проголосует за эту партию - p. Если из N избирателей за партию проголосовало m конкретных человек, то вероятность такого события p^m*(1-p)^(N-m). Это вероятность того,что m человек голосуют за партию А с вероятностью p, а N-m голосуют по другому с вероятностью (1-p). И то, это из допущения, что люди голосуют независимо друг от друга. А это не совсем так. Т.к. для конечного реультата не важно, какие именно люди проголосуют, то надо умноитьэту вероятность на все возможные комбинации выбрать m человек из N людей. Это число называется биноминальный коэффициент(бином Ньютона, да).

итого вероятность того, что за партию А на данном участке проголосует m человек из N, С^m_N*p^m*(1-p)^(N-m). Далее, если мы отим получить распределение по доле, нужно будет или применить формулу стирлинга, поделив на N, или заменить биноминальный коэффициент на его непрерывный аналог функцию B и тоже сократить наобщее число избирателей. С точностью до множителя распределение будет exp{-xLn(x/p) -(1-x)Ln([1-x]/[1-p]}, где x - доля проголосовавших од 0 до 1. как можно видеть, функция сама по себе определена от 0 до 1. У распределения максимум в точке p, что и понятно, т.к. это и есть средняя доля проголосовавших за партию. Приближающая Гауссиана же выглядит в стиле exp{-(x-p)^2/p/(1-p)}. Разница налицо. Приближение будет работать только в окрестности точки p. Логнормальное же выглядит в стиле 1/x * exp[-(Ln(x)-p)^2] - уже лучше, но не идеально, подходит для приближения распределения для таких "популярных партий" как Парнас, чья доля p невелика.

Вопли же про то, что там долна быть гауссиана, идут от низкого математического образования. У автора вброса было очевидно плохо с комбинаторикой и теорвером, но так как лабы он сдавал, то помнит, что "там всё гауссиана". Потому что центральная предельная теорема. В реале же, гауссиана является предельным распределением для среднеарифмитического величин с одинаковым распределением. Попытки тыкать её везде объясняются не математическим образованием, а банальным житейским опытом автора вброса. Однако же доля избирателей - это никакое не среднее арифметическое от велечин с одинковым распределением.