xaxam: (Default)
[personal profile] xaxam

4.12 помню, 5.30 помню, 5.38 - уже не помню...

Лучшие умы ЖЖ и окрестностей за последний год накопили бесценный опыт статистического анализа фальсифицированных выборов.

Интересно, не придёт ли кому в голову перепроверить методики на результатах американских выборов? А то много чего разного стали говорить, очерняя светлое имя самой демократической партии: то избирателей с Уралвагонзавода автобусами возили, то  всю дорогу с поллами мухлевали, то явку в 141 процент застукали. Пусть, наконец, наука своё слово скажет.

Или надо Чурову писать? Он, правда, заранее предсказал, что всё будет нечестно, но может сейчас, с фактами в руках, ЦИК больше подробностей сообщит?

Date: 2012-11-14 02:57 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Ты что, серьёзно?

Date: 2012-11-14 03:03 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Чтó серьёзно?

Что были участки, где был мухлёж? Уверен на 99.9%. Что national vote это не изменит? никаких сомнений. Что Аллен Вест может по итогам recount'a пройти в Конгресс? запросто может быть.

Ну и просто интересно сравнить картинки ;-)

Date: 2012-11-14 03:22 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Я не понял в чём мессадж этого поста.

Date: 2012-11-14 03:53 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Скажем, попытаться понять, насколько надёжно можно идентифицировать участи с fraudulent vote и какое число голосов они могли принести той (или иной, добавим для политкорректности) стороне.

Я не думаю, что можно ожидать пиков на числе процентов, кратном пяти, - но яркие синие точки на розово-фиолетовом фоне могли бы нести бит-другой информации...

И потом, ещё раз повторюсь, я люблю красивые картинки. Пусть мне нарисуют красивые хвосты распределений, загибающихся от восторга.

Date: 2012-11-14 03:27 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Ну и вообще, нечего ссылки на всяких дебилов давать. Эти президентские выборы феноменальны в первую очередь точностью прогнозов.
Те, кто спрогнозировал полную лажу, остались за бортом - скорее всего потому, что у них не было ресурсов на проведение нормальных опросов.
Непонятно, почему эти люди сейчас должны быть кому-то интересны.

Date: 2012-11-14 04:00 pm (UTC)
From: [identity profile] xaxam.livejournal.com
феноменальны в первую очередь точностью прогнозов

Ты меня почему-то держишь за идиота. Пресловутый Нат Сильвер публиковал на полях своего блога raw data по swing states, вместе с декларируемыми погрешностями. Почти везде опросы были крайне близки к ничьей, с зазором в 1-2 процента, и некоторые опросы давали победу красным. Сам он никаких опросов не проводил, а кушал, что дают (а давали всем одно и то же).

Я не понимаю, как на основании таких пограничных измерений без построения весьма детальной модели можно дать прогноз в 90% победы одной стороне. У Сильвера нет модели, а есть регрессионный анализ с массой blows and whistles, которые можно потихоньку подстраивать в процессе.

Хочешь поупражнять логику? Скажи мне своими словами, что это была за случайная величина, которую прогнозировали-прогнозировали, а под конец померили.

Date: 2012-11-14 04:08 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Очень просто: за пару дней до выборов было понятно, что есть примерно 6 штатов, где не всё ясно. При этом Ромни для победы нужно было выиграть во всех, а Обаме в одном.
Значит вероятность победы Обамы равна 5/6, а Ромни 1/6. Никакие графики не нужны.

Date: 2012-11-14 04:09 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Про 5/6 и 1/6 - это шутка (на всякий случай).

Date: 2012-11-14 04:18 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Слава богу! а то я уж начал было набирать воздуху в лёгкие...

Одна из самых серьёзных систематических ошибок, которую неизбежно наследуют все поллы, - bias когорты людей, готовых разговаривать с поллстерами. Этот bias всегда работал в пользу демократов, популистов и "партий власти".

Отфильтровать его, - это как "тёмную материю" исчислить. А оно ведь ещё и меняется, сцуко!

Вообще статистика - не наука, если ты не знал ;-) у меня есть один знакомый, занимающийся медицинской статистикой (большой человек в большом госпитале, да ты и сам, небось, догадаешься, о ком речь). Я его как-то спросил, насколько трудно ему было бы трудно переквалифицироваться из медицинской статистики в страховую. Ответ был, - ну, это как алгебраисту переучиться в геометра.

А электоральная "статистика" - вообще извращение, гораздо более бессмысленное, чем женский хоккей на траве.

Date: 2012-11-14 04:31 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Заметь, что в данном случае всё как часы сработало. Тут не в науке дело, а в деньгах.

Date: 2012-11-14 04:34 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Ты, кстати, не оценил шутки. В реальности, если пользоваться моей логикой, то видно, что вероятность победы Ромни была почти равна 0 (т.е. 1/64 - я знаю правильный
ответ!) Поэтому волноваться в день выборов было совершенно некому и не о чём.

Date: 2012-11-14 04:52 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Но ведь это только для случая, когда результаты в отдельных штатах некорpелированы. А если корpеляция 1, то шансы Ромни победить - 1/2. Усреднив 1/2 и 1/64, получим 33/128. Это и есть примерно то, что было у Сильвера

Date: 2012-11-14 04:55 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
И то, и другое есть более или менее 0 с моей точки зрения. Кроме того, кореляция 1 между ВСЕМИ этими штатами - это что-то совсем невероятное.

Date: 2012-11-14 05:11 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Корреляция 1 по всем штатам столь же вероятна, что и корреляция 0 по всем же штатам, поэтому я и брал среднее.

Разумеется это всё шутки (если не было понятно :-).

С другой стороны, предсказания в подобных ситуациях примерно так и делаются, и на удивление оказываются точными. Не в том смысле, что дают правильный ответ в 100% процентах случаев, а в том, что там где кажется, что шансы 50 на 50; эти предсказания могут дать правильный ответ в 60 или 70 (как повезёт :-) процентах случаев

Date: 2012-11-14 05:13 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Да, я понимаю. Но, кстати, кореляция 0 несравнимо вероятнее кореляции 1. В этом весь смысл устройства американского государства - что происходит
в соседнем городе никого не волнует.

Date: 2012-11-14 05:32 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Сильвер, кстати, мог бы взять эти корреляции не с потолка, а по историческим данным прошлых выборов. Построил бы ковариационную матрицу, взял бы 2-3 интерграла и вместо 33/128, что примерно 25.78% (далеко не 0!), получил бы 19.875%.

Правда, сайт, который элементарно усреднял данные всех опросов, насколько я понимаю, даже не взвешивая их в соответствии с прошлыми заслугами, дал точный результат по 49 штатам и ошибся только во Флориде. Но во Флориде у Сильвера - очевидное везение (он и сам давал оценку 50.2% победы Обамы)

Date: 2012-11-14 05:40 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Ну, собственно Флорида ничего не определяла. Мне с самого начала было очевидно, что у Ромни нет шансов - морда у него не президентская. Таким вещам я доверяю
гораздо больше, чем любой статистике.

Date: 2012-11-14 05:57 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Определять вероятность победы на президентских выборах по морде лица - метод предложенный еще в начале 19 века Ломброзо (http://ru.wikipedia.org/wiki/%D0%9B%D0%BE%D0%BC%D0%B1%D1%80%D0%BE%D0%B7%D0%BE,_%D0%A7%D0%B5%D0%B7%D0%B0%D1%80%D0%B5#.D0.9D.D0.B0.D1.83.D1.87.D0.BD.D0.B0.D1.8F_.D0.B4.D0.B5.D1.8F.D1.82.D0.B5.D0.BB.D1.8C.D0.BD.D0.BE.D1.81.D1.82.D1.8C). К сожалению, в последнее время его мало кто умеет правильно использовать

Date: 2012-11-14 04:55 pm (UTC)
From: [identity profile] trurle.livejournal.com
Скажи мне своими словами, что это была за случайная величина, которую прогнозировали-прогнозировали, а под конец померили.

Процент участия в выборах представителей категорий которые обычно не голосуют, но голосовали в 2008 за Обаму и, в меньшей степени, в 2012 за него же.

Date: 2012-11-14 05:23 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Очень близко.

Я бы сказал, что это вектор (распределение вероятностей по разным когортам, взгляды и численность которых можно было заранее предвидеть с гораздо большей точностью, чем позволяли опросы).

Date: 2012-11-14 06:09 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Не усложняйте, я вот выше (http://xaxam.livejournal.com/508032.html?thread=5870208#t5870208), воcпользовавшись идеей подкинутой [livejournal.com profile] sasha_br, получил результат очень близкий к результату Сильвера. Впрочем, нужно еще доказать, что рассчитанная им вероятность точнее моей. Для этого предлагаю повторять выборы столько раз, сколько понадобится для того, чтобы понять, чья оценка вероятности точнее
Edited Date: 2012-11-14 06:09 pm (UTC)

Date: 2012-11-14 06:33 pm (UTC)
From: [identity profile] levrrr.livejournal.com
На самом деле никакой вектор по кагортам не нужен. Я думаю, они задают на опросах 3-5 вопросов, потом коррелируют (по результатат прошлых выборов) ответы на эти вопросы с вероятностью пойти проголосовать и с вероятностью не изменить своё мнение, за кого голосовать. Таким образом, по результату допроса каждого допрашиваемого они ставят не "за О" или "за Р", а число от -1 до +1

Date: 2012-11-14 03:31 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Все картинки уже были нарисованы задoлго до выборов (http://reverent.org/ru/99_procentov_za_obamu/)

Date: 2012-11-14 04:22 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Т.е., ловить за жопу надо было ещё в далёком 2008-м... Как всегда, хохом балайло...

Date: 2012-11-14 04:40 pm (UTC)
From: [identity profile] levrrr.livejournal.com
Вся беда в том, что республиканцы не читают научных статей, а Ромни даже правильными советниками себя окружить не умеет (http://avva.livejournal.com/2504962.html)

Date: 2012-11-14 04:58 pm (UTC)
From: [identity profile] dimpas.livejournal.com
ну да, организованные во Флориде красными очереди на враждебных избирательных участках, например, действительно, мухлеж...

Date: 2012-11-14 05:15 pm (UTC)
From: [identity profile] sasha-br.livejournal.com
Вот это, кстати, не факт - не уверен, что это формально запрещено законом.

Date: 2012-11-14 05:24 pm (UTC)
From: [identity profile] xaxam.livejournal.com
И это тоже. С соответствующим импакт-фактором, если позволишь.

Date: 2012-11-14 05:37 pm (UTC)
From: [identity profile] levrrr.livejournal.com
В спискe избирательных участков, нa которых Обама получил 99% голосов, куча мecт в Кливленде. Pазобраться издалека какие люди приписаны к конкретному участку - сложно. Но есть в спискe участки из никому неизвестного города Warrensville Heights (http://en.wikipedia.org/wiki/Warrensville_Heights,_Ohio). Pасовый состав этого города: белые - 10%, черные - 90%. Наверняка, на нескольких избирательных участках черных - 100%. Нет ничего удивительного, что на некоторых из них Обама получил 100%.

Date: 2012-11-14 03:02 pm (UTC)
From: [identity profile] burivykh.livejournal.com
Навскидку вспоминается этот пост (хотя это и не о статистике, да). И оттуда же — о реальности и о статистиках. Хотя всё это не ответ на заданный вопрос. :)

Date: 2012-11-14 03:11 pm (UTC)
From: [identity profile] xaxam.livejournal.com
Будем следить за Киреевым, спасибо!

У меня есть некоторое количество соображений относительно "статистики" и "статистических методов", в частности, разницы между предсказанием результатов выборов и измерением физических величин (я даже не про провербиальных Гаусса и Чурова (http://trurle.livejournal.com/1103030.html?thread=11101366#t11101366)).

Просто руки пока не доходят, может, кто другой поперёд батьки в пекло попрётся... ;-)

Date: 2012-11-14 05:01 pm (UTC)
From: [identity profile] 0durelli.livejournal.com
"Или надо Чурову писать? "
Не-не, не Чупрову, в Спортлото напишем! А то все пугают и пугают..

Date: 2012-11-14 07:36 pm (UTC)
From: [identity profile] pustoj-zhurnal.livejournal.com
Ну так уже прошлые президентские выборы в Америке были фальсифицированы (согласно известным методикам....)

http://zvezdochettt.livejournal.com/80215.html

Profile

xaxam: (Default)
xaxam

January 2026

S M T W T F S
     1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 23rd, 2026 02:30 am
Powered by Dreamwidth Studios