Там у них верификация избирателей происходила через телефоны. Так вот, похоже, с номерами нехило помухлевали. Количество "красивых" номеров (заканчивающихся на три одинаковые цифры) аномально высоко (оно и понятно, если кто-то сидел и просто высасывал их из пальца - так фантазии нужно меньше):
...Мягко говоря, странные расхождения с теорией вероятности...
...Последние три цифры телефона - от 000 до 999, или 1000 разных вариантов.
Следовательно, при большом массиве данных наблюдаемая частота появления каждого варианта стремится к вероятности Р=1/1000, или 0,001. Существует стандартная процедура проверки гипотезы "Сравнение относительной частоты с гипотетической вероятностью появления события".
Проще говоря, при массиве данных=96215 верифицированных номеров среднее количество появления каждого варианта 3-х последних цифр номера телефона =96, разброс от 74 до 122 (правило 3 сигм). Если количество выходит за эти рамки, можно обоснованно предположить, что дело не обошлось без коррекции результатов.
Обнаружено, что верифицированные "красивые" номера имеют следующие U набл.:
PhoneNumber | К-во | U набл. |
...000 | 415 | 32.51575 |
...111 | 177 | 8.239988 |
...333 | 177 | 8.239988 |
...444 | 173 | 7.831992 |
...555 | 185 | 9.05598 |
...777 | 232 | 13.84993 |
...888 | 193 | 9.871972 |
...999 | 213 | 11.91195 |
Что явно больше U крит.=2,54 при двусторонней критической области и уровне значимости а=0,01. Проще говоря, налицо "ненормальность" в распределении номеров.
Но, собственно, мы и так ведь не питали на этот счёт иллюзий?