psilogic: (Default)
psilogic ([personal profile] psilogic) wrote2008-03-15 02:13 pm

Кто во что верит

Опрос ВЦИОМ, кажется, расставляет точки над "i" в вопросе, насколько православная у нас страна. Оказывается, примерно на столько же, насколько и атеистическая.

http://wciom.ru/arkhiv/tematicheskii-arkhiv/item/single/4448.html

Смотрите: в Бога верит чуть более половины. Но! Из них всего 10-20% верит в загробную жизнь и воздаяние за грехи. Вообще-то это постулат для христианства и ислама, вот эти 10-20% - и есть реальные верующие православные и мусульмане.

В то же время жестких атеистов, которые не верят ни в какую мистику - 15-18%. То есть, примерно столько же, сколько настоящих верующих.

Остальные верят во что попало :)

- по наводке [livejournal.com profile] as_merlin

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 05:04 pm (UTC)(link)
А вы проведите компьютерный эксперимент. Нагенетите 150 миллионов случайных чисел. Каждое число положите одну из ячеек. (пусть числа от 0 до 1)
1) 0-0.6
2) 0.6-0.7
3) 0.7-0.9
4) 0.9-0.99
5) 0.99-1
Выберите из своих чисел случайное подмножество из 150 тысяч. Повторите несколько раз и проверьте статистическую ошибку.

Re: кажется, расставляет точки?

[identity profile] magistral77.livejournal.com 2008-03-15 05:06 pm (UTC)(link)
1.Что за слово "Нагенетите"
2."Каждое число положите одну из ячеек" - как это сделать???:))
3.Как поживает Институт Белка?:)))

Re: кажется, расставляет точки?

[identity profile] psilogic.livejournal.com 2008-03-15 05:12 pm (UTC)(link)
1. нагенеРите
2. присваиванием
Келаврику: да он не программист, и не умеет проги писать :)

Re: кажется, расставляет точки?

[identity profile] magistral77.livejournal.com 2008-03-15 05:15 pm (UTC)(link)
Я и сам не программист и один хрен не представляю, что за способ
проведения "компьютерного эксперимента" он тут описал...

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 05:19 pm (UTC)(link)
У вас на компе Excel стоит? Если стоит, то могу написать в нём.
(Про умение писать на С не спрашиваю, иначе уже поняли бы)

на компе Excel стоит

[identity profile] magistral77.livejournal.com 2008-03-15 05:20 pm (UTC)(link)
Напиши

Re: на компе Excel стоит

[identity profile] kelavrik-0.livejournal.com 2008-03-15 06:11 pm (UTC)(link)
Ок. У меня он русифицированный, посему названия функций на русском. На деле жутко неудобно, но ради хелпа на русском терплю.

150 миллионов ячеек на один лист Excel'я не поместится, там всего 65536*256=16777216 или 16 миллионов. Посему придётся довольствоваться меньшим числом. А поскольку он требует слишком много ресурсов, если забить все ячейки, то предлагаю ограничиться миллионом чисел.

Итак в ячейки от H1 по GY5000 вставляем функцию: =СЛЧИС()
В ячейках A1-A5 числа: 1,2,3,4,5 Это наши категории.
В ячейке B1: =СЧЁТЕСЛИ($H$1:$GY$5000;"<0.6")/1000000
Это глобальная частота встречаемости чисел от 0 до 0.6.
В ячейке C1: =СЧЁТЕСЛИ($H$1:$GY$5;"<0.6")/1000
Это частота в рамках подборки, то есть тысячи чисел из генеральной совокупности.
Ну и в D1: =B1-C1
Это лишь разность между частотами.
Соответственно в
B2: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.7")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.6"))/1000000
C2: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.7")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.6"))/1000
D3: =B2-C2

B3: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.9")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.7"))/1000000
C3: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.9")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.7"))/1000
D3: =B3-C3

B4: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.99")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.9"))/1000000
C4: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.99")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.9"))/1000
D4: =B4-C4

B5: =СЧЁТЕСЛИ($H$1:$GY$5000;">0.99")/1000000
C5: =СЧЁТЕСЛИ($H$1:$GY$5;">0.99")/1000
D5: =B5-C5

После этого оцените разность между частотами в генеральной совокупности и в 1000 из неё.

Re: на компе Excel стоит

[identity profile] kelavrik-0.livejournal.com 2008-03-15 06:13 pm (UTC)(link)
Да, предупреждаю. Excel будет подолгу думать.

Re: на компе Excel стоит

[identity profile] kelavrik-0.livejournal.com 2008-03-15 06:40 pm (UTC)(link)
Да, у меня за 10 итераций отклонение частот генеральной совокупности от частот локальной (1000 представителей) ни разу не превысило 3% (0.03). Вот вам и статистическая ошибка.

Re: кажется, расставляет точки?

[identity profile] psilogic.livejournal.com 2008-03-15 06:59 pm (UTC)(link)
он предложит смоделировать. можно и без программирования, на чистой математике: погугли "доверительный интервал"

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 07:09 pm (UTC)(link)
Можно :) Но эксперимент нагляднее :)

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 05:16 pm (UTC)(link)
Похоже на то. А вообще меня давно тянет написать заметку о достоверности статистических оценок вообще и полученных в результате опроса в частности. Слишком обрыдло утверждение о лжи, большой лжи и статистике.

[identity profile] psilogic.livejournal.com 2008-03-15 07:00 pm (UTC)(link)
мне тоже. но я не потяну, теорвер подзабыл

[identity profile] kelavrik-0.livejournal.com 2008-03-15 07:07 pm (UTC)(link)
Да там всё банально. Пусть некая величина представляет сумму двух случайных величин. Среднее равно сумме средних, а дисперсия сумме дисперсий:
s2=s21+s22. Из неё всё и выводится.

[identity profile] nefedor.livejournal.com 2008-03-16 05:33 am (UTC)(link)
И как оно дальше выводится? Одно распределение считается нормальным и откладываются три сигмы?

И как оно дальше выводится?

[identity profile] kelavrik-0.livejournal.com 2008-03-16 12:20 pm (UTC)(link)
Ну да, распределение считается нормальным (по центральной предельной теореме и здесь легко доказать её применимость) и в зависимости от уровня значимости откладываются сигмы.
1s -- ~66% достоверности.
2s -- ~96% достоверности.
3s -- ~99.5% достоверности.

Цифры по памяти, лучше уточнить по справочнику.

Re: И как оно дальше выводится?

[identity profile] nefedor.livejournal.com 2008-03-17 01:08 am (UTC)(link)
Ну, если нормальное, то понятно что просто. Но оно нормальное типа в пределе, а в реальности хотя и близко но не совсем - этим пренебрегаем?

Re: И как оно дальше выводится?

[identity profile] kelavrik-0.livejournal.com 2008-03-17 01:29 am (UTC)(link)
Да это даёт такую копеешную погрешность.
Да, поскольку у нас выборочная дисперсия и среднее вместо истинных, то правильно пользовать Стьюдента. Но по мне если количество человек в группе больше пятидесяти, то разницы никакой.

Re: И как оно дальше выводится?

[identity profile] nefedor.livejournal.com 2008-03-17 01:49 am (UTC)(link)
Вот Стьюдент вызывает как-то больше доверия :)
Но разница действительно будет несерьезной, это правда, так что можно пренебречь. Договорились :)

Без справочника на память:

[identity profile] nefedor.livejournal.com 2008-03-17 01:09 am (UTC)(link)
1s ~ 67%
2s ~ 95%
3s ~ 99%
4s ~ 99.9%.

Re: Без справочника на память:

[identity profile] kelavrik-0.livejournal.com 2008-03-17 01:25 am (UTC)(link)
Полез таки в справочник :)
1s -- 68.27%
2s -- 95.45%
3s -- 99.73%
4s -- 99.9937%
5s -- 99.999942%

Re: Без справочника на память:

[identity profile] nefedor.livejournal.com 2008-03-17 01:47 am (UTC)(link)
О, я почти попал :)

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 05:14 pm (UTC)(link)
Очень просто, если попадает в диапазон от 0 до 0.6, то в первую ячейку и тд.

Re: кажется, расставляет точки?

[identity profile] magistral77.livejournal.com 2008-03-15 05:17 pm (UTC)(link)
Позвони мне лучше на Скайп и объясни. Я один хрен не понял ничего.
Из твоих лаконичных намёков.

Re: кажется, расставляет точки?

[identity profile] kelavrik-0.livejournal.com 2008-03-15 05:21 pm (UTC)(link)
У меня скайпа нет, а по межгороду звонить лень.
Алгоритм банальный и я его описал полностью. Если не понял на таком уровне, то сори...