psilogic: (Default)
[personal profile] psilogic
Опрос ВЦИОМ, кажется, расставляет точки над "i" в вопросе, насколько православная у нас страна. Оказывается, примерно на столько же, насколько и атеистическая.

http://wciom.ru/arkhiv/tematicheskii-arkhiv/item/single/4448.html

Смотрите: в Бога верит чуть более половины. Но! Из них всего 10-20% верит в загробную жизнь и воздаяние за грехи. Вообще-то это постулат для христианства и ислама, вот эти 10-20% - и есть реальные верующие православные и мусульмане.

В то же время жестких атеистов, которые не верят ни в какую мистику - 15-18%. То есть, примерно столько же, сколько настоящих верующих.

Остальные верят во что попало :)

- по наводке [livejournal.com profile] as_merlin
From: [identity profile] kelavrik-0.livejournal.com
А вы проведите компьютерный эксперимент. Нагенетите 150 миллионов случайных чисел. Каждое число положите одну из ячеек. (пусть числа от 0 до 1)
1) 0-0.6
2) 0.6-0.7
3) 0.7-0.9
4) 0.9-0.99
5) 0.99-1
Выберите из своих чисел случайное подмножество из 150 тысяч. Повторите несколько раз и проверьте статистическую ошибку.
From: [identity profile] magistral77.livejournal.com
1.Что за слово "Нагенетите"
2."Каждое число положите одну из ячеек" - как это сделать???:))
3.Как поживает Институт Белка?:)))
From: [identity profile] psilogic.livejournal.com
1. нагенеРите
2. присваиванием
Келаврику: да он не программист, и не умеет проги писать :)
From: [identity profile] magistral77.livejournal.com
Я и сам не программист и один хрен не представляю, что за способ
проведения "компьютерного эксперимента" он тут описал...
From: [identity profile] kelavrik-0.livejournal.com
У вас на компе Excel стоит? Если стоит, то могу написать в нём.
(Про умение писать на С не спрашиваю, иначе уже поняли бы)

Re: на компе Excel стоит

Date: 2008-03-15 06:11 pm (UTC)
From: [identity profile] kelavrik-0.livejournal.com
Ок. У меня он русифицированный, посему названия функций на русском. На деле жутко неудобно, но ради хелпа на русском терплю.

150 миллионов ячеек на один лист Excel'я не поместится, там всего 65536*256=16777216 или 16 миллионов. Посему придётся довольствоваться меньшим числом. А поскольку он требует слишком много ресурсов, если забить все ячейки, то предлагаю ограничиться миллионом чисел.

Итак в ячейки от H1 по GY5000 вставляем функцию: =СЛЧИС()
В ячейках A1-A5 числа: 1,2,3,4,5 Это наши категории.
В ячейке B1: =СЧЁТЕСЛИ($H$1:$GY$5000;"<0.6")/1000000
Это глобальная частота встречаемости чисел от 0 до 0.6.
В ячейке C1: =СЧЁТЕСЛИ($H$1:$GY$5;"<0.6")/1000
Это частота в рамках подборки, то есть тысячи чисел из генеральной совокупности.
Ну и в D1: =B1-C1
Это лишь разность между частотами.
Соответственно в
B2: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.7")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.6"))/1000000
C2: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.7")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.6"))/1000
D3: =B2-C2

B3: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.9")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.7"))/1000000
C3: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.9")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.7"))/1000
D3: =B3-C3

B4: =(СЧЁТЕСЛИ($H$1:$GY$5000;"<0.99")-СЧЁТЕСЛИ($H$1:$GY$5000;"<0.9"))/1000000
C4: =(СЧЁТЕСЛИ($H$1:$GY$5;"<0.99")-СЧЁТЕСЛИ($H$1:$GY$5;"<0.9"))/1000
D4: =B4-C4

B5: =СЧЁТЕСЛИ($H$1:$GY$5000;">0.99")/1000000
C5: =СЧЁТЕСЛИ($H$1:$GY$5;">0.99")/1000
D5: =B5-C5

После этого оцените разность между частотами в генеральной совокупности и в 1000 из неё.

Re: на компе Excel стоит

Date: 2008-03-15 06:13 pm (UTC)
From: [identity profile] kelavrik-0.livejournal.com
Да, предупреждаю. Excel будет подолгу думать.

Re: на компе Excel стоит

Date: 2008-03-15 06:40 pm (UTC)
From: [identity profile] kelavrik-0.livejournal.com
Да, у меня за 10 итераций отклонение частот генеральной совокупности от частот локальной (1000 представителей) ни разу не превысило 3% (0.03). Вот вам и статистическая ошибка.
From: [identity profile] psilogic.livejournal.com
он предложит смоделировать. можно и без программирования, на чистой математике: погугли "доверительный интервал"
From: [identity profile] kelavrik-0.livejournal.com
Можно :) Но эксперимент нагляднее :)
From: [identity profile] kelavrik-0.livejournal.com
Похоже на то. А вообще меня давно тянет написать заметку о достоверности статистических оценок вообще и полученных в результате опроса в частности. Слишком обрыдло утверждение о лжи, большой лжи и статистике.

Date: 2008-03-15 07:00 pm (UTC)
From: [identity profile] psilogic.livejournal.com
мне тоже. но я не потяну, теорвер подзабыл

Date: 2008-03-15 07:07 pm (UTC)
From: [identity profile] kelavrik-0.livejournal.com
Да там всё банально. Пусть некая величина представляет сумму двух случайных величин. Среднее равно сумме средних, а дисперсия сумме дисперсий:
s2=s21+s22. Из неё всё и выводится.

Date: 2008-03-16 05:33 am (UTC)
From: [identity profile] nefedor.livejournal.com
И как оно дальше выводится? Одно распределение считается нормальным и откладываются три сигмы?
From: [identity profile] kelavrik-0.livejournal.com
Ну да, распределение считается нормальным (по центральной предельной теореме и здесь легко доказать её применимость) и в зависимости от уровня значимости откладываются сигмы.
1s -- ~66% достоверности.
2s -- ~96% достоверности.
3s -- ~99.5% достоверности.

Цифры по памяти, лучше уточнить по справочнику.
From: [identity profile] nefedor.livejournal.com
Ну, если нормальное, то понятно что просто. Но оно нормальное типа в пределе, а в реальности хотя и близко но не совсем - этим пренебрегаем?
From: [identity profile] kelavrik-0.livejournal.com
Да это даёт такую копеешную погрешность.
Да, поскольку у нас выборочная дисперсия и среднее вместо истинных, то правильно пользовать Стьюдента. Но по мне если количество человек в группе больше пятидесяти, то разницы никакой.
From: [identity profile] nefedor.livejournal.com
Вот Стьюдент вызывает как-то больше доверия :)
Но разница действительно будет несерьезной, это правда, так что можно пренебречь. Договорились :)
From: [identity profile] kelavrik-0.livejournal.com
Полез таки в справочник :)
1s -- 68.27%
2s -- 95.45%
3s -- 99.73%
4s -- 99.9937%
5s -- 99.999942%
From: [identity profile] nefedor.livejournal.com
О, я почти попал :)
From: [identity profile] kelavrik-0.livejournal.com
Очень просто, если попадает в диапазон от 0 до 0.6, то в первую ячейку и тд.
From: [identity profile] magistral77.livejournal.com
Позвони мне лучше на Скайп и объясни. Я один хрен не понял ничего.
Из твоих лаконичных намёков.
From: [identity profile] kelavrik-0.livejournal.com
У меня скайпа нет, а по межгороду звонить лень.
Алгоритм банальный и я его описал полностью. Если не понял на таком уровне, то сори...
Page generated Aug. 30th, 2025 10:23 pm
Powered by Dreamwidth Studios