psilogic: (Default)
psilogic ([personal profile] psilogic) wrote2008-09-22 09:55 pm

Глупый вопрос

Зверски туплю, но вдруг кто помнит:
- почему в формуле дисперсии сумму делят то на N, то на N - 1 и как правильнее?

[identity profile] agasfer.livejournal.com 2008-09-22 05:59 pm (UTC)(link)
делят на N, чтоб получить стандартную ошибку, делят на N-1 чтоб получить стандартное отклонение.

Погуглите на stsndard error и standard deviation, все станет ясно.

[identity profile] dzhin-dzhit.livejournal.com 2008-09-22 06:06 pm (UTC)(link)
В дисперсии чего? При биометрическом анализе? "выцарапывается из склероза"

(Anonymous) 2008-09-22 06:34 pm (UTC)(link)
agasfer пиздит

На n-1 сумму квадратов отклонений делят, чтобы получить несмещенную оценку дисперсии, а на n - чтобы получить эффективную оценку дисперсии (=оценку максимального правдоподобия второго параметра нормального закона).

В практических формулах похуй, на что делить.

А стандартное отклонение получается взятием корня из оценки дисперсии.

terrible_volk

[identity profile] kelavrik-0.livejournal.com 2008-09-22 07:50 pm (UTC)(link)
Если у тебя среднее взято из выборки, то правильно делить на N-1. Если среднее берётся из теоретических соображений (точнее априорно), то надо делить на N.

А вообще, всё это фигня. Если у тебя сотня точек, то без разницы на что делить. И вообще, среднее квадратичное отклонение обычно используют для оценки ошибок. Но допущения при этой оценке много грубее разницы между 1/N и 1/(N+1)

В формуле расчёта дисперсии используется...

[identity profile] sanitareugen.livejournal.com 2008-09-23 06:55 am (UTC)(link)
...значение матожидания случайной величины. Если оно нам известно, то делить надо на N. Однако на практике мы его обычно не знаем, и заменяем средним по данной выборке. Очевидно, это приводит к занижению суммы квадратов по сравнению с использованием истинного значения МО.
Пример: истинное МО=0, случайные величины (-1; 1; 3), их среднее=1.
Сумма квадратов относительно МО есть 1+1+9=11, относительно среднего - 2+0+4=8
Требуя, чтобы матожидание оценки дисперсии было равно истинной дисперсии (т.е. чтобы оценка была "несмещённой"), получаем поправочный множитель N/(N-1) или, упрощая формулу - "делим на N-1".
Т.е. на N-1 надо делить всегда, когда используем не истинное (или полученное независимой от данной выборки оценкой) матожидание, а его оценку по данной выборке.
Надо отметить, что можно требовать не несмещённости, а выполнения других критериев. Например, критерий "максимального правдоподобия" и при среднем даёт делитель N, а "минимума квадратичной ошибки" и вообще приводит к использованию (N+1). Однако они менее употребительны.