psilogic: (Default)
psilogic ([personal profile] psilogic) wrote2008-09-22 09:55 pm

Глупый вопрос

Зверски туплю, но вдруг кто помнит:
- почему в формуле дисперсии сумму делят то на N, то на N - 1 и как правильнее?

В формуле расчёта дисперсии используется...

[identity profile] sanitareugen.livejournal.com 2008-09-23 06:55 am (UTC)(link)
...значение матожидания случайной величины. Если оно нам известно, то делить надо на N. Однако на практике мы его обычно не знаем, и заменяем средним по данной выборке. Очевидно, это приводит к занижению суммы квадратов по сравнению с использованием истинного значения МО.
Пример: истинное МО=0, случайные величины (-1; 1; 3), их среднее=1.
Сумма квадратов относительно МО есть 1+1+9=11, относительно среднего - 2+0+4=8
Требуя, чтобы матожидание оценки дисперсии было равно истинной дисперсии (т.е. чтобы оценка была "несмещённой"), получаем поправочный множитель N/(N-1) или, упрощая формулу - "делим на N-1".
Т.е. на N-1 надо делить всегда, когда используем не истинное (или полученное независимой от данной выборки оценкой) матожидание, а его оценку по данной выборке.
Надо отметить, что можно требовать не несмещённости, а выполнения других критериев. Например, критерий "максимального правдоподобия" и при среднем даёт делитель N, а "минимума квадратичной ошибки" и вообще приводит к использованию (N+1). Однако они менее употребительны.

Очепятка:

[identity profile] sanitareugen.livejournal.com 2008-09-23 06:56 am (UTC)(link)
Вместо
2+0+4=8 следует читать 4+0+4=8

Re: В формуле расчёта дисперсии используется...

[identity profile] psilogic.livejournal.com 2008-09-23 07:52 am (UTC)(link)
Замечательное объяснение. :)

Re: В формуле расчёта дисперсии используется...

[identity profile] termometr.livejournal.com 2008-09-23 04:49 pm (UTC)(link)
главное - правильное