Next: , Previous: Пакет distrib, Up: Пакет distrib   [Contents][Index]

45.1 Введение в пакет distrib

Пакет distrib включает набор функций для вероятностных вычислений с дискретными и непрерывными распределениями одной переменной.

Далее следует краткий обзор основных понятий по вероятностным распределениям.

Пусть f(x) есть функция плотности вероятности непрерывной случайной величины X. Тогда функция распределения определяется как

                       x
                      /
                      [
               F(x) = I     f(u) du
                      ]
                      /
                       minf

что равно вероятности Pr(X <= x)

Среднее значение характеризует локализацию и определено как

                     inf
                    /
                    [
           E[X]  =  I   x f(x) dx
                    ]
                    /
                     minf

Дисперсия характеризует изменчивость распределения

                 inf
                /
                [                    2
         V[X] = I     f(x) (x - E[X])  dx
                ]
                /
                 minf

что есть положительное вещественное число. Квадратный корень дисперсии называется стандартным отклонением, D[X]=sqrt(V[X]), и является иной мерой изменчивости.

Коэффициент асимметрии является мерой асимметрии распределения

                 inf
                /
            1   [                    3
  SK[X] = ----- I     f(x) (x - E[X])  dx
              3 ]
          D[X]  /
                 minf

Коэффициент куртозиса является мерой остроты распределения

                 inf
                /
            1   [                    4
  KU[X] = ----- I     f(x) (x - E[X])  dx - 3
              4 ]
          D[X]  /
                 minf

Если случайная величина X гауссова, то KU[X]=0. Фактически, коэффициенты асимметрии и куртозиса являются параметрами формы и измеряют степень не-гауссовости распределения.

Если случайная переменная X является дискретной, то плотность, или вероятность, f(x) принимает положительные значения на некотором счетном множестве чисел x_i, и равна нулю в противном случае. В этом случае функция распределения есть

                       ====
                       \
                F(x) =  >    f(x )
                       /        i
                       ====
                      x <= x
                       i

А среднее, дисперсия, стандартное отклонение, коэффициенты асимметрии и куртозиса имеют вид

                       ====
                       \
                E[X] =  >  x  f(x ) ,
                       /    i    i
                       ====
                        x 
                         i
                ====
                \                     2
        V[X] =   >    f(x ) (x - E[X])  ,
                /        i    i
                ====
                 x
                  i
               D[X] = sqrt(V[X]),
                     ====
              1      \                     3
  SK[X] =  -------    >    f(x ) (x - E[X])  
           D[X]^3    /        i    i
                     ====
                      x
                       i

и

                     ====
              1      \                     4
  KU[X] =  -------    >    f(x ) (x - E[X])   - 3 ,
           D[X]^4    /        i    i
                     ====
                      x
                       i

соответственно.

Пакет distrib включает функции для моделирования случайных переменных. Некоторые из этих функций используют управляющие переменные, указывающие используемый алгоритм. В большинстве случаев реализован общий метод обращения, который основан на факте, что если u случайная величина с равномерным распределением в интервале (0,1), то F^(-1)(u) есть случайная величина с распределением F. Этот метод недостаточно эффективен с точки зрения времени вычисления, но полезен для сравнения с другими алгоритмами. В этом примере сравнивается производительность алгоритмов ahrens_cheng и inverse при вычислении гистограмм для Хи-квадрат случайной переменной:

(%i1) load("distrib")$
(%i2) load("descriptive")$
(%i3) showtime: true$
Evaluation took 0.00 seconds (0.00 elapsed) using 32 bytes.
(%i4) random_chi2_algorithm: 'ahrens_cheng$
                                       histogram(random_chi2(10,500))$
Evaluation took 0.00 seconds (0.00 elapsed) using 40 bytes.
Evaluation took 0.69 seconds (0.71 elapsed) using 5.694 MB.
(%i6) random_chi2_algorithm: 'inverse$ histogram(random_chi2(10,500))$
Evaluation took 0.00 seconds (0.00 elapsed) using 32 bytes.
Evaluation took 10.15 seconds (10.17 elapsed) using 322.098 MB.

Для визуального сравнения алгоритмов для дискретных переменных можно использовать функцию barsplot пакета descriptive.

Заметим, что еще требуется проделать некоторую работу, поскольку данные модельные распределения еще не проверены более строгими оценками качества совпадения.

За более детальной информацией по поводу данных математических объектов, пожалуйста, обратитесь к любому вводному руководству по вероятности и статистике.

Имена функций пакета distrib следуют определенному соглашению. Каждое имя состоит из двух частей – первая определяет функцию или параметр, которое необходимо вычислить.

Функции:
   Плотность вероятности           (pdf_*)
   Распределение                   (cdf_*)
   Квантиль                        (quantile_*)
   Среднее значение                (mean_*)
   Дисперсия                       (var_*)
   Стандартное отклонение          (std_*)
   Коэффициент асимметрии          (skewness_*)
   Коэффициент куртозиса           (kurtosis_*)
   Случайная переменная (variate)  (random_*)

Вторая часть определяет тип распределения.

Непрерывные распределения:
   Нормальное                  (*normal)
   Стьюдента                   (*student_t)
   Хи-квадрат                  (*chi2)
   F                           (*f)
   Экспоненциальное            (*exp)
   Логнормальное               (*lognormal)
   Гамма                       (*gamma)
   Бета                        (*beta)
   Равномерное неприрывное     (*continuous_uniform)
   Логистическое               (*logistic)
   Парето                      (*pareto)
   Вейбулла                    (*weibull)
   Релея                       (*rayleigh)
   Лапласа                     (*laplace)
   Коши                        (*cauchy)
   Гумбеля                     (*gumbel)

Дискретные распределения:
   Биномиальное                (*binomial)
   Пуассона                    (*poisson)
   Бернулли                    (*bernoulli)
   Геометрическое              (*geometric)
   Равномерное дискретное      (*discrete_uniform)
   Гипергеометрическое         (*hypergeometric)
   Отрицательное биномиальное  (*negative_binomial)

Например, pdf_student_t(x,n) – плотность распределения Стьюдента с n степенями свободы, std_pareto(a,b) – стандартное отклонение распределения Парето с параметрами a и b, и kurtosis_poisson(m) – коэффициент куртозиса распределения Пуассона со средним m.

Для использования пакет distrib необходимо загрузить командой

(%i1) load("distrib")$

Для комментариев, сообщений об ошибках и предложений обращайтесь к автору пакета по адресу ’mario AT edu DOT xunta DOT es’.


Next: , Previous: Пакет distrib, Up: Пакет distrib   [Contents][Index]