Научная электронная библиотека
Монографии, изданные в издательстве Российской Академии Естествознания

2.10.2. Оценка методом kn ближайших соседей

Одна из проблем, с которой сталкиваются при использовании метода парзеновского окна, заключается в выборе последовательности объемов ячеек V1, V2 ... Если V1 слишком мал, то большинство объемов будут пустыми, и оценка рn(x) будет ошибочной. Если V1 слишком велик, то из-за усреднения по объему ячейки могут быть потеряны важные пространственные отклонения от р(x). Кроме того, вполне может случиться, что объем ячейки, уместный для одного значения x, может совершенно не годиться для других случаев.

Один из возможных способов решения этой проблемы – сделать объем ячейки функцией данных, а не количества выборок. Например, чтобы оценить р(x) на основании n выборок, можно центрировать ячейку вокруг x и позволить ей расти до тех пор, пока она не вместит kn выборок, где kn есть некая определенная функция от n. Эти выборки будут kn ближайшими соседями x. Если плотность распределения вблизи x высокая, то ячейка будет относительно небольшой, что приводит к хорошему разрешению. Если плотность распределения невысокая, то ячейка возрастает, но рост приостанавливается вскоре после ее вступления в области более высокой плотности распределения. В любом случае, если мы берем

doros189.wmf (2.10.7)

мы хотим, чтобы kn стремилось к бесконечности при стремлении n к бесконечности, т.к. этот факт гарантирует, что kn/n будет хорошей оценкой вероятности попадания точки в ячейку объема Vn. Однако мы хотим также, чтобы kn росло достаточно медленно для того, чтобы размер ячейки, необходимый для вмещения kn выборок, сжался до нуля. Таким образом, из формулы (2.10.7) видно, что отношение kn/n должно стремиться к нулю.

Можно показать, что условия

doros190.wmf и doros191.wmf

являются необходимыми и достаточными для сходимости рn(x) и р(x) по вероятности во всех точках, где плотность р непрерывна.


Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074