Одна из проблем, с которой сталкиваются при использовании метода парзеновского окна, заключается в выборе последовательности объемов ячеек V1, V2 ... Если V1 слишком мал, то большинство объемов будут пустыми, и оценка рn(x) будет ошибочной. Если V1 слишком велик, то из-за усреднения по объему ячейки могут быть потеряны важные пространственные отклонения от р(x). Кроме того, вполне может случиться, что объем ячейки, уместный для одного значения x, может совершенно не годиться для других случаев.
Один из возможных способов решения этой проблемы – сделать объем ячейки функцией данных, а не количества выборок. Например, чтобы оценить р(x) на основании n выборок, можно центрировать ячейку вокруг x и позволить ей расти до тех пор, пока она не вместит kn выборок, где kn есть некая определенная функция от n. Эти выборки будут kn ближайшими соседями x. Если плотность распределения вблизи x высокая, то ячейка будет относительно небольшой, что приводит к хорошему разрешению. Если плотность распределения невысокая, то ячейка возрастает, но рост приостанавливается вскоре после ее вступления в области более высокой плотности распределения. В любом случае, если мы берем
(2.10.7)
мы хотим, чтобы kn стремилось к бесконечности при стремлении n к бесконечности, т.к. этот факт гарантирует, что kn/n будет хорошей оценкой вероятности попадания точки в ячейку объема Vn. Однако мы хотим также, чтобы kn росло достаточно медленно для того, чтобы размер ячейки, необходимый для вмещения kn выборок, сжался до нуля. Таким образом, из формулы (2.10.7) видно, что отношение kn/n должно стремиться к нулю.
Можно показать, что условия
и
являются необходимыми и достаточными для сходимости рn(x) и р(x) по вероятности во всех точках, где плотность р непрерывна.