简答题

直方图是对数据进行描述分析的一种常用方法, 其实质可以看作对数据分布密度的估计, 试根据你对直方图方法的理解, 简述直方图作为数据分布密度估计的不足之处。

【正确答案】

(1) 我对直方图方法的理解
直方图密度估计是较为传统的非参密度估计方法, 通常的做法: ①将数据值覆盖的数据区间分成几个等子区间(bin) ; ②一个数据值落到这个相应的子区间,这个子区间块的高度就相应的加一个单位的高度。
(2) 直方图作为数据分布密度估计的不足之处
利用直方图估计密度函数还是有不完美的地方: ①密度函数是不平滑的; ②密度函数受子区间宽度影响很大, 若宽度取0.5, 5等构造出的密度函数显然与宽度取2的有很大差异; ③当数据维数是1, 2维情况下, 直方图的使用是很普遍的, 但是在数据维数再增加时, 这种方法有局限性。

【答案解析】