单选题

已知某文档包含5个字符。每个字符出现的频率如下表所示。采用霍夫曼编码对该文档压缩存储,则单词“cade”的编码为(     ),文档的压缩比为(     )。

字符 a b c d e
频率(%) 40 10 20 16 14
单选题
【正确答案】 A
【答案解析】

根据题干,可以先构造出如下哈弗曼树:

 

对应c的编码111,a的编码0,d的编码110,e的编码101。

单选题
【正确答案】 C
【答案解析】

压缩前,若要表示5个不同的字符,用二进制编码至少需要3位二进制,即每位字符占据空间3bit,平均字符长度为3*40%+3*10%+3*20%+3*16%+3*14%=3。
压缩后,这5个字符的编码长度分别为1、3、3、3、3,平均编码长度为1*40%+3*10%+3*20%+3*16%+3*14%=2.2。
压缩比为(3.3-2.2)/3.3=27%。