已知某文档包含5个字符。每个字符出现的频率如下表所示。采用霍夫曼编码对该文档压缩存储,则单词“cade”的编码为( ),文档的压缩比为( )。
| 字符 | a | b | c | d | e |
| 频率(%) | 40 | 10 | 20 | 16 | 14 |
根据题干,可以先构造出如下哈弗曼树:

对应c的编码111,a的编码0,d的编码110,e的编码101。
压缩前,若要表示5个不同的字符,用二进制编码至少需要3位二进制,即每位字符占据空间3bit,平均字符长度为3*40%+3*10%+3*20%+3*16%+3*14%=3。
压缩后,这5个字符的编码长度分别为1、3、3、3、3,平均编码长度为1*40%+3*10%+3*20%+3*16%+3*14%=2.2。
压缩比为(3.3-2.2)/3.3=27%。