还剩13页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
北邮数据结构实验报告北京邮电大学信息与通信工程学院xx级数据结构实验报告实验名称实验三哈夫曼编/解码器的实现学生姓名陈聪捷日期xx年11月28日
1.实验要求
一、实验目的了解哈夫曼树的思想和相关概念;
二、实验内容利用二叉树结构实现哈夫曼编/解码器
1.初始化能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立哈夫曼树
2.建立编码表利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出
3.编码根据编码表对输入的字符串进行编码,并将编码后的字符串输出
4.译码利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果
5.打印以直观的方式打印哈夫曼树
6.计算输入的字符串编码前和编码后的长度,并进行分析,讨论哈夫曼编码的压缩效果
7.用户界面可以设计成“菜单”方式,能进行交互,根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码
2.程序分析
2.1存储结构二叉树templateclassBiTree{public:BiTree;//构造函数,其前序序列由键盘输入~BiTreevoid;//析构函数BiNode*Getroot;//获得指向根结点的指针protected:BiNode*root;//指向根结点的头指针};//声明类BiTree及定义结构BiNodeData二叉树是由一个根结点和两棵互不相交的左右子树构成data:HCode*HCodeTable;//编码表inttSize;//编码表中的总字符数二叉树的节点结构templatestructBiNode//二叉树的结点结构{Tdata;//记录数据Tlchild;//左孩子Trchild;//右孩子Tparent;//双亲};编码表的节点结构structHCode{chardata;//编码表中的字符charcode
[100];//该字符对应的编码};待编码字符串由键盘输入,输入时用链表存储,链表节点为structNode{charcharacter;//输入的字符unsignedintcount;//该字符的权值boolused;//建立树的时候该字符是否使用过Node*next;//保存下一个节点的地址};示意图
2.2关键算法分析
1.初始化函数voidHuffmanTree::InitstringInput算法伪代码
1.初始化链表的头结点
2.获得输入字符串的第一个字符,并将其插入到链表尾部n=1n记录的是链表中字符的个数
3.从字符串第2个字符开始,逐个取出字符串中的字符
3.1将当前取出的字符与链表中已经存在的字符逐个比拟,如果当前取出的字符与链表中已经存在的某个字符相同,那么链表中该字符的权值加
13.2如果当前取出的字符与链表中已经存在的字符都不相同,那么将其参加到链表尾部,同时n++
4.tSize=ntSize记录链表中字符总数,即哈夫曼树中叶子节点总数
5.创立哈夫曼树
6.销毁链表源代码voidHuffmanTree::InitstringInput{Node*front=newNode;//初始化链表的头结点if!frontthrowexception堆空间用尽;front-next=NULL;front-character=NULL;front-count=0;Node*pfront=front;charch=Input
[0];//获得第一个字符Node*New1=newNode;if!New1throwexception堆空间用尽;New1-character=ch;//将第一个字符插入链表New1-count=1;New1-next=pfront-next;pfront-next=New1;boolreplace=0;//判断在已经写入链表的字符中是否有与当前读出的字符相同的字符intn=1;//统计链表中字符个数forinti=1;i{ch=Input[i];//获得第i个字符do{pfront=pfront-next;ifintpfront-character==intch//如果在链表中有与当前字符相同的字符,该字符权值加1{pfront-count++;replace=1;break;}}whilepfront-next;if!replace//如果在链表中没找到与当前字符相同的字符,那么将该字符作为新成员插入链表{Node*New=newNode;if!Newthrowexception堆空间用尽;New-character=ch;New-count=1;New-next=pfront-next;pfront-next=New;n++;}pfront=front;//重置pfront和replace变量为默认值replace=0;}tSize=n;//tSize记录的是编码表中字符个数CreateHTreefrontn;//创立哈夫曼树pfront=front;whilepfront//销毁整个链表{front=pfront;pfront=pfront-next;front;}时间复杂度假设输入的字符串长度为n,那么时间复杂度为On
2.创立哈夫曼树voidHuffmanTree::CreateCodeTableNode*p算法伪代码
1.创立一个长度为2*tSize-1的三叉链表
2.将存储字符及其权值的链表中的字符逐个写入三叉链表的前tSize个结点的data域,并将对应结点的孩子域和双亲域赋为空
3.从三叉链表的第tSize个结点开始,i=tSize
3.1从存储字符及其权值的链表中取出两个权值最小的结点xy,记录其下标xy
3.2将下标为x和y的哈夫曼树的结点的双亲设置为第i个结点
3.3将下标为x的结点设置为i结点的左孩子,将下标为y的结点设置为i结点的右孩子,i结点的权值为x结点的权值加上y结点的权值,i结点的双亲设置为空
4.根据哈夫曼树创立编码表源代码voidHuffmanTree::CreateHTreeNode*pintn{root=newBiNode[2*n-1];//初始化哈夫曼树Node*front=p-next;ifn==0throwexception没有输入字符;forinti=0;iroot[i].data=front-count;root[i].lchild=-1;root[i].rchild=-1;root[i].parent=-1;front=front-next;}front=p;intNew1New2;fori=n;i2*n-1;i++{SelectMinNew1New20i;//从0~i中选出两个权值最小的结点root[New1].parent=root[New2].parent=i;//用两个权值最小的结点生成新结点,新节点为其双亲root[i].data=root[New1].data+root[New2].data;//新结点的权值为其孩子的权值的和root[i].lchild=New1;root[i].rchild=New2;root[i].parent=-1;}CreateCodeTablep;//创立编码表}时间复杂度在选取两个权值最小的结点的函数中要遍历链表,时间复杂度为On故该函数的时间复杂度为On^
23.创立编码表voidHuffmanTree::CreateCodeTableNode*p算法伪代码
1.初始化编码表
2.初始化一个指针,从链表的头结点开始,遍历整个链表
2.1将链表中指针当前所指的结点包含的字符写入编码表中
2.2得到该结点对应的哈夫曼树的叶子结点及其双亲
2.3如果哈夫曼树只有一个叶子结点,将其字符对应编码设置为
02.4如果不止一个叶子结点,从当前叶子结点开始判断
2.
4.1如果当前叶子结点是其双亲的左孩子,那么其对应的编码为0,否那么为
12.
4.2child指针指向叶子结点的双亲,parent指针指向child指针的双亲,重复
2.
4.1的操作
2.5将已完成的编码倒序
2.6取得链表中的下一个字符
3.输出编码表源代码voidHuffmanTree::CreateCodeTableNode*p{HCodeTable=newHCode[tSize];//初始化编码表Node*front=p-next;forinti=0;i{HCodeTable[i].data=front-character;//将第i个字符写入编码表intchild=i;//得到第i个字符对应的叶子节点intparent=root[i].parent;//得到第i个字符对应的叶子节点的双亲intk=0;iftSize==1//如果文本中只有一种字符,它的编码为0{HCodeTable[i].code[k]=0;k++;}whileparent!=-1//从第i个字符对应的叶子节点开始,寻找它到根结点的路径{ifchild==root[parent].lchild//如果当前结点为双亲的左孩子,那么编码为0,否那么编码为1HCodeTable[i].code[k]=0;elseHCodeTable[i].code[k]=1;k++;child=parent;parent=root[child].parent;}HCodeTable[i].code[k]=;ReverseHCodeTable[i].code;//将编码逆置front=front-next;//得到下一个字符}cout编码表为fori=0;i{coutparent=root[parent].lchild;else//编码为1那么寻找右孩子parent=root[parent].rchild;i++;}iftSize==1//如果编码表只有一个字符,那么根结点即为叶子结点i++;d.append1HCodeTable[parent].data;//将叶子节点对应的字符追加到解码串中}cout}时间复杂度设待解码串长度为n,那么复杂度为On
8.计算哈夫曼编码的压缩比voidHuffmanTree::Calculatestrings1strings2算法伪代码
1.获得编码前字符串的长度,即其占用的字节数
2.获得编码后的字符串的长度,将其除以8然后向上取整,得到其占用的字节数
3.压缩比将两个相除源代码voidHuffmanTree::Calculatestrings1strings2{intcal1=s
1.length;intcal2=s
2.length;cal2=ceillfloatcal2/8;//将编码串的比特数转化为字节数cout编码前的字符串长度cout编码后的字符串长度cout压缩比为doublecal2/doublecal1*100%}时间复杂度O
19.打印哈夫曼树voidHuffmanTree::PrintTreeintTreeNodeintlayer算法伪代码
1.如果待打印结点为空,那么返回
2.递归调用函数打印当前结点的右子树
3.根据当前结点所在的层次确定其前面要输出多少空格,先输出空格,在打印当前结点的权值
4.递归调用函数打印当前结点的左子树源代码voidHuffmanTree::PrintTreeintTreeNodeintlayer{ifTreeNode==-1//如果待打印结点为空,那么返回return;else{PrintTreeroot[TreeNode].rchildlayer+1;//先打印该结点的右子树,layer记录的是该结点所在的层次forinti=0;i空格cout;coutPrintTreeroot[TreeNode].lchildlayer+1;//打印该结点的左子树}}时间复杂度中序遍历哈夫曼树,复杂度为On
10.菜单函数voidHuffmanTree::Menu算法伪代码
1.逐一读取键盘缓存区中的字符,并将它们逐一追加到记录输入字符串的string变量中,直到读到回车输入符为止
2.删除string变量末尾的回车输入符
3.利用string变量创立哈夫曼树,初始化编码表
4.直观打印哈夫曼树
5.对输入的字符串进行编码
6.对编码后的字符串进行解码
7.计算编码前后的压缩比并输出源代码voidHuffmanTree::Menu{cout请输入你要编码的文本按回车键确定输入stringInput;charletter;do//将字符逐个读入Input变量中{letter=cin.get;Input.append1letter;}whileletter!=;Input.eraseInput.length-11;//去掉Input末尾的回车符InitInput;//根据输入的字符串创立哈夫曼树及其编码表cout直观打印哈夫曼树PrintTree2*tSize-1-11;//打印哈夫曼树cout;stringd1d2;cout编码后的字符串为EncodeInputd1;//编码并打印编码串cout解码后的字符串为Decoded1d2;//解码并打印解码串coutASCII码编码与HUFFMAN编码的比拟CalculateInputd1;//计算编码前后的压缩比}
2.3其他
1.由于题目要求能输入任意长的字符串,所以本程序采用了string变量来记录输入的字符串,并采用string类的类成员函数来完成各项任务
2.打印哈夫曼树时采用了递归函数,且采用了凹凸表的形式打印哈夫曼树
3.为了输入空格,输入时采取逐个字符输入的方式
3.程序运行结果主函数流程图运行结果各函数运行正常,没有出现bug
4.总结经过这次实验,我了解了哈夫曼树的创立过程,了解了一种不等长编码的方法,用设断点调试的方法更加熟练,同时熟悉了STL中string类型的用法,对C++更加熟悉
1.
2.
3.模板内容仅供参考 。