哈夫曼树之构建

前言

说到哈夫曼树，就不得不说它在压缩与解压方面的应用太完美了，就是把一个大的文件，通过算法压缩成一个较小的文件，从而大大节约了空间

哈夫曼树

通俗的说就是给定n个权值作为n个叶子结点，构造一颗二叉树，若带权路径长度达到最小，称这样的树为哈夫曼树，也称为最优二叉树，同时，由定义可知，哈夫曼树是带权路径长度最短的树，所以权值较大的结点离根较近

构造哈夫曼树

哈夫曼结点

public class HuffmNode {
	//构造HuffmNode类  
    private int data;  
    private HuffmNode left;  
    private HuffmNode right;  
    //HuffmNode类构造函数  
    public  HuffmNode(int data) {  
        this.data=data;  
    }  
      
    //封装属性  
    public int getData() {  
        return data;  
    }  
    public void setData(int data) {  
        this.data = data;  
    }  
    public HuffmNode getLeft() {  
        return left;  
    }  
    public void setLeft(HuffmNode left) {  
        this.left = left;  
    }  
    public HuffmNode getRight() {  
        return right;  
    }  
    public void setRight(HuffmNode right) {  
        this.right = right;  
    }  
  
}

构造哈夫曼树

public class HuffmTree {  
      
    public int [] datas ={42,8,19,100,58,15,29};  
    public LinkedList<HuffmNode> list = new LinkedList<HuffmNode>();  
      
    public HuffmNode createTree() {  
        //按照从小到大的将数据封装成节点  
        for (int i = 0; i < datas.length; i++) {  
            HuffmNode node = new HuffmNode(datas[i]);  
            //得到需要插入的位置索引  
            int index=getIndex(node);  
            //将数据添加到容器中  
            list.add(index, node);  
        }  
        //构造哈夫曼树  
        while(list.size()>1){  
            //移除容器中的第一个节点  
            HuffmNode firstNode =list.removeFirst();  
            //容器中原来的第二个节点变成新的第一个节点  
            HuffmNode secondNode =list.removeFirst();  
            //构造父节点数据域  
            HuffmNode fatherNode = new HuffmNode(firstNode.getData()+secondNode.getData());  
            //构造父节点左子叶  
            fatherNode.setLeft(firstNode);  
            //构造父节点右子叶  
            fatherNode.setRight(secondNode);  
            //得到构造好的父节点的索引  
            int index=getIndex(fatherNode);  
            //将父节点加入森林  
            list.add(index, fatherNode);  
        }  
        //返回根节点  
        return list.getFirst();  
    }  
      
    //得到索引  
    public int getIndex(HuffmNode node) {  
        for (int i = 0; i < list.size(); i++) {  
            if(node.getData()>list.get(i).getData()){  
                continue;  
            }else {  
                return i;  
            }  
        }  
        //如果比容器中的任何一个数大，则插入最后面  
        return list.size();  
    }  
      
    //得到哈夫曼编码  
    public void getHuffmCode(HuffmNode root,String code) {  
        if(root.getLeft()!=null){  
            getHuffmCode(root.getLeft(),code+"0");  
        }  
        if(root.getRight()!=null){  
            getHuffmCode(root.getRight(),code+"1");  
        }  
        if(root.getLeft()==null && root.getRight()==null){  
            System.out.println(root.getData()+":"+code);  
        }  
    }   
	
}

其实这段代码就是上述四个步骤的实现，代码也很好理解，带权值为datas，将结点放到链表中，然后注意利用非正规的选择排序将链表集合里权值从小到大排好序，然后开始选择权值最小的两个构造一个新的权值结点，同时删除那两个，加入这个新的。。重复直到只剩一个根结点为止，很明显此时就是哈夫曼树了，最后通过后序遍历得到哈夫曼编码值，这里我们约定左子树一个路径为0，右子树一个路径为1，所以一定不存在像01与010这样前面是后面子串的编码值
测试类

public static void main(String[] args) {
		 HuffmTree tree = new HuffmTree();  
	        HuffmNode root = tree.createTree();
	        tree.getHuffmCode(root, ""); 
	}

结果：

8:000
11:001
23:01
14:100
7:1010
3:10110
5:10111
29:11

注意这里的结果和图示有一个地方不一样，就是那个几点8，这里的结点8是合成的，可以根据结果画出哈夫曼树，比较就会看出不同

前言

哈夫曼树

相关术语

构造哈夫曼树