先保存下来,以备后面研究,现在还看不懂!
哈希算法将任意长度的二进制值映射为固定长度的较小二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。
设计高效算法往往需要使用Hash链表,常数级的查找速度是任何别的算法无法比拟的,Hash链表的构造和冲突的不同实现方法对效率当然有一定的影响,然而Hash函数是Hash链表最核心的部分,下面是几款经典软件中使用到的字符串Hash函数实现,通过阅读这些代码,我们可以在Hash算法的执行效率、离散性、空间利用率等方面有比较深刻的了解。
下面分别介绍几个经典软件中出现的字符串Hash函数。
●PHP中出现的字符串Hash函数
staticunsignedlonghashpjw(char*arKey,unsignedintnKeyLength){unsignedlongh=0,g;char*arEnd=arKey+nKeyLength;while(arKey
unsignedlonglh_strhash(char*str){inti,l;unsignedlongret=0;unsignedshort*s;if(str==NULL)return(0);l=(strlen(str)+1)/2;s=(unsignedshort*)str;for(i=0;iret^=(s[i]<<(i&0x0f));return(ret);}/*Thefollowinghashseemstoworkverywellonnormaltextstrings*nocollisionson/usr/dict/wordsanditdistributeson%2^nquite*well,notasgoodasMD5,butstillgood.*/unsignedlonglh_strhash(constchar*c){unsignedlongret=0;longn;unsignedlongv;intr;if((c==NULL)||(*c=='\0'))return(ret);/*unsignedcharb[16];MD5(c,strlen(c),b);return(b[0]|(b[1]<<8)|(b[2]<<16)|(b[3]<<24));*/n=0x100;while(*c){v=n|(*c);n+=0x100;r=(int)((v>>2)^v)&0x0f;ret=(ret(32-r));ret&=0xFFFFFFFFL;ret^=v*v;c++;}return((ret>>16)^ret);}●MySql中出现的字符串Hash函数
●另一个经典字符串Hash函数
unsignedinthash(char*str){registerunsignedinth;registerunsignedchar*p;for(h=0,p=(unsignedchar*)str;*p;p++)h=31*h+*p;returnh;}