从整体到细节,自顶向下,从抽象到具体的框架思维是通用的,不只是学习数据结构和算法,学习其他任何知识都是高效的。
数据结构的存储方式只有两种:数组(顺序存储)和链表(链式存储)。
这句话怎么理解,不是还有散列表、栈、队列、堆、树、图等等各种数据结构吗?
我们分析问题,一定要有递归的思想,自顶向下,从抽象到具体。你上来就列出这么多,那些都属于「上层建筑」,而数组和链表才是「结构基础」。因为那些多样化的数据结构,究其源头,都是在链表或者数组上的特殊操作,API不同而已。
比如说「队列」、「栈」这两种数据结构既可以使用链表也可以使用数组实现。用数组实现,就要处理扩容缩容的问题;用链表实现,没有这个问题,但需要更多的内存空间存储节点指针。
「图」的两种表示方法,邻接表就是链表,邻接矩阵就是二维数组。邻接矩阵判断连通性迅速,并可以进行矩阵运算解决一些问题,但是如果图比较稀疏的话很耗费空间。邻接表比较节省空间,但是很多操作的效率上肯定比不过邻接矩阵。
「散列表」就是通过散列函数把键映射到一个大数组里。而且对于解决散列冲突的方法,拉链法需要链表特性,操作简单,但需要额外的空间存储指针;线性探查法就需要数组特性,以便连续寻址,不需要指针的存储空间,但操作稍微复杂些。
「树」,用数组实现就是「堆」,因为「堆」是一个完全二叉树,用数组存储不需要节点指针,操作也比较简单;用链表实现就是很常见的那种「树」,因为不一定是完全二叉树,所以不适合用数组存储。为此,在这种链表「树」结构之上,又衍生出各种巧妙的设计,比如二叉搜索树、AVL树、红黑树、区间树、B树等等,以应对不同的问题。
了解Redis数据库的朋友可能也知道,Redis提供列表、字符串、集合等等几种常用数据结构,但是对于每种数据结构,底层的存储方式都至少有两种,以便于根据存储数据的实际情况使用合适的存储方式。
综上,数据结构种类很多,甚至你也可以发明自己的数据结构,但是底层存储无非数组或者链表,二者的优缺点如下:
对于任何数据结构,其基本操作无非遍历+访问,再具体一点就是:增删查改。
数据结构种类很多,但它们存在的目的都是在不同的应用场景,尽可能高效地增删查改。话说这不就是数据结构的使命么?
如何遍历+访问?我们仍然从最高层来看,各种数据结构的遍历+访问无非两种形式:线性的和非线性的。
线性就是for/while迭代为代表,非线性就是递归为代表。再具体一步,无非以下几种框架:
数组遍历框架,典型的线性迭代结构:
voidtraverse(int[]arr){for(inti=0;i /*基本的单链表节点*/classListNode{intval;ListNodenext;}voidtraverse(ListNodehead){for(ListNodep=head;p!=null;p=p.next){//迭代访问p.val}}voidtraverse(ListNodehead){//递归访问head.valtraverse(head.next);}二叉树遍历框架,典型的非线性递归遍历结构: /*基本的二叉树节点*/classTreeNode{intval;TreeNodeleft,right;}voidtraverse(TreeNoderoot){traverse(root.left);traverse(root.right);}你看二叉树的递归遍历方式和链表的递归遍历方式,相似不?再看看二叉树结构和单链表结构,相似不?如果再多几条叉,N叉树你会不会遍历? 二叉树框架可以扩展为N叉树的遍历框架: /*基本的N叉树节点*/classTreeNode{intval;TreeNode[]children;}voidtraverse(TreeNoderoot){for(TreeNodechild:root.children)traverse(child);}N叉树的遍历又可以扩展为图的遍历,因为图就是好几N叉棵树的结合体。你说图是可能出现环的?这个很好办,用个布尔数组visited做标记就行了,这里就不写代码了。 所谓框架,就是套路。不管增删查改,这些代码都是永远无法脱离的结构,你可以把这个结构作为大纲,根据具体问题在框架上添加代码就行了,下面会具体举例。 首先要明确的是,数据结构是工具,算法是通过合适的工具解决特定问题的方法。也就是说,学习算法之前,最起码得了解那些常用的数据结构,了解它们的特性和缺陷。 先刷二叉树,先刷二叉树,先刷二叉树! 这是我这刷题一年的亲身体会,下图是去年十月份的提交截图: 刷二叉树看到题目没思路?根据很多读者的问题,其实大家不是没思路,只是没有理解我们说的「框架」是什么。不要小看这几行破代码,几乎所有二叉树的题目都是一套这个框架就出来了。 voidtraverse(TreeNoderoot){//前序遍历traverse(root.left)//中序遍历traverse(root.right)//后序遍历}比如说我随便拿几道题的解法出来,不用管具体的代码逻辑,只要看看框架在其中是如何发挥作用的就行。 LeetCode124题,难度Hard,让你求二叉树中最大路径和,主要代码如下: intans=INT_MIN;intoneSideMax(TreeNode*root){if(root==nullptr)return0;intleft=max(0,oneSideMax(root->left));intright=max(0,oneSideMax(root->right));ans=max(ans,left+right+root->val);returnmax(left,right)+root->val;}你看,这就是个后序遍历嘛。 LeetCode105题,难度Medium,让你根据前序遍历和中序遍历的结果还原一棵二叉树,很经典的问题吧,主要代码如下: TreeNodebuildTree(int[]preorder,intpreStart,intpreEnd,int[]inorder,intinStart,intinEnd,Map LeetCode99题,难度Hard,恢复一棵BST,主要代码如下: voidtraverse(TreeNode*node){if(!node)return;traverse(node->left);if(node->val 你看,Hard难度的题目不过如此,而且还这么有规律可循,只要把框架写出来,然后往相应的位置加东西就行了,这不就是思路吗。 defcoinChange(coins:List[int],amount:int):defdp(n):ifn==0:return0ifn<0:return-1res=float('INF')forcoinincoins:subproblem=dp(n-coin)#子问题无解,跳过ifsubproblem==-1:continueres=min(res,1+subproblem)returnresifres!=float('INF')else-1returndp(amount)这么多代码看不懂咋办?直接提取出框架,就能看出核心思路了: #不过是一个N叉树的遍历问题而已defdp(n):forcoinincoins:dp(n-coin)其实很多动态规划问题就是在遍历一棵树,你如果对树的遍历操作烂熟于心,起码知道怎么把思路转化成代码,也知道如何提取别人解法的核心思路。 比如N皇后问题吧,主要代码如下: voidbacktrack(int[]nums,LinkedList 纠结细节问题,就比如纠结i到底应该加到n还是加到n-1,这个数组的大小到底应该开n还是n+1? 从框架上看问题,就是像我们这样基于框架进行抽取和扩展,既可以在看别人解法时快速理解核心逻辑,也有助于找到我们自己写解法时的思路方向。 当然,如果细节出错,你得不到正确的答案,但是只要有框架,你再错也错不到哪去,因为你的方向是对的。 但是,你要是心中没有框架,那么你根本无法解题,给了你答案,你也不会发现这就是个树的遍历问题。 这就是框架的力量,能够保证你在快睡着的时候,依然能写出正确的程序;就算你啥都不会,都能比别人高一个级别。 数据结构的基本存储方式就是链式和顺序两种,基本操作就是增删查改,遍历方式无非迭代和递归。 刷算法题建议从「树」分类开始刷,结合框架思维,把这几十道题刷完,对于树结构的理解应该就到位了。这时候去看回溯、动规、分治等算法专题,对思路的理解可能会更加深刻一些。