老师们好,我叫小李,初试分数为:370分,本科专业是读的计算机科学与技术,大学期间成绩优异,获得了奖学金,除此之外,我还积极参与学科类竞赛,在比赛中获得奖,并且拿到了四六级证书,软件设计师证书等。在校期间和同学一起完成了一个文字识别小程序项目,该项目是拍照将图片中的文字提取出来,主要是利用百度飞桨的AI能力实现。通过这个项目,我对人工智能机器学习方面充满了兴趣,自学了机器学习的基础知识和线性回归和逻辑回归的算法,然后利用线性回归做了一个预测模型,其中在预测的结果模型评估中,MSE值降低至:1021.457,R2值为0.918。本科期间在人工智能方面接触较少,希望再研究生期间深入研究学习这方面知识。谢谢老师的倾听。
1.2学习一般且啥也没有类型老师们好,我叫小王,初试分数为:370分,本科专业是读的计算机科学与技术专业,兴趣爱好比较广泛,喜欢户外运动、爬山、旅游等,在本科期间也很喜欢学习新的技术,大学期间除了学校教的C++、Java,我还自学了Python语言以及Java的SpringBoot等框架,并使用Java做了一个人工智能平台,***,使用Python语言和线性回归做了一个项目。
1.3跨专业考研避雷。虽然你们的目的都是因为计算机好就业薪资高,但是在复试中不要提到这些东西,因为研究生是属于研究性质的,学术性质的,很忌讳出现如此功利性的目的。所以尽可能的避开这些词汇的出现。
2面试应该如何准备2.1基础知识篇基础知识一般会问一写《计算机网络》、《操作系统》、《计算机组成原理》、《数据库原理》专业课知识。
2.1.1计算机网络1、TCP,UDP介绍,差别TCP是面向连接的可靠传输UDP是无连接的不可靠传输TCP是头部消耗大最少20字节UDP8字节TCP是面向字节流的UDP是面向报文的TCP是只支持1对1通信UDP可以1对多多对一多对多通信
2、简述TCP的三次握手四次挥手三次握手:客户端发出一个报文头部SYN标志位为1,并发送一个sqn为x,此时客户端进入SYN—SEND状态,服务端收到连接请求回应一个报文,其中标志位ACK确认号为1,SYN标志位为1,seq为y,ack为x+1,此时客户端进入SYN—received状态。客户端收到报文后,发送ACK确认号为1,ack为y+1,seq为x+1。
3、TCP/IP协议的可靠性是怎样保证的(滑动窗口)
4、IP地址有哪几类A类,B类,C类,D类,E类。A类、B类、和C类这三类地址用于TCP/IP节点,其它两类D类和E类被用于特殊用途。5、TCP、OSI网络模型有几层TCP四层(网络接口层、网络层、传输层、应用层)OSI七层(物理层、数据链路层、网络层、传输层、会话层、表示层、应用层)五层模型(物理层、数据链路层、网络层、传输层、应用层)
2.1.3计算机组成原理冯诺依曼体系结构的计算机分为哪几层?
这个一般问的比较少,网上找一下别人问过的问题,简单准备一下就行。
2.1.4数据库原理这个问的也比较少,记得一二三BC范式这些,其他好像问的也不多,网上找找吧。
1、你有没有了解过文字识别背后的过程是什么?(以下是详细流程,整理成自己的话,几句话描述清楚整个流程)OCR识别提取图片中文字原理·预处理:对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息,以便方便后面的处理。在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了。降噪在这个阶段非常重要,降噪算法的好坏对特征提取的影响很大。字符切分则是将图像中的文字分割成单个文字——识别的时候是一个字一个字识别的。如果文字行有倾斜的话往往还要进行倾斜校正。归一化则是将单个的文字图像规整到同样的尺寸,在同一个规格下,才能应用统一的算法。
·特征提取和降维:特征是用来识别文字的关键信息,每个不同的文字都能通过特征来和其他文字进行区分。对于数字和英文字母来说,这个特征提取是比较容易的,因为数字只有10个,英文字母只有52个,都是小字符集。对于汉字来说,特征提取比较困难,因为首先汉字是大字符集,国标中光是最常用的第一级汉字就有3755个;第二个汉字结构复杂,形近字多。在确定了使用何种特征后,视情况而定,还有可能要进行特征降维,这种情况就是如果特征的维数太高(特征一般用一个向量表示,维数即该向量的分量数),分类器的效率会受到很大的影响,为了提高识别速率,往往就要进行降维,这个过程也很重要,既要降低维数吧,又得使得减少维数后的特征向量还保留了足够的信息量(以区分不同的文字)。
·分类器设计、训练和实际识别:分类器是用来进行识别的,就是对于第二步,对一个文字图像,提取出特征给,丢给分类器,分类器就对其进行分类,告诉你这个特征该识别成哪个文字。
·后处理:后处理是用来对分类结果进行优化的,第一个,分类器的分类有时候不一定是完全正确的(实际上也做不到完全正确),比如对汉字的识别,由于汉字中形近字的存在,很容易将一个字识别成其形近字。后处理中可以去解决这个问题,比如通过语言模型来进行校正——如果分类器将“在哪里”识别成“存哪里”,通过语言模型会发现“存哪里”是错误的,然后进行校正。第二个,OCR的识别图像往往是有大量文字的,而且这些文字存在排版、字体大小等复杂情况,后处理中可以尝试去对识别结果进行格式化,比如按照图像中的排版排列什么的,举个栗子,一张图像,其左半部分的文字和右半部分的文字毫无关系,而在字符切分过程中,往往是按行切分的,那么识别结果中左半部分的第一行后面会跟着右半部分的第一行诸如此类。
项目提问:2、分类器是怎么设计的,运用了什么算法。遇到这种不会的话题,统一话术,往自己会的地方引入,看似答得朗朗上口,其实答非所问。我了解到的分类算法一般是,逻辑回归、K-近邻算法、决策树、神经网络这些。因为是用的百度训练好的模型,不清楚百度用到的什么分类算法。
4、那介绍一下逻辑回归算法吧?自己去总结,我之前文档写的很详细了。
5、说说你了解的人工智能。人工智能包含机器学习和深度学习,其中机器学习又包含深度学习,学习的形式一般分为监督学习和无监督学习....
3、其他问题:1平时有哪些兴趣爱好?说正能量的,说喜欢打游戏、看剧、看小说我呼死你。说唱歌、看电影、运动、户外、旅行都可以。2平时喜欢看那些书?说专业书比较好,比如说《大话数据结构》、最近在看李开复教授的《深度学习》,当然也可以说一些名著,哲学等其他学科的书籍,尽量不要说一些很随意的书。
3关系类的,男女朋友有吗?这个随意答,有就说我们二人共同进步,一起考研,切记不要一个工作一个读研。没有就说暂时没有遇到有缘人。
4如何评价你自己?(你的优点是什么?你的缺点是什么?)说说自己的优缺点