腾讯百度滴滴三家大厂NLP算法的最新面试经验

自我介绍即开场白需要提前准备并多次练习,内容不用太多,言简意赅地讲清楚学校、专业、研究方向,概括介绍实习/论文/比赛等亮点即可,细节可以根据面试官的兴趣再深入。

2、项目/实习经历

这部分主要根据简历上的实习/项目进行,可能会问背景、怎么做、为什么这样做、最终结果、是否成功上线等,再深挖一些技术细节,或顺带考察ML、DL等知识点。

由于校招同学没有工作经验,所以项目和实习是展示自身能力的最好亮点(一堆CCF-A的大佬请忽略并接受我的膝盖)。面试官可以从介绍中了解你的工程能力、抗压能力、沟通能力、思维方式等等,如果吸引到面试官肯定能加分,要是面试官觉得索然无味估计面试也就到这儿了...

所以对于简历上的内容要滚瓜烂熟,能知其然知其所以然最佳。如果问到简历上的内容没答上或吞吞呜呜,将非常打脸,造成硬伤(简历上自己写的都不会,别的还用问吗╮( ̄▽ ̄)╭)。

3、介绍一个比赛

我从简历上3个比赛中,选择了一个最有亮点的比赛,从数据、模型、提分trick三方面做了介绍。

4、如何实现知识蒸馏,loss怎么选择

6、LR是线性模型吗,为什么?

7、梯度下降和随机梯度下降的区别

8、GBDT和XGBoost的区别(至少3方面)

9、偏差和方差的区别

10、怎么理解XLNet的,XLNet的输入是什么?

11、一个二分类任务,假设只有一个维度的特征,取值范围是0~正无穷,如何实现二分类?

12、手撕代码:两个数组求交集

腾讯一面难度中规中矩,量比较多但基本都在考察基础。

1、询问两个实习项目,详细考察细节

2、介绍textcnn实现过程,池化时loss如何反向传播

3、假如不用bert,一大堆文本有几百万个词,直接训练词向量很困难,如何去做特征选择

4、LSTM门控机制是怎样的

5、LTSM主要解决了RNN什么问题,为什么能解决

6-9重点考察语言模型

6、介绍GPT2如何写诗、写对联

7、GPT2如何围绕一个主题/关键词写诗

8、ELMO、BERT、GPT模型彼此之间有什么区别

9、word2vec和ELMO主要有什么不同,为什么elmo效果更好

hr视频面

1、询问导师、实验室的研究方向

3、base在深圳能否接受,多久可以来实习?

面试结束后过了2天,成功收到TEG的offercall。

百度自然语言处理

视频一面

1、手撕代码:

给定一个字符串S和一个字符C。返回一个代表字符串S中每个字符到C的最短距离的数组。

#inputS="paddlepaddle",C='d'#output[2,1,0,0,1,2,2,1,0,0,1,2]

2、介绍简历上的2个项目和1个比赛

3、介绍bert和TinyBert

4、bert如何实现微调

5、fasttext的实现原理

6、文本匹配如何实现

面试官给了一个展现自我的机会,我介绍了一个最近在实验室新做的项目(简历上没有)。

视频二面

word2vec负采样具体怎么做的(知识点:累积概率分布、二分区间查找)

2、文本匹配怎么做

3、文本匹配不当分类来做,loss怎么设计?

4、bert在中文和英文场景下使用,有什么区别

5、介绍一下在开源组织CLUE的工作

6、假如给offer,什么时候能来实习

聊个人特质、看重公司哪些方面、个人职业规划等

滴滴出行规划

1、详细介绍1个项目和1个比赛

面试官让现场打开比赛链接查看排名和解决方案

2、手撕代码:

因式分解

判断年份是否为闰年

1、介绍1个项目

2、介绍transformer

4、介绍word2vec2种实现模型、区别以及和fasttext的区别

5、手撕代码:并查集

视频三面

总结

手撕代码是面试的一道坎,要早做准备。同时,尽可能把握住可以跳过笔试(大部分公司)的提前批面试。

祝大家在新的一年offer多多,好运连连。

责任编辑:xj

原文标题:腾讯、百度、滴滴最新NLP算法面经

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)

THE END
1.必知!人工智能10大热门算法!ai人工智能计算今天,我们要带大家了解一下这些特别热门的人工智能算法。它们包括线性回归、逻辑回归、决策树、朴素贝叶斯、支持向量机(SVM)、集成学习、K近邻算法、K-means算法、神经网络和强化学习Deep Q-Networks等。我们要探讨一下它们是怎么工作的,用在哪些场合,以及它们对我们的生活有什么影响。 https://blog.csdn.net/wangluoanquan152/article/details/141901225
2.我们世界中的10个算法5.安全哈希算法 安全哈希算法用于将任意长度的数据映射为固定长度的哈希值。常见的安全哈希算法有SHA-256、SHA-512等,它们被广泛应用于数据完整性校验、密码存储等场景。 import hashlib message = b'Hello, World!' # 计算SHA-256哈希值 hash_value = hashlib.sha256(message).hexdigest() https://zhuanlan.zhihu.com/p/646765441
3.人工智能十大流行算法机器学习是该行业的一个创新且重要的领域。我们为机器学习程序选择的算法类型,取决于我们想要实现的目标。 现在,机器学习有很多算法。因此,如此多的算法,可能对于初学者来说,是相当不堪重负的。今天,我们将简要介绍10种最流行的机器学习算法,这样你就可以适应这个激动人心的机器学习世界了! https://aidc.shisu.edu.cn/62/7d/c13626a156285/page.htm
4."算法"的基本特征有哪些?答案解析 查看更多优质解析 解答一 举报 一个算法应该具有以下五个重要的特征: 1、有穷性: 一个算法必须保证执行有限步之后结束; 2、确切性: 算法的每一步骤必须有确切的定义; 3、输入:一个算法有0个或多个输入,以刻画运算对象的初始情况 解析看不懂?免费查看同类题视频解析查看解答 https://www.zybang.com/question/dd8fcd87c9b1d635cc38dc0ea10283d1.html
5.Java面试题大全及答案大全(共2000+,2022最新版)27、常用的垃圾收集器有哪些? 28、常用的垃圾回收算法有哪些? 29、什么是内存泄漏? 30、为什么会发生内存泄漏? 31、如何防止内存泄漏? 32、什么是直接内存? 33、直接内存有什么用? 34、怎样访问直接内存? 35、常用的 JVM 调优命令有哪些? 36、常用的 JVM 问题定位工具有哪些? 37、常用的主流 JVM 虚拟机https://cloud.tencent.com/developer/article/2021367?areaSource=102001.20&traceId=isKxARGvV3zGUauAwJ4Ug
6.硬核干货!备战阿里,字节,腾讯2020最新Java最常见面试题汇总,垃圾回收有哪些算法 GC的全流程 GC中老年代用什么回收方法? ? JVM面试题解析 ? 多线程: Java线程池有哪些参数?阻塞队列有几种?拒绝策略有几种? 死锁 ? 多线程面试题解析 设计模式: 阅读Spring源码的时候什么设计模式最让你影响深刻?如何使用? https://www.cnblogs.com/HEYA123/p/13813102.html
7.最新的2020房贷计算器有哪些算法装修问答房贷计算器在我们买房子时经常会看到,但很多人并不清楚它具体是做什么的,而房贷计算器就是来帮助我们https://ask.zx123.cn/show-4234007.html
8.温故而知新CMU15445知识点复习+设计配套项目静态HASH算法有哪些,动态有哪些, 区别是什么? 静态算法有LINEAR PROBE, 链表法,cukoo hash. 动态有extendible hashing, linear hashing 静态算法要求DBMS事先知道要存多少元素,否则就需要在一定时间对整个表做扩容和缩容然后rehash。而动态没这个限制。 B树有哪些性质? https://www.jianshu.com/p/aaf708b422ea
9.房产税的计算方法是什么?以上就是小编为大家带来的关于最新房产税计算方法的相关内容,大家可以通过上面小编给出的计算方法计算自己的房产税是多少,在生活实践中大家要根据不同房产要求来计算不同的房产税,若在这方面有需要帮助的,欢迎咨询我们律图的专业律师。看完还有疑惑?建议直接问律师 最快9秒应答 有哪些减免或优惠措施适用于房产税的https://m.64365.com/zs/659727.aspx
10.区块链的“去信任”到底去的是什么信任?高承实的财新博客第四讲:量子计算给区块链带来了哪些冲击? 区块链的安全基于密码算法的安全,如Hash函数的安全和椭圆曲线密码算法的安全。量子计算机的出现有可能在密码算法层面给区块链安全带来严重威胁,比特币、以太坊等许多区块链系统都会受到冲击。 1.量子计算对挖矿的威胁 https://gaochengshi.blog.caixin.com/archives/240328
11.53道最新Java笔试题大全及答案(全面总结)–mikechen1. 如果内部类为静态内部类,只能调用外部类的静态成员;如果有重名成员,需要用“外部类名.成员名”访问;不能调用外部类的对象成员。 2. 如果内部类为非静态内部类,则可以调用外部类的所有成员;如果有重名成员,需要使用“外部类名.this.外部方法” 19.下面哪些是对称加密算法? https://youzhixueyuan.com/bat-interview-questions-javalist-java-map-interview-questions.html
12.linux系统哪个好用最新章节linux系统哪个好用小说《《AI算法模型有哪些》》最新章节(提示:已启用缓存技术,最新章节可能会延时显示。) 第二百四十八章 美剧龙战士第一季第二百四十七章 第二百四十六章 第二百四十五章 第二百四十四章 第二百四十二章 第二百四十一章 第二百四十章 第二百三十九章 《《AI算法模型有哪些》》正文 第一章 第二章 第三章 第四http://www.chinakaoyan.com/beile/8xxpiojm.html
13.谷歌要成为一家「人工智能优先」公司——谷歌研究总监Peter问:谷歌「没有更好的算法,只有更多的数据」,这是真的吗? 答:我引述过 Michele Banko 和 Eric Brill 的一篇论文,当时他们在微软研究院,论文调查了用于词义消歧的算法,结果显示,改善算法的,不是从一个算法转到另一个算法,而是增加训练数据量。我说过,有些问题类似这种情况,有些并非如此。你可以将这篇论文叫做「https://www.jiemian.com/article/654720_qq.html
14.最新亚马逊Review算法解读以上最后一点值得注意,因为以往亚马逊对于Review的处罚更多集中在对买家的处理上,而现在开始警告卖家是一个实质性的变化,证明亚马逊很有可能会在下一步对持续违反Review政策的卖家进行关店甚至在联邦法院对相关卖家进行诉讼。 第二部分:最新评价算法 以上的情况就发生在最近,我们认为非常值得关注,因为现在操纵评价对于卖家https://www.cifnews.com/article/24612
15.AI板块最有潜力的币有哪些?2024年最新ai代币介绍币种百科概念:SingularityNET是一个面向AI的去中心化平台。它旨在构建基于区块链的基础设施,实现各种AI算法,从图像识别到自然语言处理等的实时灵活交互。该系统将追踪哪些算法在被使用,并相应地对开发人员进行激励。 11. AKT(Akash Network) 当前流通市值为7.9亿美元。 https://www.jb51.net/blockchain/930168.html
16.三年开发经验,跳槽腾讯音乐,三面斩获Offer,定级T21一面是一个电话面试,下午6点左右特地找了一个地方电话面试,6点准时电话就过来了,不得不说,这方面还是专业的,时间有点远了,依稀记得一些题目。。。 1、Object的方法有哪些? 2、为什么要有HashCode方法,hash算法的原理,在Java中哪些地方用到,进而问到了HashMap的源码 https://maimai.cn/article/detail?fid=1478114392&efid=38ungJue5X117uux-Fdi4w
17.目标检测一阶段算法有哪些目标检测的算法有哪些目标检测一阶段算法有哪些 目标检测的算法有哪些 目标检测最新总结文献 : 1《Deep Learning for Generic Object Detection A Survey》下载地址 2.《Object Detection in 20 Years: A Survey》下载地址 GitHub:下载地址 目标检测是将图像或者视频中的目标与其他不感兴趣区域进行区分,判断是否存在目标,确定目标位置,识别https://blog.51cto.com/u_39037/9841910
18.算法管理制度有哪些四、算法管理团队 1.算法管理委员会:公司设立算法管理委员会,负责公司算法管理制度的制定、审批和执行。 2.算法管理人员:公司需要有专门的算法管理人员,负责算法的申请审批、版本管理、使用监控等工作。算法管理人员需要定期进行培训,掌握最新的算法技术和管理方法。 3.算法管理团队:公司需要建立一个专门的算法管理团队,https://wenku.baidu.com/view/fe6f932ef221dd36a32d7375a417866fb84ac08d.html
19.重现当年AlphaGo神来之笔,DeepMind新AI发现提速70%排序算法消息一出,立刻引爆学术圈,有网友就直呼: 没想到这么古老又基础的算法还能被进一步改进。 而正是因为这一最新成果,十年都没有更新的LLVM标准C++库都更新了,并且数十亿人将会受益。 因为,无论是排序还是哈希,它们的应用场景从在线购物、云计算到供应链管理等各个场景都能用到,每天会被调用上亿次! https://m.thepaper.cn/wap/v3/jsp/newsDetail_forward_23406067
20.按美国算法,中国GDP能超过美国吗!?1、按照高盛的最新算法: 中国的投资,因为美元利率高,人民币利率低,所以全球资产都愿意投到美国。人民币资产,也愿意流到美国。 这样,就导致中国经济投资不足,因此导致中国 GDP 增长率,下降到 2.4%,由此中国的经济总量,永远也赶不上美国了。 2、中国的 GDP 总量,按照我们自己的算法,只要连续保持 4.6%以上的增速,https://user.guancha.cn/main/content?id=1081219
21.房地产企业房产税二、房产最新的税费算法 房产税适用于内资企业和个人,房产税的计算依据采用从价计税和从租计税,具体税率如下:房产税的计税公式为: 1、从价计税:应纳税额=房产原值×(1—30%)×1.2; 2、从租计税:应纳税额=房产租金收入×12%; 3、个人出租住房:应纳税额=房产租金收入×4%。 https://www.66law.cn/laws/118604.aspx
22.张维为:读不懂中国共产党是西方误读关键丨嘉宾新著先睹?*二进制算法源自莱布尼茨从《周易》中受到的启发 可以说,从整个16—18世纪我们看到的是“中学西渐”,也就是中国的哲学、文学、艺术等,随着中国的物质文明不断地涌入欧洲,影响了欧洲人的物质和精神生活。 德国哲学家莱布尼茨如此渴望得到关于中国的知识,他在给朋友的信中说,他准备在自己的房门上贴一块牌子,上面写https://www.whb.cn/zhuzhan/jtxw/20190918/287170.html
23.5000万的感动佳能5DS/5DSR深度评测(全文)佳能5DsR当然,针对相机的高感控噪问题,作为相机的制造商佳能本身也提供了一些解决办法。这里我们就来看看机身的控噪算法在高感光度下的噪声处理表现。我们来看一看,将机身降噪处理设置为:关闭、低、标准、高不同的4个模式下,控噪表现有哪些不同。 佳能EOS 5DS/5DS R机身降噪处理对比 从对比中我们就能看到佳能EOS 5DS/5DShttps://dcdv.zol.com.cn/524/5247724_all.html