关于学习大模型技术的方法论——个人经验漫谈AI.xAIGC专属社区

“学习的过程要做到知行合一,还要做到十年如一日”

随着大模型技术的发展,AI时代的到来成为不可阻挡的趋势,就像二十年前的互联网一样;而怎么学习大模型就成了很多人的疑问,学习大模型是不是就需要懂技术,懂数学等等。

而有些人断断续续的一直在学习大模型,但好像一直在做无用功,没有一点成效;而这些都是什么原因导致的呢?

今天我们就从个人的建议来谈谈关于学习大模型技术的方法论,可能并不适用于所有人,或许可能方法也是错的;但不论怎么说,都属于个人的一些经验。

学习大模型技术或者说学习任何东西,从作者的角度来看都需要经过几个步骤,也是方法;否则就会像无头苍蝇一样,总觉得自己很辛苦,但却收效甚少。

第一个也是老生常谈的一个方法——确定目标;在学习大模型技术之前,你首先要确定你想干啥,学习大模型的目标是什么。目标不仅仅只是给你设定一个方向,更重要的是不同的目标会有不同的学习方法。

比如说,你是想成为一个大模型的使用者,还是大模型产品的开发者,或者仅仅只是一个兴趣爱好。对使用者来说,你需要做的就是发挥你的想象力,尽力挖掘大模型的使用方法,然后把大模型与你的工作领域相结合。

如果你不能确定你的学习目标,那么你就有可能在这两种情况之间反复横跳;今天想学习大模型的使用,比如制作一个视频;明天又想学习大模型的技术,想开发一个产品;最后好像啥都学了,但又啥都没学会。

任何技术或产品,最好的切入点就是先学会使用,也就是从应用入手;学习应用不仅仅只是让你理解技术的使用,更重要的是能够让你深入到技术的应用场景,也就是技术到底解决了什么问题。

技术产生的目的是为了解决问题,而学习最高效的一种方式就是从问题出发;学会了应用,就可以反向思考为什么这个技术能够解决这个问题,它的优点是什么,缺点又是什么;技术解决了什么问题,又带来了什么问题等等。

有了一种应用场景之后,一是可以让你加深对技术的理解;其次这时你就可以继续思考,同样的技术是否能够解决别的问题,为什么能够解决,为什么又解决不了。

知道是一回事,做到又是另一回事;传说当年王阳明在提出知行合一之前;一直在学习和实践格物致知的理论。

在王阳明小时候,它想了解竹子就去格竹子;然后在竹子面前待了几天,最后还生病了;但依然没有什么结果。这时他就开始怀疑格物致知的理论,为什么他按照格物致知的方法去格竹子,却什么都没得到。

因此,经过以后多年的思考与实践,特别是在后来龙场悟道,一朝入圣;随之提出了知行合一的心学理论。

所谓的知行合一,就是在知中行,在行中知;把理论与实践相结合,才能真正学会一件事。

这也是为什么有些人明明看了一些关于大模型的书,但看完就忘,也不知道自己到底在学什么,也无法用大模型去解决任何实际问题。

知行合一就是要做到,看了理论之后要去实践;实践之后再去看理论,然后去发现实践和理论的差别;以及为什么是这样,而为什么不是那样等等。

大模型技术是一个涵盖范围很广的技术领域,它不仅仅只是一门编程技术,同时还涉及到数学,概率学,社会学习,脑科学,计算机科学等等多门交叉学科。

而我们需要做的不是什么东西都会,而是从一个角度切入进去,然后去深入学习;去钻研,去理解大模型技术。而不是今天学习AIGC,明天学习RAG,后天又想自己训练一个模型。

这就像做web开发一样,有些人擅长接口,有些人擅长中间件,有些人擅长数据库,而有些人又擅长加解密等等;没有任何一个人说他所有的东西都懂,都会。

很多时候,你说你什么都会,从侧面来说就代表着你什么都不会;毕竟人的精力是有限的,不可能做到面面俱到。而大模型技术每个方向的技术栈虽然有交集,但每个技术的侧重点都不一样。

所以,你需要做的就是先学习其中的一项技术,把它研究透,吃透;这时,你才有可能做到一法通万法通。

否则结果就是,你会觉得你什么东西都会,但什么东西又都不会;你所谓会的东西又无法去解决任何实际问题。

现在到处都有一周学会什么什么,一天入门什么什么;除了部分真正的天赋型选手之外,你觉得几天能入门什么东西?

哪怕去要饭,去捡垃圾,你觉得你刚开始能比得过人家长年累月的人吗?

所以学任何东西都不能急,慢慢来,只要你坚持学习总会有收获的那一天。

更重要的是,很多你认为简单的东西,等真正做起来原来没有那么简单。

最后,虽然很多时候我们无法看到技术的进步,但事实上大模型技术的发展日新月异;远远要比我们想象的要快得多。

THE END
1.算法笔记(三)算法学习技巧总结 算法是一门数学科学院,想要学号算法即该算法是为了要解决什么问题,需要静下心来谢谢代码,与不写代码的人区别是效率比他妈呢提高了很多,算法学习还需要举一反三你,这样我们才能狗的更好。https://www.code456.com/article/3598351.html
2.我国的ai技术目前处于什么水平?语料库是AI写作的基础,语料库不足导致了AI写作工具的语言水平不够高。算法不完善则会导致AI写作工具的表达不准确,缺乏逻辑性等问题。人工干预不足则会导致AI写作工具无法及时修正错误,形成恶性循环。 如何提高AI写作水平 要提高AI写作水平,需要从以下几个方面入手: https://tool.a5.cn/article/show/81981.html
3.研究生开题报告范文(通用10篇)论文的研究内容包括两个方面:一是研究新的高效的聚类算法;一是把已有的聚类算法或论文提出的新算法和入侵检测技术相结合,从而提出一个好的入侵检测模型。具体的研究内容包括以下几个点: 第一、针对聚类算法的研究问题: 1、如何提高算法的可扩展性 许多聚类算法在小于200个数据对象的小数据集上是高效率的,但是无法处https://www.fwsir.com/Article/html/Article_20150327092436_294426.html
4.陈经:被围棋AI横扫后,职业棋手应该如何提高水平?对于当前局面,人类先直觉产生一些候选点,这对应现在所有高水平围棋AI都采用的深度学习出来的“策略网络”。机器学习生成策略网络时,参考的就是人类高手的棋局,也有说法是AlphaGo从零开始不参考人类棋局,全部自我强化学习生成策略网络的。这次Master的招数绝大多数都是在人类的候选点范围内的,可以认为高手和Master的胜负不https://www.guancha.cn/chenjing/2017_01_04_387696_2.shtml
5.es数据库为什么快帆软数字化转型知识库ES数据库之所以快,是因为其分布式架构、倒排索引、水平扩展、内存缓存、并行处理。其中,倒排索引是关键因素。倒排索引是一种高效的数据结构,允许快速查找文档中包含特定词语的所有位置。与传统的正排索引不同,倒排索引在搜索时无需逐一扫描整个数据库,而是直接定位到包含搜索词的文档集合,从而大幅提高查询速度。这种机制使https://www.fanruan.com/blog/article/259544/
6.针对视频帧率提升篡改的噪声水平取证算法研究为了提高视频质量,伪造者会采用更为高级的运动补偿帧率提升技术。目前针对运动补偿帧率提升篡改的取证算法较少,因此,需要对运动补偿帧率提升进行取证。运动补偿帧率提升算法内插视频帧时,噪声积累会发生在插帧过程之中,那么,噪声水平作为检测指标具有一定的可行性,通过揭示时域噪声水平变化来检测运动补偿帧率提升篡改。实验https://cdmd.cnki.com.cn/Article/CDMD-10477-1019122258.htm
7.算法工程师职业规划总之,作为一名算法工程师,职业规划是非常重要的。你需要定义自己的职业目标,提高技能水平,积累项目经验,建立良好的职业关系,持续学习和成长,提高沟通能力,寻找职业发展机会。通过这些措施,你将成为一名成功的算法工程师,并取得职业生涯中的巨大成功。 【特别提示】 https://www.xycareer.com/knowledge/8907.html
8.一种绝对提高开发水平的方法腾讯云开发者社区英语对提升软件开发水平非常重要。 如果你英文水平不高,这并不影响你成为一个普通程序员,程序更多是靠逻辑思维。 如果做了多年开发的你发现自己的水平一直上不去,你可能要提高自己的英文水平了,英语就是你技术的瓶颈,对有些人可能是硬伤。 我周围的高水平的开发者英文都不差,官方API,专业英文资料、书籍没问题,代https://www.cloud.tencent.com/developer/article/1171431
9.数据分析面试题(转,但是经过自己消化)再举一个简单的栗子。过去在对首页产品进行排序时,往往是运营人员结合自己工作经验进行人工排序,现在算法小哥更新了产品排序的逻辑,希望通过AB实验证明自己的算法优于运营人工推荐,提高转化效果。 算法小哥和开发沟通好上线AB实验,用转化率(CR)来评估不同排序方式的效果,并设定显著性水平α=0.05。在这场AB实验中,用到https://www.jianshu.com/p/41eda14a8452
10.大华股份:海外业务开展受到较多因素干扰但仍是公司业务重点方向4、全场景自主解析,简化智能配置,提升智能化水平和可用性 小模型不具备全场景理解能力,因此在做事件分析业务时需要配置规则,而规则配置需要具有专业知识的人进行支撑,导致算法部署方法耗时、费力,而星汉大模型可以对全场景进行理解,能做到无需规则配置实现事件分析业务。以电力行业为例,登高作业合规业务,星汉大模型可以https://wap.eastmoney.com/a/202405183080653321.html
11.Github365天:给你一年的时间,你会怎样去提高你的水平给你一年的时间,你会怎样去提高你的水平? 正值这难得的sick leave(万恶的空气),码文一篇来记念一个过去的366天里。尽管想的是在今年里写一个可持续的开源框架,但是到底这依赖于一个好的idea。在我的Github 孵化器页面上似乎也没有一个特别让我满意的想法,虽然上面有各种不样有意思的ideas。多数都是在过去https://www.imooc.com/article/1533
12.该如何选购行车记录仪?很多行车记录仪为了提高清晰度,均使用了极强的锐化算法,相应的很多细节则保留较少。虽然轮廓清晰,但将人脸皮肤拍摄成胶皮,将树冠拍摄成一团绿,这样的成像缺少细部层次感和质感。 DeadLeaves测试卡是专门测试成像纹理质感的工具,我们用它来对行车记录仪的成像质感保留程度进行测试、打分,结果如下。 https://www.yoojia.com/ask/17-12117037663480580043.html
13.如何提升自己的数据分析能力和水平?在当今信息爆炸的时代,数据成为企业决策和发展的重要基础。因此,具备优秀的数据分析能力和水平对于个人职业发展至关重要。然而,如何提升自己的数据分析能力呢?本文将从充实技能、实践经验和持续学习三个方面进行阐述,帮助读者更好地提升自身数据分析能力。 一、充实技能 https://www.cda.cn/view/204083.html
14.数学——矩阵数据分析与科学计算:针对求解大规模线性系统的并行算法设计的核心问题,本方向研究和改进了同步与异步并行计算的新算法理论和实验,成为解决大规模复杂计算的基础。特别是引入了优化思想,设计出全新要求的多分裂并行算法,推广了多分裂并行算法的应用范围,提高了算法的计算效率,并应用于流体力学中对流扩散等微分方程https://yjsc.tynu.edu.cn/xkjs/Geography/Math_Introduction.htm
15.Stroke:机器学习算法明显提高CRP水平预测蛛网膜下腔出血预后的结果显示,共有1117名患者被纳入分析。总得来说,昏迷后第一天的CRP是一个独立的结果预测因子。完整的SAHIT模型的接受者特征曲线下面积(AUC)为0.831。逻辑回归预测结果显示,在完整的SAHIT模型的预测因素中加入CRP可以提高模型的性能(AUC=0.846, P=0.01)。 https://xxx.ylzx.net/6/545991.html
16.CT图像特征(精选八篇)尽管如此,图像界面奇异性和复杂几何相关性对水平集算法影响仍然很大,如何处理好上述问题,对于提高水平集分割算法在CT、X-ray等医学成像中的应用效果,至关重要,有利于增强算法在处理对比度差、像素不均匀、边界模糊等问题并存的医学影像成像分割问题上的表现[2-3]。https://www.360wenmi.com/f/cnkeyshs841i.html
17.水平集算法背景: 借鉴一些流体中的重要思想,1988年,Osher和Sethian首次提出了水平集算法, 这是一种有效解决曲线演化问题的数值方法,并且计算稳定,适宜任意维数空间。 随后,Osher等人对水平集算法做出扩展和总结,Giga也做了相关的理论扩展。 90年代以来,许多学者纷纷加入Level Set方法的研究队伍,使得Level Set方 法被广泛应用于计https://www.pianshen.com/article/8053964225/
18.银行数据范文12篇(全文)实施“客户关系管理”,可以帮助银行各业务部门了解、分析客户,更好地进行客户细分,提高客户行销和服务水平,为客户提供适当的产品和服务,从而增强市场的综合竞争能力,最终实现以产品为中心的经营模式向以客户为中心的经营模式的转变。 数据仓库的实施是一个长期的过程,在基础设施建立完成后,随着应用的逐步开展和深入,其https://www.99xueshu.com/w/ikeyp7o6y4d0.html