科学网—[转载]自学R语言的十条干货技巧分享

这10条技巧并不是提供使用R的技术指导,而是提供了构建或磨练R编程技能的实用策略。

学习R就是学习一门新语言,包括词汇、语法、句法,甚至可能是一种新的思维方式,打开一个新的世界。

可以这样说,学习R语言很困难,因为它涉及经常报错,所以这个学习的过程要做好准备,识别这些错误,并最终学习如何修复。

即使是最有经验的人,仍然会犯错误、忘记函数参数,或转向互联网搜索以刷新他们可能已完成多次的任务。

R语言的流畅度不是永远不会收到错误消息,而是当你收到错误消息时感觉有能力修复它们(图1)。当然,有些bug的发生并不是因为输入错误的代码,而是因为对函数参数或输出的误解。

虽然避免错误消息是很好的第一步,但确保脚本完成预期任务的最佳方法是:

仔细阅读文档,一次运行一行代码。

学习正确的编程实践的一个好方法是看书。书的一个优点是它们通常代表专家的声音、社区的技能,或两者兼而有之。大多数学习R编程的好书都包含代码示例,你可以使用这些示例来提高技能。

当书本后面没有答案时,开始或加入阅读小组会很有帮助,而且更有趣(后面第八条会讲到加入R社区)。与同事一起尝试练习,并利用彼此作为网络来提出问题、比较方法并通过复杂的任务进行集体思考。

教科书解决方案也定期在个人博客或网站上在线共享。在线发布自己的解决方案可以让你能够获得反馈,使整个R社区受益(参见第9条)。

R用户其实很幸运,你们已经拥有大量高质量的已出版书籍作为学习资源,其中包括:

RStudio网站

比较推荐的R一些书籍包括“RforDataScience”和“AdvancedR”,它们通过tidyverse介绍了R的现代方法(参见第5条关于风格)。

根据你学习R的目的,去看涵盖与你兴趣相符的,更具体主题的书可能会有所帮助。

例如,如果你打算将R用于高级统计,可以去看这类书,如《使用R的生态学中的混合效应模型和扩展》或《广义相加模型:R简介》,每个都鼓励对核心编程和统计技能的深刻理解。

如果你想用R来画出高质量的Web图形,从而传达结果,可能会需要看《Interactiveweb-baseddatavisualizationwithR,plotly,andshiny》,其中涵盖了先进的基于Web的数据可视化技术的介绍。

那么到底应该买多少本书?

应该选修哪些编程的课程?

是不是需要很大的金钱成本?

别担心,下一章节我们提供一些免费资源供参考。

幸运的是,许多高质量的R资源在线免费提供,涵盖了你可能所需的一切。

例如,许多电子书在线免费提供,包括RStudio网站上的电子书。为了更快地参考,RStudio还提供了几个单页备忘单,每个备忘单都涵盖了一个特定包或编程任务的基本知识,可以作为很好的提醒。

如果你觉得看书枯燥,不容易看懂,那么也可以参考一些别的形式:

在Coursera、edX和freeCodeCamp等网站上也有许多关于R、统计和数据科学的免费课程,TheCarpentries的免费培训材料,甚至YouTube和Twitch等网站上的免费视频教程。

无论是通过博客、互动教程还是视频课程,如果有一种在线方式你觉得最适合的,那么很可能会有这种方式的R资源,只需要搜索一点就可以找到。

例如,魁北克生物多样性科学中心(QCBS)R研讨会系列以英语和法语提供了关于数据可视化、线性模型、多元分析等的介绍性和高级研讨会,并在其网站上免费提供PPT、代码和配套书籍。

爱丁堡大学的编程俱乐部为生态学家和环境科学家提供广泛的课程,从数据处理和统计到地理空间分析和机器学习。

-想学习如何使用ShapeFile进行映射吗?

尝试制作一张你最喜欢的城市的海报,作为墙壁艺术印刷。

-通过API抓取数据?

尝试在Spotify上找出最受欢迎的艺术家的共同品质。

-文本分析?

尝试使用R的文本挖掘包来比较你喜爱的书籍或电视节目的情感关联。

-定制数据可视化?

尝试使用ggplot形状和美学来复制你最喜爱的艺术作品(参见Twitter上的#RecreationThurday)。

仅仅为了好玩,项目可以成为培养关键技能的非常有价值的环境。

低风险的环境会减轻你成功的压力,但当你成功时,会给你新的产品和工作代码,供你下次尝试类似的任务时参考。

参与有趣的社区活动、Twitter挑战或R编码竞赛(更多信息,请第8和9条)将帮你建立坚实的基础,为你的编程道路打开大门,同时选择你喜欢的项目。

如果你更愿意让你的R学习更多的“任务”工作,你可以对现有的项目进行低压力的增加,从而获得新的技能。

尝试通过向现有图添加自定义文本注释来练习HTML呈现,或者通过创建用于交互式数据探索的闪亮应用程序,来升级日常工作流程。

在改进现有工作的同时,寻找扩大技能的机会将有助于你成为更全面的R用户。

培养和维护项目的编程方法和组织系统有助于你和他人的代码清晰一致。

如果在开始新任务时对所有未来步骤都进行了精心规划,那么你就可能会从使用虚拟程序代码开始项目中获益。

*虚拟程序代码是计划完成的操作的简单语言描述列表,在文档中写出,然后逐行翻译为代码。

这种方法的一个好处是,它允许你从头到尾对项目进行概念化,并为你将要编写的每一行代码提供一个离散的目标。

如果说,你更喜欢边做边学,可能更喜欢直接编写代码,观察每一行的输出,并在文本中注释最后一行完成的内容,以较小的增量达到最终目标。

在这两种情况下,对代码进行注释是很重要的,确保将来能够理解当前的想法。

在本文中,编程风格是编写代码时使用的特定函数、包和语法策略的集合。如果你认为R是一种语言,可能会认为你的风格是一种方言;两种风格看起来可能不同,但它们的含义是相同的。

在R中,主要的样式划分通常围绕着:你是使用基本R的典型样式,还是采用R的管道方法以及其他tidyverse原则。

3种代码样式的示例

虽然这些样式并不相互排斥,但它们包含不同的函数集,通常适合不同的语法策略来构造代码。根据你的背景,你可能更喜欢其中一种语法。

例如,如果有在C++或Java等程序中编写代码的经验,则顺序或嵌套语法可能会让你熟悉,而管道函数可能会使代码读起来更类似于用英语编写的句子。

在大多数情况下,只要适合你的,什么样式都可以。

当然,匹配协作者中最常见的代码风格或规程中的标准,对阅读、共享和排除代码故障很有帮助。

有时,可能需要切换样式,以便于最好地完成某项任务,但选择尽可能保持样式一致将有助于确保你和其他人可以解释代码。

R生态系统提供了许多工具来促进项目组织。大多数集成开发环境(IDE)都有“项目目录”的概念;这对于领先的RIDE、RStudio和大多数其他(例如,VScode和Atom)都是如此。

还可以使用包来简化项目目录中的文件路径命名方案。根据你所在的领域,文件夹组织结构可能会有所不同,但随着项目列表的增长,对系统进行批判性思考将简化生活。

此外,保持适当的项目组织将有助于你学习“版本控制”的实践,这是一种跟踪更改和备份代码的系统,正在成为跨科学领域的专业标准。

R的大多数功能都捆绑在特定于任务的包中,但很难知道哪些包存在,哪些包最适用于某些任务。

在R中,用户开发包的主要存储库是CRAN,即theComprehensiveRArchiveNetwork,综合R存档网络。

该资源对于R初学者以及正在寻找应对新挑战的方法的更有经验的R用户非常有用。

自学R时,你可能会遇到自己还不知道如何解决的问题。

知道如何以有针对性的方式寻求帮助,这样你就能够查明问题的根源,并且在理想情况下,帮你避免将来出现类似问题。

当你第一次遇到问题时,复制和粘贴遇到的错误到搜索引擎中,可能会让你访问StackOverflow、GitHub或R-bloggers等网站。

-通常情况下,有人会遇到与你相同的问题,并且可能会找到你可以使用的解决方案。

-如果没有的话,你可能需要发布自己的求助。

在这种情况下,有一些指导原则可以使帖子更高效:

最有用的方法是在示例中生成一个玩具数据集,或者使用内置于R中的数据集(请参阅R中的data()),并逐步删除代码中与要解决的问题无关的部分。

随着技能的提高,你可能会发现自己处于一个可以帮助他人的位置。

在Twitter或StackOverflow这样的地方回答问题是回馈R社区的好方法。

你甚至可以回过头来回答你自己过去问过的问题,这样你的帖子标记为“已解决”,并为下一个遇到同样问题的人留下一个有效的解决方案,帮助自己的同时也能给他人带来便利。

建立R语言流利性的最佳方法之一是与他人一起学习。

R社区充满活力,为学习R技能举办了会议、聚会和定期在线活动。

如果你不属于任何特定群体,R社区在许多社交网络上也很活跃。

R通常在Twitter上与#RStats标签讨论如下图。

一些常见科学编程语言的Twitter讨论流行度

社区的一个很好的切入点可能是以下帐户:

@rstudio、@Rbloggers、@icymi_r、@RLadiesGlobal、@R4DS、@rOpenSci

在Facebook和Reddit等网站上也存在一般和特定领域的R组。你甚至可以参加在线活动,如Twitch上的数据科学节目“切片”,观看专家们在R编程挑战(以及其他语言)中的竞争。

在线找到社区都是了解新功能、了解最新软件包、遇到其他地方可能看不到的提示和技巧的好方法。

最重要的是,保持积极性,继续编写代码。

R的开源文化为代码共享提供了丰富的资源。

一些R项目,如#TidyTuesdayR社交数据可视化项目,鼓励在线代码共享,以帮助用户获得和磨练技能。

其他活动,如每年一度的RStudioShiny竞赛,为用户制造的R产品提供了一个友好竞争的渠道,最终免费提供代码,允许用户阅读、下载和复制获奖应用程序。

如果你发现一个特别好的R产品提供了代码,请自己逐行运行代码,以了解每一行或函数的确切意思,具体起到什么作用。你可能会学到一个新的功能,可以应用于自己的项目,或者有许多方法可以完成相同的任务。

现在,许多学术期刊要求出版物中包含公开可用的数据和代码,其中许多(尤其是自然科学领域)都是用R编写的。通过从已发表的文献中下载材料,你可以了解所在领域的专家如何进行分析,使用哪些软件包,以及他们如何组织代码。

代码共享的通用平台包括GitHub、GitLab和开放科学框架(OSF)。

在线共享你的R代码将进一步增强R社区的开放性,并帮助你成为一名更加专注的代码编写者。

发布代码可能会让人感到害怕,但请记住,对科学界来说,可用代码总是比不可用代码更有价值。

R是一个非常棒的工具,可以用于统计、数据操作、可视化等,但它不一定是编程旅程的终点。

例如,为ShinyApplications设计用户界面(ui)将帮助你建立前端web开发的基础,R的各种文本插件(例如ggtext包)将帮助你练习HTML语法,R的向量操作(apply()和purrr::map()函数族)将构建概念框架以转移到其他编程语言,如Julia或Python。

当你继续将编程技能应用于更广泛的任务时,你可能会发现对于某些任务,不同的工具会更有效或更合适。

在这些情况下,你在学习R时建立的信心和技能可能是下一次编程努力的有用跳板。

通过学习R获得的知识,以及你通过自学获得的经验,将使你受益远远超过你手头的任务。

学习R语言,可能是一个充满挫折、自我怀疑和缺乏继续动力的过程。在这里列出的10条是帮助你克服挑战、掌握新技术的最佳策略,甚至可能在这一过程中获得一些乐趣。

也希望可以帮助初学者,无论是研究生、业余爱好者还是渴望学习新工具的研究人员。

当然也不需要一次尝试所有这些规则,也不局限于这十条,你只需要找到最适合你的方法即可。

THE END
1.阅读源码的经验总结如何阅读第三方开源库 选择一些当下热门、学习价值高的第三方开源库,我认为最值得学习的第三方开源库是Volly,开源项目解析中也有对Volly的解析。 热门的第三方开源库,网上会有很多源码解析文章,首先在网上找一些源码解析文章来看看,不要忘记,我们的宗旨之一“高效”,这样就可以快速的对项目的整体框架有一个大体的了解https://www.jianshu.com/p/be86e5678252
2.如何学习源码如何学习优秀的源码如何学习源码 一、程序员的层次划分(本文只针对学习源码部分) 1、只关注项目本身,不懂就baidu一下。 2、除了做好项目,还会阅读和项目有关的技术书籍,看wikipedia。 3、找一些开源项目看看,大量试用第三方框架,还会写写demo。 (要解决什么问题?如何实现的?)https://blog.csdn.net/shengyin714959/article/details/142281091
3.如何较好的学习框架底层源码?都有自己的优势和特点,在国内TP确实用的很多,我想说的是具体学习哪个框架并不重要,我们需要选择一个安安心心的学好他的底层(如果您时间比较充裕的话,全部学习也是可以的,哈哈),因为你会了一个框架之后,其他框架你自学下很快就会上手,因为框架的核心思想基本是相通的,本文章我就拿TP来举例,我们如何学习他的源码呢https://www.imooc.com/article/284124
4.Vue源码学习之响应式是如何实现的vue.js最近接触了vue.js,一度非常好奇vue.js是如何监测数据更新并且重新渲染页面,这篇文章主要给大家介绍了关于Vue源码学习之响应式是如何实现的相关资料,需要的朋友可以参考下+ 目录 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用!【 如果你想靠AI翻身,你先需要一个靠谱的工具!】 前言 作为前端开发,我们的日常工作https://www.jb51.net/article/225377.htm
5.还不会Vue2.x源码本地调试!一前言由于自己最近准备学习vue的由于自己最近准备学习vue的源码,所以首先我得知道怎么样去本地调试vue得源码。后续也会把学习中遇到得问题、校验梳理成文章,也当作自己的学习笔记。 写在前面,我看的版本是"version":"2.6.14" 二、如何进行本地调试 首先我们找到vue2的源码地址进行本地clone https://juejin.cn/post/7081983962339508261
6.面向学生的.NET学习使用C#编程语言编程学习如何编写 C# 代码 嗨朋友们! 学习编码可能令人生畏。我们将随时为你提供帮助。 开始 获得认证 使用与freeCodeCamp合作进行的新基础 C# 认证,展示你的 C# 知识。该认证是全面的、可全球访问的,最重要的是,它是免费的,可确保世界各地的学习者都能从针对Microsoft Learn的可靠 C# 培训中获益。https://dotnet.microsoft.com/zh-cn/learntocode
7.RocketMQ消息积压,异步方案,缓存策略解决方案如何入手学习源码 最核心的一点就是查看官方文档 官方文档是所有技术中 最权威,最齐全的一个资料聚集地 有些翻译中文的网站,可能会做到更新不及时,所以还是建议直接看英文文档,借助翻译即可。也可以锻炼英文水平 首先要掌握这个技术的整体结构,有哪些功能特性,涉及到的关键技术、实现原理和生态系统等等。掌握了这些,对https://developer.aliyun.com/article/932643
8.idea看python源码mob64ca12f3496a的技术博客在上面的代码中,使用requests库获取API数据时,可以按住Ctrl并点击get函数,将打开get函数的源码,让你更好的了解它的实现逻辑。 第六步:理解和学习源码 在你打开Python源码后,仔细阅读代码及其注释,可以发现大多数库都包含详尽的解释。这会帮助你了解函数的功能与实现。 https://blog.51cto.com/u_16213443/12795867
9.源码时代成都IT培训重庆UIh5Java培训不敢去怎么办?毕业就拿近万元offer!现在的应届生都这么强?在源码毕业后,能进大厂吗?答案来了!狂欢7天7夜!源码时代11周年庆超燃来袭源码时代天府校区正式开课!2021源码时代课程更新、服务升级、就业加速:新价目标准将于4月1日正式执行 源码时代学习环境 硬核设施,舒适的环境,铸就你的美好未来https://www.itsource.cn/
10.人类高质量Java学习路线一条龙版做一个完整的项目的确很不容易,建议大家根据自己的时间、兴趣选择较新的、有配套源码的教程,保持耐心。 如何选择编程学习资源,可以看下我的原创文章:https://mp.weixin.qq.com/s/mlMql9RJCd7THt6rpGb8UA 下面推荐一些优质的、较新的项目实战视频教程 + 50 套项目源码。 https://xie.infoq.cn/article/a9fd4615c281e8ca41840ce37
11.北京大学金芝教授受邀出席云南省金芝专家工作站揭牌仪式并作学术金芝教授作源代码表示学习的报告 揭牌仪式结束后,金芝教授主要围绕源代码表示学习为软件学院师生作科研报告,详细介绍了深度学习技术如何赋能源代码分析工作。金芝教授通过主题突出的精彩报告,围绕代码表示学习发展历程及其重要意义和代码表示学习方法等方面同师生们进行了深入交流和研讨互动。针对师生提问,金芝教授给予了深入详http://www.sei.ynu.edu.cn/info/1056/2111.htm
12.macd指标背离公式源码(学习)博客macd指标背离公式源码(学习) 一、MACD顶底背离副图 DIFF:EMA(CLOSE,12) - EMA(CLOSE,26);DEA:EMA(DIFF,9);MACD:2*(DIFF-DEA),COLORSTICK;A1:=BARSLAST(REF(CROSS(DIFF,DEA),1));B1:=REF(C,A1 1)>C AND REF(DIFF,A1 1)A2:=BARSLAST(REF(CROSS("KDJ.K"(9,3,3),"KDJ.D"(9,3,3)),1))http://blog.eastmoney.com/yudi010/blog_220210785.html
13.助记词盗u秒u源码转地址转私钥可直接对接假钱包app端源码仅供学习交流使用,一切法律后果均与本站无关。 助记词转地址 + 余额更新 + 一键账号余额一键归集 大于多少u自动转走 可直接对接假钱包,具体方法已经写在教程里了 教程 本系统集合助记词转地址 + 余额更新 + 一键余额一键归集 安装教程php7.2 mysql5.6 php安装gmp扩展 安装nodehttps://www.jianshu.com/p/https://yiqucode.com/qukuailian-3696.html
14.Git--distributed-even-if-your-workflow-isnt Git is afree and open sourcedistributed version control system designed to handle everything from small to very large projects with speed and efficiency. Git iseasy to learnand has atiny footprint with lightning fast performance. It outclasses SCM tools https://git-scm.com/