范阳谈深科技全栈式机器学习(fullstackML)驱动的科技公司

勇敢乐观的人总会乐于学习新事物,并且融会贯通到自己的事业里。在这个时代,能打开新世界的大门,激起人们好奇心和希望憧憬的技术并不多,我自己最有热情去深入学习和实践的就是以合成生物学为代表的新的生命科学,以及人工智能与机器学习,他们非常复杂,但是又接近世界的本源。

AI+Bio结合的意义是为人类和生灵万物创造一个和谐共生且繁荣的未来。在人工智能有一天真正实现智能生物的超越之前,我相信它的使命是用数字世界积累的先进能力,帮助物理真实世界改善不可持续的体系和生态环境,以及进入到普通人生活的日常,让他们的身心更强,生活更好。

1.就像过去20年特斯拉走过的路,人工智能未来将会驱动最大的机会在于科技还很少直接影响到的世界上规模最大的工业和消费市场。

AI/ML+生物医药,长寿科技,心理健康,神经科学=个人化精准健康保健

AI/ML+合成生物学+生物制造+先进材料科学->去中心化自然资源和物质材料再生产->生产方式到终端消费品革新->未来的服装,家居,建筑,交通工具等。

AI/ML+基因编辑+农业科技+机器人技术+蛋白质设计+合成生物学+3D打印->农业生产方式到食品价值链革新->消除代谢类疾病,增强身体机能

以上只是三个领域简要概括的例子。

在这些领域我相信会出现高度垂直集成的全栈科技公司(full-stackstartups),简化缩短且重新设计以前产业的价值链条,创造新价值,并且捕获全新行业大部分的经济价值。

会卖很多卡的英伟达CEO谈ChatGPT

在与AI4Science,AI+Industry领域的一些研究者和工程师交流后,我现在的观点是:

1)生命科学Bio

2)人的身体和心灵Humanbodyandmind

更好获取和运用这两方面数据的公司,将创造巨大的价值,且拥有训练价值最大的SystemofIntelligence的能力。

此处补充一个观点,来自于我的朋友在美国研究机器学习和材料科学,蛋白质设计的严克强博士:

“可能被打开的全新domain的数据资源需要看现在大家的行为模式习惯,照片被打开是因为大家喜欢拍照并已经普及,跟群体习惯有着巨大的关联。另一个有潜力的数据源来自高通量计算并获得的数据,比如AlphaFoldDB,但数据质量不能保证,是否真实也不一定保证。”

那未来获得大量生物领域的数据与人有关的身体和心理模式的数据,还需要依靠其他领域科技的进步,成本的下降到新的范式的普及。

在OpenAI这样的公司取得阶段性成功后,我们看到国内也有成功的企业家投入了基础模型的创业大潮,美国那边也出现很多AI生态当中“第一层应用的公司”,就像iphone刚出现时候,第一批应用随之而来的就是帮助我们创建新头像,剪视频,提高工作生产力的工具等等。但是我们如果放眼历史和更大的图景,我想最大化利用机器学习和人工智能进步能力的机会,可能在于那些更开阔但又被忽视的领域,现在的问题就是有多少人敢于去发现这些机会。

最适合科技创业公司的机会,不应该是传统认知所说的“lowvolume,highmargin(低市场规模,高溢价)”的市场(比如医疗医药),也不应该是"highvolume,lowmargin(高市场规模,低溢价)”的市场(比如大宗工业原材料产品),而是“highvolumeandhighmargin”市场,highvolume往往意味着世界上规模最大的消费者市场(衣食住行),highmargin是需要敏锐的市场洞察力和世界顶尖的产品能力去获取的。

原文链接在文末。Enjoy!

2.什么是全栈式机器学习驱动的科技公司?

建立一个全栈式机器学习公司的案例

Thecaseforbuilding

afull-stackmachinelearningcompany

原文作者:NathanBenaich

在通往成功的道路上,一家初创企业必须解决两个关键问题。第一个问题是开发和销售一个为用户创造重大新价值的产品。第二个问题是获取该价值其中足够大的比例。

范阳注:valuecreation&valuecapture,比如搜索引擎公司Google和社交网络公司Meta与航空运输公司(让人们可以自由飞翔到全世界)一样,都为这个世界上的人创造了同样巨大的新价值,但是他们捕获价值的能力是不一样的。以往纯技术公司只想着创造科技价值,而忽略了捕获商业价值的能力,而纯营销驱动的公司又缺少创造新价值的能力。

在网络市场、软件即服务(SaaS)业务、企业软件和消费者互联网产品的时代,已经有关于解决这两个问题的游戏规则。

然而,今天的企业正在一个新的战场上竞争,开发由机器学习(machinelearning,以下简称ML)技术来独特实现的产品。这块新生的地盘还没有完善的游戏规则。

从我作为AirStreetCapital的投资者,专注于人工智能为先的技术和生命科学公司的位置来看,我认为在ML中获取商业价值的最佳方式是通过全栈开发的方式,直接从你的模型预测能力中收取全部价值,而不是把机器学习模型当作软件一样收取服务费。

全栈式ML公司吃掉他们的行业问题价值链

Full-stackMLcompanieseattheirproblemvaluechain

在其最现实的实例中,ML最好是作为一个自动任务解决者(automatictasksolver)使用。为了说明这一点,让我们考虑监督学习的模式(supervisedlearningparadigm)。只要有足够的高质量训练数据,一个ML系统可以被训练成从它以前从未见过的真实世界输入数据中做出高质量的预测。这里重要的是系统输出的质量(qualityofthesystem’soutput)和系统可以部署的规模(scaleatwhichthesystemcanbedeployed),同时仍然提供经济价值。创造的价值量将随着几个变量的变化而变化。这些变量可能包括用户类型(大型公司与小型企业),目标任务对他们的工作流程有多重要,这个工作流程与企业的利润或成本中心有多紧密,以及如果解决了这个任务环节的瓶颈,工作流程有多少可以被吃掉(缩短)。

例如,一家企业可能会购买由ML驱动的软件,以保护他们的员工免受网络安全威胁,而这些威胁是他们自己的IT部门所不能检测的。在这种情况下,传统的ML公司可能会提供新颖的建模工具或预先训练好的模型,以帮助IT部门开发一个自制的安全解决方案,或为他们现有的第三方软件解决方案的检测性能加buff。相比之下,全栈式ML公司将端到端解决这个安全问题。它可能通过将数据收集、注释、探索、建模、工程、测试、系统集成和云/企业内部基础设施部署抽象为一个单一的产品,为用户提供威胁预测和解决方案。因此,全栈式ML公司的产品往往包含了传统ML公司所提供的上游或下游的解决方案组件。

全栈式ML公司的历史:直接实现预测能力变现

Ahistoryoffull-stackMLcompanies:Directlymonetizingpredictions

ML中的端到端问题解决模式并不新鲜。为了说明这一点,让我们考虑在过去20年里这个主题的四次浪潮。

第一个实例(90年代至00年代)是在量化交易中。DEShaw、RenaissanceTechnologies和TwoSigma等公司创建和策划金融市场数据,建立ML模型以产生交易策略,并通过他们自己的基金直接将这些交易货币化。他们并没有把自己的竞争优势作为软件卖给其他对冲基金。

现在有第四类全栈式ML公司,它们正在连接比特和原子的世界(worldofbitsandatoms.)。在这里,公司正在使用ML软件来发现物理真实产品和现实世界环境解决方案空间中的新的局部最大值。他们提供的解决方案超出了人类专业技术通过试错所能组合在一起的范围。

例如,Zymergen正在设计和改造细菌宿主(bacterialhosts),以制造无法从石化产品出发的各种新型材料。OptimalLabs正在建立室内农业控制系统,可以自动操作温室,优化植物生长和财务利润。LabGenius和RecursionPharmaceuticals正在将基于ML的自动化实验生物学数据分析与基于ML的药物设计和性能预测串联起来,以开发人类疾病的新型疗法。最后,PolyAI建立了一个最先进的ML平台来创建对话式代理,并将这个平台注入其拥有和运营的现有呼叫中心,以推动工作流自动化水平和盈利能力的提高,同时确保高质量的客户服务水平。

什么时候进行全堆栈是有意义的,有什么好处?

Whendoesitmakesensetogofull-stackandwhatarethebenefits

建立一个全栈式的ML公司显然比建立一个传统的ML公司在操作上更加复杂,后者类似于我们今天所习惯的纯SaaS游戏。然而,对于那些跃升为全栈的ML公司来说,有许多好处。

高风险的实验

High-riskexperimentation

克服采用新技术的惰性

Overcomingadoptioninertia

在最终价值来自于做出更好的运营或商业决策的问题领域,全栈式ML产品用端到端的ML决策(end-to-endMLdecision-making)取代组织内部的人工决策(on-premisehumandecision-making)。全栈意味着可以抽象出大部分的中间决策点,否则需要大量的内部人类决策者,而且容易出错,操作缓慢。相反,人们可以专注于最有价值的最终决策。此外,让客户的运营人员采用新工具往往比让自己的运营人员采用新工具更难。其根本原因包括对变化的抵制,缺少激励机制,以及雇佣"有前瞻性"的运营人员(forwardthinkingoperators)的能力。因此,抽象化这些采用新技术障碍有助于加快进入市场的节奏。

市场成熟度

Marketmaturity

商业壁垒

Defensibility

价值归属问题

Thevalueattributionproblem

传统的ML公司通常将他们的核心技术或产品作为API或SaaS来销售。这种产品往往只解决了(某一行业)问题价值链的一小部分问题,他们专注于技术团队最熟悉的东西:设计和训练ML模型以进行高质量的预测工作。

从价值获取的角度来看,这种策略通过技术的标准商品化导致利润被压缩。更重要的是,这种模式当中全部是客户提供给他们数据、商业领域的知识和评估标准(即“我来告诉你好的产品是什么样子”),渠道端也是客户带来的,即触达他们终端客户或内部用户的方式。ML公司能带来什么核心价值呢?简单地说,这将类似于"更好的数学"。使这一策略更加脆弱的是,ML公司经常处理处在其客户核心竞争力边缘的预测问题,例如为银行承保信贷的客户风险评分。除非公司客户成熟到了解如何将这种技术部署到他们的终端产品中,否则这些公司就没有充分发挥其潜力,并使购买决策更加困难。

未来属于全栈式的发展!

It’sfull-stackahead!

互联网现在已经成熟到可以上升到只是包装成消费者、SaaS或市场平台(marketplaces)的产品的低垂机会已经很少了。创造价值的新机会正在一些人所说的传统经济中出现(如工业、医药和农业领域)。在这里,ML公司如果采用全栈式公司的方针,就有很大的机会创造定义一个新类别的业务机会。这些传统市场的现有参与者并不习惯于通过互联网购买软件,而且往往没有具有成本效益(即可扩展的)的分销渠道。全栈式ML公司有更大的机会踢掉现有的公司,并将自己安置为其领域的长期所有者。

THE END
1.机器学习特征工程,全面指南!51CTO博客特征机器学习特征工程和选择是将数据转化为最佳表示的艺术,以大大提升机器学习的效果。本指南是初学者的简明参考,提供了最简单但广泛使用的特征工程和选择技术。 1 基本概念 1.1 什么是机器学习 机器学习是让计算机在没有明确编程的情况下进行操作的学科——阿瑟·塞缪尔 机器学习是一种数据科学技术,它帮助计算机从https://blog.51cto.com/u_15671528/12853750
2.Microsoft机器学习产品和技术概述Azure Data Science Virtual Machine使用预安装的数据科学工具的虚拟机映像使用 Jupyter、R 和 Python 等工具在自己的 VM 上开发机器学习解决方案。 ML.NET开源的跨平台机器学习 SDK开发适用于 .NET 应用程序的机器学习解决方案。 Windows AIWindows 设备上的已训练模型的推理引擎将人工智能功能集成到 Windows 应用程序https://docs.microsoft.com/zh-cn/azure/machine-learning/service/overview-more-machine-learning
3.人工智能基础机器学习入门指南机器学习是一种数据分析技术,它允许计算机系统通过经验自动改善其性能。这种方法的核心在于算法,这些算法能够从数据中学习,并根据这些数据做出预测或决策。 为何需要学机器学习? 在现代数字化时代,数据驱动的决策变得越来越重要。然而,处理和分析大量复杂的数据集并非易事。因此,了解和掌握机器学习技术对于任何希望利用大数https://www.206sk8xl.cn/zhi-neng/596412.html
4.ACC.24丨聚焦血脂领域,盘点即将公布的最新研究进展!医药新闻1118. It's not just About the LDL: Complexities in Cholesterol Management 北京时间:23:00 ESOPHAGEAL INVOLVEMENT OF STATIN-INDUCED NECROTIZING AUTOIMMUNE MYOSITIS, A HARD PILL TO SWALLOW 难以吞咽的他汀类药物诱导的坏死性自身免疫性肌炎的食管受累 https://bydrug.pharmcube.com/news/detail/f32d3541817104045c1a61f05ffaf772
5.50Gbit/sEPON中基于预测的多波长带宽分配算法期刊[3]苏彩玉,万海斌.基于改进机器学习的无人机中继通信数据调度控制研究[J].计算机测量与控制.2024,32(5).DOI:10.16526/j.cnki.11-4762/tp.2024.05.016. 光通信研究 北大核心 ISSN:1005-8788 年,卷(期):2021(5) 所属栏目:光通信系统与网络技术 https://d.wanfangdata.com.cn/periodical/gtxyj202105003
6.GitHubpassats/GitHubChineseTopskywind3000/awesome-cheatsheets 超级速查表 - 编程语言、框架和开发工具的速查表,单个文件包含一切你需要知道的东西 ? 6.2k Shell 08/12 248deeplearning-ai/machine-learning-yearning-cn Machine Learning Yearning 中文版 - 《机器学习训练秘籍》 - Andrew Ng 著 6.2k CSS 04/05 249yifeikong/reverse-https://github.com/passats/GitHub-Chinese-Top-Charts/tree/0d1513dd64f6d985a72d257b7672bcdd8a4aa348
7.PyTorch2.2中文官方教程(三)(2)布客飞龙 | 7月前 | 机器学习/深度学习 PyTorch 算法框架/工具 PyTorch 2.2 中文官方教程(十八)(4) PyTorch 2.2 中文官方教程(十八) 112 1 1 布客飞龙 | 7月前 | PyTorch 算法框架/工具 异构计算 PyTorch 2.2 中文官方教程(二十)(4) PyTorch 2.2 中文官方教程(二十) 130 0 0 布客飞龙 | 7https://developer.aliyun.com/article/1482488
8.一直r198it‘snotatwowayplottype怎么办?求助各位大神,一作图他就提示r198 it‘s not a twoway plot type怎么办? code 如下 twoway (connected m_employmentrate year2 if graphobs == 1 & T==1, m(O) lc(navy) mc(navy)) /// > (connected m_employmentrate year2 if graphobs == 1 & T==0, m(Th) lc(maroon) mc(maroon)) https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_6363201_1.html
9.机器学习:开启智能未来的钥匙腾讯云开发者社区机器学习作为人工智能的核心方法,通过分析数据中的隐藏规律,让计算机从中获取新的经验和知识,不断提升和改善自身性能,从而像人一样根据所学知识做出决策。 机器学习涉及概率论、统计学、微积分、代数学、算法复杂度理论等多门学科,是一门多领域交叉学科。其应用范围极为广泛,涵盖自然语言处理、图像识别、推荐系统、金融https://cloud.tencent.com/developer/article/2478495
10.第21届WebbyAwards威比奖广告与媒体类获奖作品精选由于公众社交媒体上是不允许发布裸露的照片,所以这次活动主题" CHECK IT BEFORE IT'S REMOVED " 显然一语双关,巧妙类比 Facbook 和 Instagram 严格的审查制度,让年轻女性从中感受到此事的急迫性。 Agency: DDB Group Germany Best User Experience 最佳用户体验/https://www.digitaling.com/articles/37419.html
11.杰夫贝佐斯写给股东们的信It'sAllAboutLongTerm“我们正处在显而易见的大趋势中:机器学习和人工智能。” “大部分机器学习带来的影响都是这样,潜移默化地改变了我们的核心的运作方式。” /高速决策/ “绝对不要使用一刀切的决策流程,很多决策都是有回路的,这些决策的过程可以更轻量化。” “不同意,但执行。” https://www.jianshu.com/p/ffc4a1af8669
12.It’sabinaryworld,这是一个要和不要的世界我认为,随着推荐算法,机器学习以及真人工智能的进步,我们人类正在通过一个又一个号称”更懂你“的应用程式,逐渐把绝大多数用户的生物大脑转化为机械开关:你就说你要还是不要,剩下的你不用管,怎么做你更不用管。换句话说,我们逐渐贡献我们的各种数据给机器,以换来在每一个场景下的”傻瓜化“。https://www.tmtpost.com/177723.html
13.nvidialogoNeMo Curator and Cosmos Tokenizers Supercharge Developers Just announced—NVIDIA NeMo? will support end-to-end pipeline for developing multimodal models. Generative AI?|?Blog Consulting Giants Team With NVIDIA for the Era of AI IT giants creating jobs, training over half a million developershttps://www.nvidia.com/
14.Askforadoctorasquicklyaspossibleandtellhimit'sa( )是机器学习中一种基于对数据进行表征学习的方法,是一种能够模拟出人脑的神经结构的机器学习方法 A. 人工智能 B. 深度学习 C. 人工神经网络 查看完整题目与答案 下列指标中,与顾客目标有关的是() A. 提高产品质量 B. 股票收益性 C. 工资水平 D. 降低产品价格 E. 改善服务水平https://www.shuashuati.com/ti/b754531da3f74b2aafe4c0e590a248eb.html?fm=bdbds854b5134c61c52f14b3b1c74b696bd26
15.位华人科学家当选占比超20%,获75000美元科研奖金Simon Shaolei Du (杜少雷),华盛顿大学 杜少雷目前是华盛顿大学 Paul G. Allen 计算机科学与工程学院的助理教授。他的研究兴趣广泛地集中在机器学习方面,如深度学习、表征学习和强化学习。 在入职华盛顿大学之前,他曾是普林斯顿高级研究所的博士后,导师是 Sanjeev Arora。他还在 CMU 获得了博士学位,导师是 Aarti Singhhttps://www.ithome.com/0/751/327.htm
16.文本分类(1)文本预处理文本分类it's替换为tis预处理过程中需要把英文缩写进行替换,如it’s和it is是等价的,won’t和will not也是等价的,等等。 text = "The story loses its bite in a last-minute happy ending that's even less plausible than the rest of the picture ." text.replace("that's", "that is") https://blog.csdn.net/weixin_44766179/article/details/89855100
17.分词技术(精选十篇)[1]http://forfuture1978.iteye.com/blog/691017. [2]费洪晓,康松林,朱小娟,等.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,(7):67-68. [3]吴应良,韦刚,李海.一种基于N-gram模型和机器学习的汉语分词算法[J].电子信息学报,2001,23(11):1148-1153. https://www.360wenmi.com/f/cnkeyotdwqmm.html
18.最强通用棋类AI,AlphaZero强化学习算法解读the best moves can involve sacrificing in the short-term to have better gains in the long-term. In the Dots and Boxes game, sometimes it’s better not to score a box to avoid gaining another turn, and instead, force the move back to the opponent. We would then have to tune our evalhttps://www.flyai.com/article/770
19.otter水獭实时英语音频翻译软件教育优惠edu邮箱注册申请直接用edu教育邮箱注册一个otter.ai账户,上面的教育优惠图里,点击里面蓝色框内容“Get Otter now, it’s free” edu电子邮件会收到一封Otter官方发来的确认邮件,请确认您的电邮地址 点击下面的按钮,以验证ajones@xxxx.edu是您在注册过程中提供的电子邮件地址。 登录主页 我们验证邮箱成功后会进入到Otter个人主页页https://www.liout.com/otter%E6%B0%B4%E7%8D%AD%E5%AE%9E%E6%97%B6%E8%8B%B1%E8%AF%AD%E9%9F%B3%E9%A2%91%E7%BF%BB%E8%AF%91%E8%BD%AF%E4%BB%B6%E6%95%99%E8%82%B2%E4%BC%98%E6%83%A0edu%E9%82%AE%E7%AE%B1%E6%B3%A8%E5%86%8C%E7%94%B3.html
20.译科技什么?!有人模仿你的脸,还有人模仿你全身?新闻频道例如,一个人在深度换脸视频中戴了与其不相配的耳环。而在2018年9月,人工智能基金会筹集了1000万美元,通过机器学习和人类调解员创建了一个识别深度换脸和其他恶意内容的工具。 但是,托马斯仍然怀疑技术是否能完全解决深度换脸的问题,不管它们采取什么形式。她认为建立更好的系统来识别深度换脸是有价值的,但她重申,其他https://news.hexun.com/2019-09-29/198722790.html
21.awesomegoshield star:152 贝叶斯文本分类器,具有灵活的tokenizers和存储后端。 go-fann star:112 快速人工神经网络(FANN)库的Go bindings。 go-featureprocessing star:88 快速和方便的特征处理,低延迟机器学习在Go。 goscore star:85 为预言模型标记语言(PMML)实现的评分API。 gonet star:77 基于go的神经网络。 https://gitea.mrx.ltd/Go-pkg/awesome-go-cn/src/commit/718c7bcaa421d50c5aba70af947383044aaa9dd3/README.md
22.姑息治疗:不只是临终关怀MOOC中国Easing Physical Symptoms: It's Not Just Hospice Anymore Palliative care provides important support for people living with serious or life-limiting illnesses and their family caregivers. In this course, you will learn to use symptom assessment tools to better understand which symptoms are present andhttps://www.cmooc.com/course/23173.html
23.Here’swhyApplebelievesit’sanAIleader—andwhyitIt's used for live translation in iOS 14. Apple It's used for live translation in iOS 14.Apple AI is behind the automatic positioning of home screen widgets. Apple AI is behind the automatic positioning of home screen widgets.Apple http://arstechnica.com/gadgets/2020/08/apple-explains-how-it-uses-machine-learning-across-ios-and-soon-macos/
24.it’s+dangerous+to+Don’t+run+on+the+road为什么要Don’t句子 “it’s dangerous to Don’t run on the road” 包含了一个错误。正确的表达应该是:1. “It’s dangerous to run on the road”:这句话表示在道路上跑步是危险的,提醒人们不要在道路上跑步,因为可能会发生交通事故或其他危险。2. “Don’t run on the road”:这是一句明确的命令https://wen.baidu.com/question/1807380912271782507.html