媲美双摄的两倍数字变焦,Google的SuperResZoom技术是这样做到的

和具备光学变焦能力的相机比起来,数字变焦得来的照片画质往往会很差,因此人们一般也都认为,光学结构和镜头尺寸上的「压制」是移动设备靠便携性和软件算法难以跨越的。

不过对谷歌相机团队的软件工程师和计算摄影团队的首席科学家而言,借助算法挑战硬件几乎已经是家常便饭了。今年,他们就借Pixel3上的SuperResZoom对移动设备上的数字变焦难题发起了挑战。

数字变焦的难度在于如何丢失的细节进行「重建」。

在普通消费者的手机上,相机传感器元件一般只记录光线强度而不是色彩信息,要将这些收集到的光线数据变成实实在在的色彩,还需要通过位于传感器前方的拜尔滤色镜(CFA)进行转化,让红黄蓝三色得以在像素上正确排列。

也就是说,这种画面细节的丢失从我们按下快门后就已经开始了——收集到色彩信息后,成像算法必须像扫雷那样根据捕获到的像素信息对周边缺失的像素进行推测,完成去马赛克的过程。最终经过这种「猜测」重建而成的画面大约占一张照片的2/3!

显然,这种通过邻近像素平均值进行细节重建的方法非常简陋,带来的画面失真问题也很严重。虽然很多去马赛克手段都采用了更为复杂的算法,但在色彩信息受限的大前提下,能够达成的实际效果难言完美,就连那些能够借助大尺寸传感器和镜头获取到更多细节的单反相机也难逃其影响。

因此当我们在手机上手动缩放照片或通过裁剪进行放大时,算法还需要借助线性插值对原本就已经有细节丢失的图像进行进一步「猜测」补全,最终得到的照片效果自然也就更差。

但正如上面所说,图像在数字变焦放大的过程中依然有部分原始色彩信息保留了下来,这正是高速连拍与多帧合成手段排上用场的地方。而当单张图片难以满足我们的去马赛克需求时,我们就需要借助多张图片来获取同一画面场景的更多细节了——高速连拍恰好可以做到。

此前,Google已经在Nexus和Pixel手机上的HDR+算法中运用了高速连拍,通过合成多张短曝光照片来生成一张高动态范围、精细细节的合成照片。但类似的方法可以用在提升数字变焦图像精度这件事情上吗?

在天文摄影学中,DRIZZLE是一种已经流行了数十年的常用拍摄技巧——通过捕捉并合成多张拍摄角度略有变化的照片来实现2x甚至3x的数字变焦效果。这个手法又叫做多帧超分辨率采样(超采样),基本理念是将多张低分辨率的连拍照片直接合并对齐到更高分辨率的像素网格中。具体的合并对其流程如下:

在上面这个例子中,我们捕获了四帧画面,其中三帧都通过一个像素单位的平移(分别向右、下和右下)来进行色彩信息补全,补全后的图像完全无需进行任何的去马赛克操作。事实上,一些单反相机早已支持这种名为「microstepping」的拍摄方式,但一般都需要借助三脚架。

但这个技术迟迟没能来到移动设备上——因为要在移动设备上完美地进行「超采样」拍摄还必须满足几个基本条件,这当中最为首要的,是如何让镜头比传感器更好地解析画面细节来避免混叠(aliasing)。

对超级采样而言,那些不停扰动画面的烦人摩尔纹扰动却是一件好事:通过仔细纪录这些摩尔纹扰动数据,我们其实可以从中获取到大量与当前画面有关的颜色和亮度数据,而正如上文所讨论的那样,这些数据是实现超采样的关键。

换句话说,我们举着手机拍照时,不经意的「手抖」恰好能为超级采样提供必要的数据支持。

不过想要在移动设备上实现手持拍摄的超级采样还有别的挑战。

上面提到,很多单反相机需要借助特制的三脚架来进行超采样拍摄,这个拍摄过程中,我们还必须保证相机本身在拍摄位置移动和变焦过程中的绝对稳定。

对手机而言,这样的要求显然不够实际——即便光学防抖(OIS)能够对那些抖动幅度较大的相邻两帧画面进行补偿,幅度较小的自然抖动不可避免,因此当我们拿着拥有高分辨率的手机拍下一组连拍照片时,每张照片的拍摄位置都会因为抖动而存在几个像素值的差距。

但利用拍摄时的手抖却恰好能够实现优劣转化,将手持移动设备的难点变成突破点。

为了对这种「手抖」的优势进行进一步转化,Google首先会在一组连拍照片中选定一帧作为参照帧(baseframe),然后基于该帧画面对其他画面进行一一对齐。但这组连拍照片由于手抖的存在显然不能完全对齐,每帧画面中的像素也不能按照我们需要的方式进行有规律的平移,因此在对齐后,我们还需要在新的画面帧加入时对相邻两个像素进行插值,然后再进行对齐。

当然,其实也存在不会「手抖」的情况,比如当我们把手机固定在三脚架上的时候。在这种情况下,Google相机会强制光学防抖模块进行有规律的抖动来模拟「手抖」——如果你将手里的Pixel3拿得足够稳,也许会发现这个「小秘密」。

超采样的流程如上所述,原理听上去颇为简单,但实际操作起来难度不小。为了应对超采样过程中可能会出现的问题,我们还需要对算法进行大量的创新——这也是它至今没能被广泛应用在智能手机上的原因(Google:没错你们技术不过关)。具体的问题包括:

这些难题加在一起,几乎让实现超采样成为了一件非三脚架不可的技术。但Google相机团队还是通过以下路径对这些问题一一进行了攻关并最终实现了手持SuperResZoom功能:

从HDR+到去年的单摄人像,Google一直在不断探索手机摄影的可能性,而今年为我们带来的SuperResZoom,同样也算得上是利用计算摄影学(ComputationalPhotography)缩小手机与单反差距的一小步。

超分辨率概念先于智能手机出现至少十年,围绕这个话题的论文也有成百上千篇,而现在,这些灵感创意和技术探索的结晶终于转化成了可以握在手里的产品。

基于以上理论和方法,SuperResZoom在画质结果上要优于以往任何一种数字变焦手段。也正是在这个技术的帮助下,Pixel3才得以在2x变焦这个重量级上靠单摄实现媲美市面上某些多摄机型才有的变焦效果。换句话说,如果你在按下快门前手动缩放取景器进行变焦,最终得到的画面细节要比拍完后再放大进行裁剪好很多。

THE END
1.算法革命深入解析人工智能中的三大关键技术首先,我们需要理解什么是“人工智能三大算法”。这三个术语通常指的是机器学习、神经网络和逻辑推理。这三个领域虽然各自独立,但它们之间也存在交集,因为它们都是为了解决复杂的问题而设计出来的人工智力模型。 1. 机器学习 机器学习是一种使计算机能够从数据中学习并做出预测或决策的技术。这种方法允许计算机系统通过分https://www.jvahvb5c.cn/ke-ji/524264.html
2.AI时代下的高性能和自适应计算科普新疆AI赋能万物下究竟能够算出什么? 那么在AI时代,我们拥有了很大的高性能计算和自适应计算能力的时候,到底能算出什么呢?比如说我们现在需要用到导航这样的技术,我们要找到目的地,要知道从出发地到目的地会经历什么。这其实就需要一个算法和一些运算在背后的支撑。所以这些自适应计算和高性能计算,它们到底在算什么?我们http://kpxj.scimall.org.cn/resource/detail?id=32785
3.智能革命赋能未来的人工智能技术体系构建二、算法之父:人工智能的基石 人工智能的发展离不开强大的算法支持。深度学习、自然语言处理和计算机视觉等领域的算法是目前最前沿的人工智能技术。这些算法能够模仿人类大脑的工作方式,通过大量数据进行训练,以提高模型预测和决策能力。 三、数据驱动:人工智能的能源源泉 https://www.d9xmz5u1j.cn/shou-ji/530808.html
4.CICC科普栏目人工智能十大基础算法图示这篇文章将对常用算法做常识性的介绍,没有代码,也没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的。 决策树 根据一些 feature(特征) 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的https://mp.weixin.qq.com/s?__biz=MzA4ODcwOTExMQ==&mid=2655797149&idx=6&sn=733bdd52fc91a4ef317b4de15b26094d&chksm=8a3ae82e85c8422d452d7c7f2596f17c8230de97324fd7cbf423e4bc2e9a93b9b9c1b8fc7ebd&scene=27
5.一个生成伪随机数的超级算法转伪随机数生成算法什么叫伪随机数? 真正意义上的随机数(或者随机事件)在某次产生过程中是按照实验过程中表现的分布概率随机产生的,其结果是不可预测的,是不可见的。而计算机中的随机函数是按照一定算法模拟产生的,其结果是确定的,是可见的。我们可以这样认为这个可预见的结果其出现的概率是100%。所以用计算机随机函数所产生的“随机数https://blog.csdn.net/LVXIANGAN/article/details/73290257
6.广东岭南职业技术学院3、(3)在TCP/IP网络中,传输层什么进行区分服务? A、IP地址 B、端口号 C、主机名 D、MAC地址 答案:B 4、(4)下列哪个协议不属于传输层协议? A、UDP B、OSPF C、RIP D、TCP 答案:BC 5、(5)OSI参考模型从下至上排列顺序为? A、物理层、数据链路层、网络层、传输层、会话层、表示层、应用层 http://exp.lnc.edu.cn/suite/portal/popupView.do?feature=testPaper&action=previewTestPaper&testPaperKey=32389442
7.超级算法时代的末日预言超级算法时代的末日预言 在人工智能技术不断进步的今天,我们似乎已经站在了一个历史巨轮即将翻转的边缘。随着算法的不断优化和深度学习技术的飞速发展,AI正在逐渐从简单的人机交互向更高层次、更为复杂和自动化的地位迈进。这不仅引发了社会各界对于未来世界秩序的大讨论,也让我们不得不面对这样一个问题:人工智能结局https://www.alw39icut.cn/zhi-neng/550832.html
8.魅族16s评测855旗舰100%打磨下的细节狂魔(全文)魅族16s从样张中可以看出,依托于多针堆栈算法的超级夜景,展现的黑夜十分通透,并且噪点极少,明暗处拥有较高的宽容度,属实美观。 2000万前置自拍样张 自拍方面,魅族16s传承了前代16th较小的2000万相机模组,并且像ArcSoft(虹软)算法、前置HDR逆光自拍、AI美颜等功能,该有的都拥有。 https://mobile.zol.com.cn/714/7148808_all.html
9.什么是柚子币(EOS)?EOS币的前景如何?币种百科区块链5.加入拜占庭共识算法 在EOS中,超级节点出块时,除了需要签名以外,还需要其他21个超级节点的签名,至少有15个签名,这个区块就被认为不可逆的,而这个过程可以在1秒内达到。 6.安全性 在区块链三角悖论,去中心化程度、安全、效能当中,EOS稍微放弃去中心化的制度,给由类似代议民主的方式来运行区块链;相对的EOS也提升https://www.jb51.net/blockchain/888494.html
10.超级打板算法理想股票技术论坛超级打板算法是一种利用股票技术分析和指标公式选股的高级策略,它可以帮助投资者快速发现潜力股,并有效地进行买入卖出操作。通过精准的打板选股策略,投资者能够在股票市场中获取更高的收益。本文将介绍超级打板算法的原理、方法和实操技巧,帮助投资者提升选股能力和投资https://www.55188.com/tag-1912088.html
11.[超级新闻场]网约车“算法”岂能变成“算计”?[超级新闻场]83岁爷爷龙舟“跳艄” 火遍全网 [超级新闻场]合肥一社区组建“合伙人” 巧治居民事 [超级新闻场]江苏小伙开工作室 帮上万人修复老照片 [超级新闻场]离婚了 高额彩礼能退吗? [超级新闻场]夏天雨水增多 行车务必减速 [超级新闻场]“秃”如其来的“鬼剃头” 需要治疗吗? [超级新闻场]http://m.app.cctv.com/vsetv/detail/C10140/83c58966942e4b73bfb7e3dba759931d/index.shtml
12.张一鸣为什么总有远超他人的认知?很多人思考过这个问题,互联网信息的链接和流动会不会也有一个临界点?过了这个临界点后会不会出现一个互联网超级生命体?这是互联网伦理里非常重要的一个问题。 一个被数据和算法喂养出来互联网超级生命体,能否与良知、善意和爱挂钩?它到底是人类的工具还是人类的终结者呢? https://maimai.cn/article/detail?fid=1639993829&efid=RtMP6jr3NOaoOMHlIFAIYA
13.当前训练神经网络最快的方式:AdamW优化算法+超级收敛机器之心最优化方法一直是机器学习中非常重要的部分,也是学习过程的核心算法。而 Adam 自 14 年提出以来就受到广泛关注,目前该论文的引用量已经达到了 10047。不过自去年以来,很多研究者发现 Adam 优化算法的收敛性得不到保证,ICLR 2017 的最佳论文也重点关注它的收敛性。在本文中,作者发现大多数深度学习库的 Adam 实现都有https://www.jiqizhixin.com/articles/2018-07-03-14
14.POC分布式节点算法机制下的超级节点计划你只有相信区块链技术,自己才会去学习研究。如果有一天你真的希望在区块链领域做点什么,POC可能是一个不错的选择。有一个习惯性的意识误区是,算力糖果Power Candy不仅仅是一个独立的项目体存在,他同时形似于一个孵化平台,超级节点的打造就将成为下一步的重点战略计划。https://www.jianshu.com/p/9f541a8f2f78
15.程雪军AIGC浪潮下超级人工智能平台算法黑箱的治理路径在人工智能信息等技术驱动下,以ChatGPT为代表的生成式人工智能(AIGC)快速发展,推动了超级人工智能平台的日益兴起。不同于其他大型与中小型人工智能平台,超级人工智能平台在用户规模、业务种类、经济体量与限制能力层面的要求更高,具有更加显著的数据、算法与算力优势。然而,算法具有内在的技术缺陷,导致超级人工智能平台的https://www.jfdaily.com/sgh/detail?id=1241499
16.ANSYSFLUENT16.0超级学习手册FLUENT是国际上流行的商用CFD软件包,包含基于压力的分离求解器、基于压力的耦合求解器、基于密度的隐式求解器、基于密度的显式求解器。它具有丰富的物理模型、先进的数值方法和强大的前后处理功能,可对高超音速流场、传热与相变、化学反应与燃烧、多相流、旋转机械、动/变形网格、噪声、材料加工复杂激励等流动问题进行精https://labs.epubit.com/bookDetails?id=N31288
17.费米悖论与收益递减,超级人工智能与人类社会将会怎样相互作用Daniel Vallstrom提出了一些创新的技术和模型,这些技术和模型对于理解超级AI的行为和可能性至关重要。 快速殖民星系算法的解读 Vallstrom提出的快速殖民星系算法基于超级AI寻求最有效率的方式来扩展其影响范围的假设。该算法考虑了资源的可用性、能源的效率以及殖民活动的成本效益。通过这个算法,我们可以更好地理解超级AI可https://www.51cto.com/article/785680.html
18.数据分析框架:实现99%准确率Jinliang定义问题:俗话说,不要把车放在马前。在解决问题之前,必须要明白问题是什么,而且可以应用以前的模型或者算法,而不是直接尝试新的方法。 收集数据:约翰·奈斯比特在他1984年的书“大趋势”中写道,我们“淹没在数据中,但仍然需要知识。”所以,数据集已经存在于某个地方,某种格式。可能是外部或内部的,结构化的或非结https://www.cnblogs.com/jin-liang/p/9884411.html
19.让Zara沉默,让H&M流泪,这个国产品牌算是把快时尚玩明白了说Shein是家服装公司,不如说这家超级女装工厂是个算法和系统驱动的巨型机器人,总部是大脑,末梢神经供应商遍布广州一个叫番禺的小镇。 在与Shein合作的服装工厂里,每个工人都在Shein的指令下流水作业,车间里循环播放抖音金曲串烧,以振奋工作情绪,50多个工人就能组成一个完整的流水线,他们都听从一个叫SCM(Supply Chainhttps://36kr.com/p/2005316657319815
20.超级推荐单元和定向有什么关系?其是如何引流?超级推荐单元和定向有什么关系?其是如何引流? 定向算法上,超级推荐重新架构了定向形式,从拉新,重定向划分帮助大家挖掘潜在需求和进行消费者的二次触达召回。新平台在人群上采用了独立出价的形式,可以让商家们更加自主的选择要投放的人群。 说到超级推荐的营销工具的目的是协助卖家完成商品营销,让我们宝贝曝光在我们精准https://www.maijia.com/article/532103
21.FPGA是什么(超级详细)FPGA 介于软件和硬件之间,用它做接口、做通信,它就偏向硬件;用它做算法、做控制,它就偏向软件。随着人工智能、机器视觉的崛起,FPGA 更加偏向软件算法的异构,有和GPU一争高下的潜力。 FPGA 与 GPU 性能对比图如图 10 所示: 图10 FPGA与GPU的性能对比图 https://www.elecfans.com/d/2112209.html
22.让亿万白领失业的“超脑”解密IBM沃森前世今生可惜97年时还不存在社交网络,普通人对人工智能也没有什么概念。“深蓝”的胜利如同一块石头落入水中,激起一圈波纹,又很快归于平静。“深蓝”随后也被拆除,送入博物馆。但IBM开发人工智能(有别于今天运用深度学习的人工智能)的经验、一些关键算法,以及用计算机挑战人类专家的热诚,保留了下来。 https://zhidx.com/p/74734.html
23.小米科技:融合无障碍设计的创新之道技术公益影响力案例①小米运用其自行研发的声音适配算法和超级拟人语音合成技术,为语障用户塑造独特的“个人声音”,这项技术的实现过程经历了以下步骤:首先在内部招募二百多名志愿者进行声音捐赠,通过声纹适配算法,从捐赠者声音中筛选出与语障用户声音特征最为相近的音色,作为定制声音的基础;接着借助超级拟人技术,小米训练AI模型,赋予定制声https://www.zgcsj.com/yxlcs/2024-04-26/43.shtml
24.题解#星球游戏#算法二:超级源点汇点+最短路径 算法思路 在上面的过程中我们会发现,我们的SPFA过程中,会跑过很多重复的路径 反复做这些过程,不仅耗时间,而且耗费空间 所以我们有什么办法能省去这些过程呢?如何优化成了本题的重点 我们假设图为这样 绿色代表牛牛的星球,红色代表牛妹的星球 https://www.nowcoder.com/discuss/353149449826410496