空间计算行业深度分析:空间计算是一种时代颠覆且必然到来

2023-11-02 18:46:24   来源:新浪VR

  (报告出品方/作者:安信证券,焦娟)

  1。摘要

  交互硬件与计算平台彼此焦不离孟,空间计算极具颠覆性且必然到来,Apple Vision Pro 是 一款里程碑式硬件,有望再次书写历史。本篇报告通过回顾交互硬件 50 年发展史,从人使用硬件的角度出发,至少能够得出两点特征或结论:1)人与硬件之间的交互是越来越自然的,越来越贴近人使用工具的自然习惯,智能手机的触控交互就比个人 PC 的键鼠交互更加自然;2)新的交互硬件总能生长出最适配的计算平台,且软硬一体化的趋势越来越强,基于智能手机的移动互联网生态就显然比基于电脑的互联网生态发展得更加繁荣。交互硬件与计算平台是相辅相成的,在可以预见的下一代交互硬件 VR/AR/MR 之上,也一定会适配全新的计算平台。我们认为,最有潜力接棒成为下一 代计算平台的就是“空间计算平台”,将全面颠覆平面计算的范畴,帮助人实现虚拟与现实之间的连通与融合的计算过程。

  从平面到空间的计算升维,是用新的成体系技术,对老的技术体系进行“降维打击”。这种过渡的颠覆性,不论从技术、产业链、还是思维模式层面,都不能用过去的经验类比。所谓的垄断巨头也是时代所造就的,在上一轮的竞争当中取得绝对优势,但是往往也可能会在技术、商业思维等层面因循守旧,而被下一代的新兴力量“降维打击”。空间计算的技术和体验拐点已经到来,Apple Vision Pro 就是里程碑式产品。在 PC 时代与智能手机时代,苹果已经多次证明过其定义行业拐点的成功经验——1984 年推出的 Macintosh、2007 年推出的 iPhone,2023 年发布的 Vision Pro 有望再次书写历史。Apple Vision Pro 预测并描绘了一个全新的空间计算概念,且苹果有能力预测一代又一代的标杆式 产品并有能力把这些预测变成行业的共识和现实。

  本篇报告亮点之处在于从定性与定量的双重视角定义空间计算以及比较空间计算的能力指标。定性视角下,我们按照“输入-计算-输出”的分析框架重新定义了空间计算的概念;定量视角下,我们以 Apple Vision Pro 为基准构建了一套空间计算能力的量化评分体系。空间计算的定义是,在三维的基础之上,以人为本,连通及融合虚拟世界与现实世界的一个全新的计算范式。“在三维的基础之上”,是指空间计算的客体对象如果本身是三维的,不再需要从三维降维至二维的平面以方便计算和跟用户的交互,而是可以保持为立体的三维的,这是空间计算的基础。“以人为本”,是指空间计算的主体仍然是人,空间计算的目的是服务人与虚拟世界的交互。“连通与融合虚拟世界与现实世界”则描述了空间计算的过程与适用范畴。

  与平面计算概念相区分,平面计算只涉及人同虚拟世界基于 2D 界面的交互,但空间计算,是涉及人、虚拟世界,现实世界三方的交互,在输入、输出、计算三方面关键能力上空间计算与平面计算也存在显著差异。(1)输入-指令型的能力,主要体现在信息形态的差异。平面计算是以文字和图像为主,空间计算则包括文字、声音、图像、动作等多种形态。(2)输出-感受型的能力,主要体现维度数量的差异。平面计算是以二维视觉和听觉为主,空间计算则以三维视觉、带空间定位的三维听觉,或者称空间音频为主。(3)计算能力则最为关键,主要是在算力需求上差异巨大。跟平面计算相比,空间计算在计算的精度、广度、速度等方面有倍数级的提升,与平面计算显著拉开差距。定量视角下,我们首先横向比较了各主力 VR 设备的硬件参数,得出的结论是——各功能模块的硬件参数是可以提升的,目前制约空间计算的核心矛盾是算力。而有效解决这一矛盾,取决于两方面的努力。一方面,是原始算力的不断进步,这取决于上游芯片供应链上 CPU+GPU 核心参数的不断优化。另一方面,算法是对算力的使用效率优化,这取决于下游整机、软件 等厂商在算法与软件层面的优化能力。

  其次,我们基于用户体验的视角,按照输入-输出的框架重新解构了 Apple Vision Pro 的核心功能模块,包括输入的眼睛注视、头部及手势识别、语音输入、记录空间视频、Eyesight(现实互见),输出的超高清显示、空间视频、空间音频、Persona(数字人)。在现有的用户体验框架下按照各功能模块的重要性不同及实现难度分配权重,苹果各功能模块基准评分为 10.0,对 VR 行业的核心厂商进行评分如下,加权后评分从高到低依次为 Apple(10.0)、Pimax (5.9)、Meta(5.0)、Varjo(4.5)、PICO(4.4)、HTC(4.3)、DPVR(3.5)、YVR(3.5)、Valve(3.2)。 同时,我们认为行业产品的产品力,不完全由厂商的能力边界所决定,同时也取决于厂商对未来的综合判断。在此我们可以大胆假设苹果在空间计算时代依旧定义了行业及产品的技术路径和发展方向,并引入 Gartner 的魔力象限(Magic Quadrant)理论对主流 VR 厂商进行一个简单的分析和归类。基于对产品力与规模两大维度的评分,Apple 毫无疑问被划分入领导者(Leader)象限,Meta、PICO、Valve 则被划分入挑战者(Challengers)象限,Pimax 归属远见者(Visionaries)象限,Vajor、HTC、YVR、DPVR 属于利基企业(Niche Players)(指在某一细分领域占主导的企业)象限。

  各 VR 厂商基于自身资源禀赋积极布局划分势力范围,但苹果 Vision Pro 入局后,对树立行业共识与改变竞争格局具有重要影响。行业内长期以来存在 VST与 OST 两条路线之争。苹果这次推出的 Vision Pro,是采用了 VR+VST 的技术路线。VST 模式才能从理论上真正保证优秀的用户体验,是实现 MR 的终极模式。该模式目前面临的挑战比如算力、体积和续航问题,都在随着技术的进步而逐步解决中,但是 OST 模式有其底层产品逻辑上的致命缺陷,无法支持通用 MR 的未来。有苹果带头与引领,相信 VR+VST 也必然将在相当长时间内代表通用 MR 产品的核心形态和技术路线。 Vision Pro 问世之前,市面上的 VR 硬件参数虽然整体呈现优化、改善的趋势,但是部分参数距离良好的用户体验始终存在差距。Vision Pro 问世之后,将重新刷新用户对于良好的视觉沉浸感的认知,倒逼厂商改善光学与显示方案以提高分辨率。Apple Vision 在输入、输出方面的多项能力与配置,有望引领行业内产品跟进。比如空间视频、空间音频将成为普遍配置,与超高清显示一起,共同为用户提供沉浸式的视听体验。比如眼动追踪&面部追踪、手势识别将成为重点优化功能,人在虚拟世界当中的交互将变得更为自然。

  苹果的入局,有望将 VR 产业拉回做消费电子产品的逻辑,而此前产业主要由 Meta 等互联网公司主导,以出货量为优先,低价补贴强推,但一定程度上牺牲了用户体验。但是互联网平台业务和通用型硬件业务这两个商业模式本身就是互斥的。互联网业务,尤其是大社交业务平台,必然是赢者通吃的,目标是 cover 百分之百的人群。但是硬件天然是更分散的,因为同一个品牌、同一款产品不可能 cover 所有人的需求。而做消费电子产品的逻辑是,首先要把核心性能指标做到“良好”的水平,能够较好地满足用户的基本需求。这时候价格一定是偏高的,针对的是市场上对价格不敏感的 early adopters 形成一定的出货量,在商业上达成一定意义上的成功(至少是较高的毛利率)。Apple Vision Pro 很有希望成为一个行业拐点产品。在这个基础上,通过技术的迭代、供应链的完善,逐步降低成本,从而降低价格,从上往下逐次形成对不同层级的消费者的分段渗透,在这个过程中随着出货量的增加,供应链整体成本会进一步降低,形成良性循环,最后实现对大部分消费者的渗透。

  智能科技的产业版图,转化为技术层面的研究表达是大模型 × MR 眼镜/人形机器人 × NFT。本篇报告聚焦于 MR 眼镜这一空间计算设备所开启的空间计算平台,其定性、定量的深度研究与对比。从投资角度,围绕 8 个景气上行方向,有三类个股——向 8 个方向积极去升级或迭代或革新的传媒或 TMT 个股、坐落于 8 个方向 IPO 新股、往 8 个方向全力转型的并购重组类个股。

  2。交互硬件 VS 计算平台:焦不离孟

  2.1。交互硬件 50 年发展史:垂直→通用,大型→小型

  过去 50 年,我们历经了多种交互硬件的迭代,从早期的垂直计算硬件——游戏主机,到通用计算硬件——个人电脑,再到目前的小型化硬件——掌机&智能手机,交互硬件进化史大致是遵循垂直计算硬件→通用计算硬件→小型化硬件这样的发展路径。

  2.1.1。垂直计算硬件——游戏主机

  相比我们所熟知的任天堂 FC、索尼 PS、微软 Xbox,最早的游戏机要追溯到 1972 年的奥德赛,从第一款家用游戏主机至今,已经过去了 50 年。游戏机见证着人类科技史的进步,在不同发展阶段出现了划时代意义的产品,影响着如今包括电视、电脑、智能手机、VR/AR 等在 内的其他电子产品市场的发展。游戏本身就是一种结合了科技与文化的载体,高端技术为更具沉浸感与互动性的游戏提供了基础架构,而游戏也反过来推动新科技的探索与发展,以此形成正向循环:为了满足玩家更高的游戏娱乐需求,游戏及科技厂商持续投入研发,推出算力更高、性能更强的新硬件与技术,当新硬件与技术出现后,其所能应用的场景将远不止于游戏,将作为通用型的技术溢出至其他应用方向或场景。

  进入 21 世纪,彼时的微软已经通过控制计算机产业链上的操作系统,从而掌控了整个个人电脑产业,以 Windows + Office 的组合强势切入了办公场景。为了寻找新的盈利点,除了办公场景之外,微软一直也觊觎着客厅场景。此前微软本身也在做 PC 端的游戏,自 1997 年左右开始进军家庭主机市场,最初以合作的方式进行布局,计划为游戏硬件厂商开发软件与操作系统,但碰壁之后,微软决定推出自有的游戏主机。面对竞争已经较为激烈的家用游戏主机市场,不同于索尼的路径,微软进军游戏主机市场的方式主要靠投资,陆续收编其他硬件厂商的人才,收购多家游戏工作室。2001 年 11 月 15 日,微软在美国正式发售了自有的游戏主机 Xbox,首发获得了成功。Xbox 的成功之处在于硬件性能高、具备 Xbox Live 联网功能、性价比高,售价仅 299 美元(后于 2002 年降至 199 美元)。在这样的低价策略下,每卖出一台微软将亏损 125 美元,最终微软 Xbox 在全球的销量约 2400 万台,虽然远落后于索尼 PS2(售出 1.58 亿台),但是却胜过任天堂 NGC(售出 2174 万台)、世嘉 DC(售出 1045 万台),在同世代的游戏主机中居于第二位。 第一代 Xbox 预计亏损 50 亿美元,微软以低价的策略强势入局主机游戏市场,给其他厂商带来了冲击,世嘉、NEC 等多家公司退出了市场,最终只剩下以优质内容与创意见长的任天堂,以及资金实力雄厚的索尼。巨头入场,导致行业进入壁垒大幅提升。

  初代 Xbox 的成功重新燃起了欧美游戏开发商的热情,自此欧美游戏厂商开始崛起。同时微软乘胜追击,2005 年 11 月 22 日,微软推出新一代具备代表性的游戏主机 Xbox 360,正式拉开了三大主机游戏厂商的竞争。由于 Xbox 360 抢先 PS3 一年发售,售价仍为 299 美元,在 PS3 缺席的情况下,Xbox 360 在发售后的半年内售出约 600 万台,率先占据较大的欧美市场份额。2006 年 11 月,索尼与任天堂各自发布新一代的游戏主机索尼 PS3 与任天堂 Wii,随着新世代游戏主机发售,三足鼎立的竞争格局形成。三家的次世代游戏机各具优劣势,根据 Statista 统计,微软 Xbox 360、索尼 PS3、任天堂 Wii 在全球的累计销售分别为 8000 万台、8000 万台、1 亿台。其中任天堂 Wii 的销量遥遥领先,源于其采取了错位竞争策略,虽然 Wii 的性能不及 Xbox360 与 PS3,但 Wii 最大的优势与创新在于将体感装置引入了游戏主机,开辟了新的体验方式。Wii 开发代号为“Revolution”,表示电子游戏的革命——体感游戏革命,发 售第一年销量就达 2000 万台,迅速抢占了大量轻量玩家甚至是非玩家市场。随着三大厂商的新世代游戏主机的全面上市,游戏主机市场的竞争白热化,索尼、微软、任天堂三足鼎立的竞争格局形成直至今日。

  2.1.2。通用计算硬件——PC 与智能手机

  马克思说过,一切工具都是人体的延伸,而电脑正是人脑的延伸。电脑的发明增强了人类的运算能力,使得人类从无尽的脑力活动中解放出来。最初的电脑是专供军方(例如计算炮弹轨迹)和尖端科技部门(例如人造卫星轨道计算)使用的,随着科技的发展,电脑逐渐进入了普通人的生活,极大的提高了人类的劳动力利用率。

  1977 年:现象级产品 Apple II 问世,开启个人电脑革命

  1977 年 4 月,苹果在旧金山的西海岸电脑展览会上举办了首次盛大的产品发布会,推出了 Apple II 电脑,这是全球首台真正意义上的个人电脑,支持 280*192 分辨率的视频输出,可显示 16 种色彩,并且拥有单声道声音输出架构,从此电脑可以发出声音。Apple II 的最初定价为 1298 美元,后续又推出了多种改良型号,在接下来的 16 年中,各种型号的 Apple II 共售出了接近 600 万台。Apple II 开启了个人电脑革命,在于其面向的是大众,而不仅仅是狂人与工程师,Apple II 的上市与后来的普及深刻影响了后继的许多种微电脑。Apple II 的成功之处主要在于配备了杀手级应用“VisiCalc”,打入消费级市场。相比其他电脑,Apple II 真正开创了个人电脑产业,而 Apple II 的成功重要推进器是电子制表与个人财务程序 VisiCalc,这是 Excel 的雏形。作为世界上第一款电子表格软件,VisiCalc 最早于 1977 年问世,并于 1979 年与 Apple II 电脑拥绑销售,VisiCalc 成为当时较为流行的个人计算机应用程序,也助力 Apple II 在商业、家庭与学校用户之间进行普及,VisiCalc 在 1979 年被评为最佳软件。

  1984 年:麦金塔(Macintosh)问世,图形化界面+鼠标降低用户使用门槛

  Apple II 问世后,销量急剧上升,从 1977 年的 2500 台猛增到 1981 年的 21 万台,将苹果公司推向了一个新兴产业的顶峰。但 Apple II 与我们现在用的电脑有一个巨大的不同——没有鼠标,操作全部依靠命令行加键盘,即在键盘上输入一串字符,计算机就会在屏幕上显示相应的字符,通常是荧光绿色的字符衬上深色的背景。直到 1983、1984 年苹果 Lisa、Mac 的推出,带来了巨大的革新,带来了图形化操作界面与新外设硬件鼠标。Apple II 之后,乔布斯继续探索下一代个人电脑,目标是打造一款操作简单、价格低廉、适合普通人使用的大众电脑。1979 年,Apple II 的潜在继任者有三种机型:(1)Apple III——1980 年 5 月,Apple III 上市,虽然 Apple III 内存更大,屏幕可以一行显示更多字符,并且能区分大小写字母,但最终销量惨淡,主要源于相较前一代并没有根本性的革新。次年,苹果个人电脑业务的最大竞争对手 IBM 也推出了首款个人电脑,使用的是过时的命令行提示符,屏幕也只能显示字符,而不是图形界面的位图显示。(2)“丽萨(Lisa)”项目——全球首款同时采用图形用户界面(GUI)与鼠标的个人电脑,于 1983 年面市,但当时的苹果没有考虑到消费者对电脑消费的承受能力,昂贵的价格使得众多用户更愿意采购价格相对低廉的 IBM 电脑。Apple Lisa 于 1986 年 8 月正式退出历史舞台。(3)“安妮(Annie)”项目(后改名为 Mac 项目)——开发者为杰夫·拉斯金(Jeff Raskin),致力于为大众制造一台拥有简单图形界面与简洁设计的廉价电脑。拉斯金也促成了乔布斯与苹果的同事们关注到一家优秀的研究中心——施乐,它是图形界面技术的先驱。

  苹果至今仍与其他科技型公司调性不同,有着特立独行的风格。苹果从创立之初,其基因就 一直强调“软硬一体化”发展,乔布斯将这一基因深深的烙印在苹果公司文化之中。乔布斯认为一台电脑要真正做到优秀,其硬件与软件必须是紧密联系在一起的。如果一台电脑要兼容那些在其他电脑上也能运行的软件,它必定要牺牲一些功能。他认为最好的产品是“一体的”,是端到端的,软件是为硬件量身定做的,硬件也是为软件度身定制的。正因此,才使得麦金塔有别于微软(以及之后谷歌的安卓)所创造的操作系统环境,麦金塔上使用的操作系统只能在自己的硬件上运行。

  1995 年:Windows95 推出,高性能可以处理多媒体

  大约在 1982 年,当苹果开始着手研发麦金塔电脑时,乔布斯为比尔·盖茨展示了麦金塔计算机概念产品,以及图形界面的操作系统。乔布斯希望微软为麦金塔电脑编写 BASIC 程序,以及开发图形界面版本的应用软件,如全新的电子表格 Excel、文字处理 Word 等应用程序。随后,微软组建了一个大型团队负责该项目。彼时,微软主要靠将传统的 DOS 操作系统授权给 IBM 并兼容电脑使用而赚取收入。与苹果坚持走封闭路线的商业模式不同,微软的策略是软件的开放、兼容与廉价。在与苹果的合约到期之后,微软也将软件售卖给了其他公司,1983 年 11 月,盖茨宣布微软计划为 IBM 个人电脑开发 Windows 操作系统,Windows 操作系统将采用图形界面,有窗口、图标与可以指向并点击的鼠标。由于与大厂 IBM 进行合作,微软 DOS 系统得到迅速推广,在此后的版本更迭中,微软始终保证了产品的兼容性,因此留住了大量的用户。

  微软于 1985 年发布 Windows 1.0 操作系统,虽然该版本很不完善,更像是在 DOS 上面嵌套 了一层 UI,但是已经能够支持单窗口,Window 2.0 可以支持多窗口。1990 年,微软终于推出了第一款真正意义上的图形化 Windows 操作系统——Windows 3.0,凭借此前积累的众多用户,该系统一经推出就广受好评,得到了迅速推广。微软于 1991 年 10 月发布了 Windows 3.0 的多语版本,为 Windows 在非英语母语国家的推广起到了重大作用。1994 年,微软发布 Windows 3.2 版本,这一版的 Windows 开始支持中文,对于中国人来说,这才是使用 Windows 的开端。微软从无到有开创了一种全新的商业模式,即靠销售软件获得收入。在盖茨开创靠销售操作系统获利的这套模式之前,整个计算机产业还没有形成明确的分工,当时软件的价值必须依托于硬件才能实现,鲜少有公司将单独售卖软件作为主要的商业模式。虽然最早的商业化图形操作系统的个人电脑产自于苹果,但将简单易用的个人电脑普及到千家万户的,却是微软。在推进计算机产业不断成熟、细化分工的进程中,微软起到了关键作用。Windows 3.0 的发布,也助力微软扭转了在个人电脑领域的劣势,奠定了其在 PC 操作系统的垄断地位。而相对应地,苹果在个人电脑的市场份额从这一年开始迅速下降。

  1995 年 8 月 24 日,微软发布了 Windows 95,这是最具划时代意义的 Windows 系统。Windows 95 是一个混合的 16 位/32 位 Windows 操作系统,其版本号为 4.0,开发代号为 Chicago。Windows 95 是微软之前独立的操作系统 MS-DOS 与 Microsoft Windows 1.x、2.x、3。各系统的直接后续版本,同时特别捆绑了一个版本的 DOS 的视窗版本(MS-DOS 7.0)。Windows 95 带来的影响极为深远,促进计算机的性能大幅提升,可以处理多媒体任务。一方 面,从系统本身来看,Windows 95 最大的贡献之一在于图形用户接口较 Windows 3.2 的大幅革新,带来了更强大、更稳定、更实用的桌面图形用户界面,用户能够更快速地打开各种应用程序、系统设置、文件夹目录。Windows 95 某些创新元素甚至一直沿用至今,如开始菜单、 任务栏、USB、文件浏览器、IE 浏览器等功能;另一方面,对微软自身而言,Windows95 的发布结束了桌面操作系统间的竞争,在发行的一两年内,Windows 95 成为有史以来最成功的操作系统,1995-2000 年微软市值开启第一轮的大幅上涨行情。

  1994 年之后:互联网/移动互联网丰富应用场景

  互联网技术社会化启用阶段始于 1994 年。1994 年,美国克林顿政府允许商业资本介入互联网建设与运营,互联网得以走出实验室进入面向社会的商用时期,开始向各行业渗透。这也是我国互联网发展的起步阶段。1994 年 4 月,中关村地区教育与科研示范网络工程进入互联网,这标志着我国正式成为有互联网的国家。20 世纪 90 年代是互联网大发展的时代,万维网诞生,诸多浏览器问世,谷歌、搜狐、新浪、腾讯、阿里巴巴等互联网公司成立。移动互联时代,智能移动设备的出现使得网络用户数量及上网时间大幅增长,获取、产生信息的端点数量与交互频率大幅增加,联网的空间与场景变化多样,并由此衍生出丰富多样的应用程序,渗透至日常生活的方方面面,产生的数据量也以几何级快速增长。2010 年开始之后的十年,是移动互联网的黄金十年,移动互联网的红利期突出表现为鳞次栉比的应用创新: 2011 年的团购、2012 年的自媒体、2013 年的大数据、2014 年的互联网金融、2015 年的 O2O、2016 年的直播/新零售、2017 年的共享经济、2018 年的短视频/区块链、2019 年的人工智能、2020 年的社区团购。

  2007 年之后:触控交互+应用商店成为智能手机兴亡关键

  2007 年 6 月,第一代苹果手机 iPhone 在美国正式发售。同样在 2007 年,谷歌正式向外界发布 Android 系统,并与 65 家软件开发商、硬件制造商和电信运营商组建开放手持联盟,共同研发改良 Android 系统。苹果的触摸屏放弃使用电阻屏,而改用电容屏,这种屏具有多点触摸功能。而且由于电容屏比电阻屏的灵敏度要高很多,使得用虚拟键盘也可以快速打字,实体键盘不再是手机必不可少的东西。全触屏手机与应用商店的组合逐渐成为决定智能手机兴亡的关键。2008 年,苹果发行第三代 iPhone,Apple Store 能够为第三方提供设计需要的标准和支持时,而安卓由于采用开源,并接受市场的改良,也受到开发者的亲睐。在此背景下,功能机逐渐被以苹果与安卓为代表的智能机取代。2013 年,全球智能手机出货量正式超过功能机,成为手机市场主流。

  2.2。下一代计算平台——新的交互方式孕育出新的计算平台

  通过回顾交互硬件 50 年发展史,从人使用硬件的角度出发,至少能够得出两点特征或结论:1)人与硬件之间的交互是越来越自然的,越来越贴近人使用工具的自然习惯,智能手机的触控交互就比个人 PC 的键鼠交互更加自然;2)新的交互硬件总能生长出最适配的计算平台,且软硬一体化的趋势越来越强,基于智能手机的移动互联网生态就显然比基于电脑的互联网生态发展得更加繁荣。从产品层面而言,计算平台就是指电脑、手机、平板这些通用的、平台化的智能设备,它解决的是综合问题(多功能性、通用性),在平台之上有丰富多样的应用,一个好的平台能够催生出越来越多的应用,更多的应用也会反哺平台使之成为更大的平台(更多的应用带来更多的用户)。智能手机普及开之前,个人电脑最盛行的时期,最大的计算平台就是桌面机和笔记本,到智能手机时代,手机、平板等智能触控设备是当下最大的计算平台。

  交互硬件与计算平台是焦不离孟、相辅相成的,在可以预见的下一代交互硬件 VR/AR/MR 之上,也一定会适配全新的计算平台。我们认为,最有潜力接棒成为下一代计算平台的就是“空间计算平台”,将全面颠覆平面计算的范畴,帮助人实现虚拟与现实之间的连通与融合的计算过程。“空间计算”一词是由来自麻省理工学院媒体实验室的 Simon Greenwold 在 2003 年撰写的一篇论文中定义的。在文中 Simon 对于空间计算做出了如下定义:“空间计算是人机交互的 一种形式,机器可以处理并操纵真实的对象及空间的相关信息。它是我们实现以下愿景的重要手段:让机器成为我们工作与娱乐中更加全面的伙伴。”他认为空间计算是人类与机器的交互,其中机器识别、定位并操纵空间内部真实的物体。理想情况下,这些真实物体和空间对用户具有优先意义。例如,允许用户创建虚拟形式并将其安装到其周围的实际空间中的系统就是空间计算。空间计算是一种允许用户将环境中的物体放入机器中进行数字化的系统。空间计算与 3D 建模和数字设计等相关领域的不同之处在于,它需要其处理的形式在空间内预先存在并具有现实世界的效价。在最高层次上,空间计算是机器、人、物体及其发生的环境之间的活动和交互的虚拟化,以实现和优化操作和交互。

  有别于传统的桌面计算和平面计算,空间计算并不局限于 2 维的实体屏幕的矩形框,而是可以自由地在我们周围的环境中流动。语音、视觉、手势等其他更为自然的输入方式将进一步丰富鼠标、键盘、触摸屏等传统交互模式,使人们能够以最符合人体自然生理特征的、适合自己当前场景与业务流程的方式进行接入和交互。空间计算概念应用的里程碑事件是苹果于 2023 年 6 月 5 日发布的 Vision Pro 空间计算平台。我们认为 Apple Vision Pro 的重要意义在于帮助整个 VR/AR/MR 产业达成了两大共识:第一,是 MR 将是通用 XR 产品的主流形态。MR 的 VR 和 AR 能力可以兼顾且可以自由切换,核心技术构架则为 VR+VST(Video See Thru)。第二,高素质高参数(如超高清显示、低时延、广视场角),将是 XR 设备厂商努力的重要方向。在一款 XR 硬件普及之前,它先需要成为一 款大众都想要的硬件产品。以 Meta&字节为代表的互联网公司做硬件的逻辑仍然是典型的互联网思维,而苹果正式入局之后,VR/AR/MR 产业将回归到硬件公司做消费电子产品的路径与逻辑。Apple Vision Pro 正是当下的一款里程碑式硬件。如同 Mac 将我们带入了个人计算时代,iPhone 将我们带入了移动计算时代,Apple Vision Pro 将带我们进入空间计算时代。

  3。定性视角下的空间计算平台定义

  3.1。如何定义空间计算?为什么需要空间计算?

  3.1.1。空间计算的定义与诞生背景

  如何定义空间计算?——在三维的基础之上,以人为本,连通及融合虚拟世界与现实世界的一个全新的计算范式。 “在三维的基础之上”,是指空间计算的客体对象如果本身是三维的,不再需要从三维降维至二维的平面以方便计算和跟用户的交互,而是可以保持为立体的三维的,这是空间计算的基础。“以人为本”,是指空间计算的主体仍然是人,空间计算的目的是服务人与虚拟世界的交互。“连通与融合虚拟世界与现实世界”则描述了空间计算的过程与适用范畴。基于上述定义,人其实本身是一个非常高级的空间计算单元。人,作为一个计算单元,输入信号就是各种感官知觉体验感受,包括视觉、听觉、嗅觉、触觉、味觉等等,而人脑则是处理器,使用真正意义上的“神经网络”处理信息并作出决策,进而输出为各种人类活动,狩猎、社交、进食、游戏等等。

  人为什么称之为高级的空间计算单元?1)输入信号是多维的庞大的信号量;2)人脑是类似并行神经网络的处理器甚至是量子计算机而不是单线程;3)输出信号同样也是多维的具备一定不可预知性的。为什么需要空间计算?因为人希望突破时间与空间的双重限制。文明形态告别农业文明,历经工业文明,发展到当前这个阶段,人类已经不满足于空间位置的突破,更需要在时间上有突破。虚拟世界是可行解,借助 AI、大数据、万物互联、虚拟化身、数字分身、人形机器人,人有望真正从时间的限制中解脱出来。

  人类对虚拟世界的依赖日益强烈。首先,当下的数字时代中,虚拟信息在效率、娱乐、便携性上拥有无可比拟的优势,阅读、使用、传递虚拟信息已经渗透入人类生活的方方面面,这些虚拟信息本身就可以归结到虚拟世界的大范畴。其次,人类对各种屏幕背后的虚拟世界已经不知不觉产生了很强的依赖,以中国网民数据为例,从深度上看,2022 年月人均使用时长达 177.3h,月人均使用次数达 2633.0 次;从广度上看,触网人群覆盖全年龄段与各线城市,包括年轻群体与银发人群,一线与低线城市。(Quest Mobile)但与此同时,人类同虚拟世界的感受和反馈是存在诸多限制的。限制的来源是什么?人类一 直是试图用跟真实世界一样的交互方式去探索虚拟世界。人跟真实世界的交互方式,是一种 感受、思考、反馈的一个循环。人跟虚拟世界的交互方式其实也是很像的,是通过所谓的输入-输出-计算的方式来完成一个循环,这种方式只是有一个先后顺序的问题,但是其实跟真实世界是很接近的。区别在于输入、输出行为需要通过接入电子设备,计算需要通过处理器计算完成。

  我们将人与虚拟世界的交互方式(输入-输出-计算)与真实世界的交互方式(感受-反馈-思考)一一对应起来看,就能够发现人与虚拟世界的感受和反馈的受限,也因为有这些限制,人与虚拟世界之间的交互是不完整、不自然,因此其效率是低下的。那么,如何突破这种限制,或者说,什么样的虚拟世界才是最高效的呢?我们认为,虚实结合是虚拟世界最高效的存在形态。高效的虚拟世界应该具备两大条件,第一,信息在虚拟、现实与人脑之间,应当是无损流转的;第二,相对于与人的交互方式上来讲,虚实应当是基本相同的。人和虚拟世界高效交互方式的本质与核心在于,越贴近人与真实世界的交互方式,越能释放虚拟世界的潜力,就能更充分利用虚拟世界高效、便携、信息载量大的特点。这种高效的交互方式对计算方式提出了更高的要求,于是有了空间计算的概念。

  3.1.2。与平面计算的概念区别&支持空间计算的核心能力

  为了便于更直观地理解空间计算,我们从交互的角度将空间计算与平面计算的概念加以区分。平面计算,仅涉及人同虚拟世界的交互;而空间计算,涉及人、虚拟世界、现实世界三方的交互(其中没有人参与的虚实世界的直接交互,是一个更远期的目标)。平面计算与空间计算的最显著差异,其实是交互层面增加了一个维度。平面计算只涉及人同虚拟世界基于 2D 界面的交互,但空间计算,是涉及人、虚拟世界,现实世界三方的交互。值得注意的一点是,就算没有人的参与,虚拟世界跟现实世界的直接交互其实也是可以通过空间计算实现的,数字人加上机器人就是可能的实现路径之一,代替人在虚实之间存活。

  空间计算对应的整个架构相比平面计算都会发生改变。在平面计算机上,当我们要处理一个立体对象,会先把立体对象降维成平面,在平面处理完之后再合成立体对象。在这个过程中,大量的信息会丢失。未来,在空间计算机上,我们将不再需要这样一个降维的过程。

  3.2。新一代交互硬件——空间计算设备

  3.2.1。空间计算设备,强调以人为本

  基于空间计算的定义,就可以定义空间计算设备。空间计算设备就是以人为本,服务于空间计算过程的设备。简言之,帮助人完成连通及融合虚拟世界与现实世界的计算过程就是空间计算,帮助人完成真实世界跟空虚拟世界的交互设备就是空间计算设备。这里需要对有人场景与无人场景做一个区分,在有人场景当中,空间计算设备是一个辅助的概念,辅助人和虚拟世界、人和现实世界的交互,以及辅助虚实结合的过程。在无人场景中,空间计算打破空间、时间的限制,以数字人/虚拟人的身份直接在现实世界和虚拟世界中替代人类生活。目前,行业发展趋势还是以服务“有人场景”为主。围绕输入-输出-计算:输入指令功能是具象化同时支持人跟虚拟世界现实世界的指令操作。输出感受功能是具象化人对虚拟世界的体验,具象化中短期是通过感觉器官,远期可能是通过脑电信号。计算和处理就 AI 算法神经网络需要支持设备需要支持计算功能。空间计算设备的意义,最终还是以人为本,帮人解脱空间和时间的限制,无论是有人场景还是无人场景。

  空间计算设备,需要具备哪几个必要条件?首先,空间计算设备要具备空间计算单元及与其相匹配的算法。第二,空间计算设备要能够完成人-虚拟世界-现实世界的融合交互。第三,空间计算设备能处理多维的信号输入与输出。空间计算设备天然地需要服务于多维的空间计算架构,无论是输入信号还是输出信号都是多模态的。以 VR 为例,输入方式包括眼睛、手势、语音,相比 PC、手机的键鼠、触屏要更加多样化、并行化。

  3.2.2。脑机接口是空间计算设备的远期形态

  脑机接口(Brain-Computer Interface,BCI),是在人或动物脑(或者脑细胞的培养物)与计算机或其他电子设备之间建立的不依赖于常规大脑信息输出通路(外周神经和肌肉组织)的一种全新通讯和控制技术。“脑机接口”的定义=脑+机+接口。即,在人或动物脑(或者脑细胞的培养物)与外部设备间创建的用于信息交换的连接通路。从长远的角度看,我们认为脑机接口是空间计算设备的远期形态,在操控上完全体现人脑意识操控虚拟现实操作的无缝无感的切换,完美符合空间计算设备的定义。人类通过感知能力感受环境并且传递给大脑,感知包括视觉、触觉、听觉、嗅觉和味觉等等。脑机接口通过电信号模拟,其实是可以完全替代人类的感觉器官的,因为不管怎么样都是以电信号的模式在传导。从计算机的处理功能角度,我们认为脑机接口是通过模拟、整合、增强的逻辑与人脑完全融合的。它先模拟人脑计算,再整合人脑提高整体的计算能力,在生物学意义上能够增强神经网络计算能力。

  3.2.3.Apple Vision Pro 是初级空间计算设备的典型代表

  苹果在 WWDC 发布会上开门见山地表达了 Vision Pro 的定位是首款可佩戴的空间计算设备,以及产品划时代的意义——认为 Vision Pro 会将用户带入空间计算的时代,其底层逻辑是空间计算平台。站在苹果的视角,个人计算时代的设备,例如 PC 和 Mac,解放了个人的计算负担,使人能专注于创造;移动计算时代的设备,例如 iPhone,iPad 这样的手机和平板,以人为结点,有效链接了世界,使得信息传递更为方便快速;那么苹果所提出的空间计算,则是解构和再造了空间,使人能有机会进入到多维时空中。为了更好的服务于空间计算,Apple Vision Pro 集成了以下三种能力。立足当下来看,我们认为 Apple vision pro 是目前初级空间计算设备的一个典型代表。

  3.3。平面计算向空间计算过渡的颠覆性和必然性

  3.3.1。计算升维是一种时代颠覆,PC 到手机的变迁无法与之类比

  升维,对于人类而言意义重大。人类是生存于四维时空的三维生物,可以理解三个空间维度和一个时间维度。人类与世界的交互方式,人类感知世界与处理信息的方式是三维的。人类的文明能够超越基因的沉淀而延续与传承,关键的是通过间接知识或间接经验代代相传。直接经验与间接经验,是知识结构的两个部分,直接经验是指由亲身参加或实地实践所获得的知识,间接经验是指从别人或书本那里学习得来的知识。人类通过感知与实践得来的直接知识,是三维+时间的完整体验,而其作为间接知识形成与传播时,受技术水平所限,多以文字、书本等一、二维为载体体现,在提升了传播效率的同时也牺牲了信息密度。文字是一维的,图片是二维的,视频是二维+时间,但无论哪一种载体,相比直接知识和经验都是一种降维。在降维的过程中,间接知识损失了许多必要信息,不再能复现完整的知识或体验。

  因此,升维的重要意义是显而易见的。以三维信息作为载体最接近人类的真实体验,相比二维信息显著提升了传播效率与传播精度,将间接知识传播过程中在形成与传播的过程中的损耗降至最低。接近人类的真实体验/符合人类的交互习惯到底有多重要呢?从宏大叙事的视角,有助于提升全人类文明的进步效率;从技术普及的视角,对推进技术平民化至关重要。一个最佳的例证就是计算机的发明与普及。计算机可以看做是人脑的延伸,将信息、知识、文化抽象化,并以计算机能够理解的语言和方式进行处理,成为人类重要的生产工具。但计算机的使用仍然是有门槛的,最早的计算机是服务于科研人员及军事领域的实验室产品,图形界面取代代码命令后,二维的图文相比一维的代码更易为用户理解,计算机也逐渐走入寻常百姓家。从一维到二维(仍然属于平面计算的范畴),计算机完成了普及的使命——一般的用户可以无障碍完成基础操作,经过训练的用户可以使用各种计算机软件完成更高阶操作,如制图、建模、开发等。

  从平面到空间的计算升维,是用新的成体系技术,对老的技术体系进行“降维打击”。空间计算是个三维计算的概念,平面计算是二维的,这种技术上的隔阂天然的就是一种“降维打击”。本身平面计算是建立在平面坐标系+时间上的(3 个维度的信息),对比三维计算(三维坐标系+时间,其实是 4 维信息),在信息获取量、信息输出量、计算负担上,都是一整个数量级的差距。同时,围绕着信息获取的方式,输出的方式,计算的方式,平面计算已经形成了自己成体系的技术和产品,比如信息获取,就是靠现在的平面输入设备及技术(键盘鼠标麦克风,以及语音识别等等技术),输出方式就是靠屏幕、音箱等设备和技术,计算还是基于 CPU+GPU 的平面计算。但是空间计算的技术体系和产品是全新的,虽然有部分和老的技术体现有相似性,但是在技术上也需要迭代,更不必说可能会产生全新的输入、输出、计算(量子计算等)方式。这种老的技术体系向新的技术体系的进化,不一定只有过渡和继承,而有可能是完全的颠覆。这种颠覆性,就可以被看作是新技术体系向老技术体系的“降维打击”。

  3.3.2。空间计算的时代必将到来

  平面计算的技术和体验已然见顶。据发改委网站数据统计,2022 年全球智能手机出货量为 12.1 亿台,同比下降 11.3%,出货量前五家企业市场占有率总和为 69.9%。其中,小米出货量为 1.5 亿台,同比下降 19.8%,市场占有率为 12.7%;OPPO 出货量为 1.0 亿台,同比下降 22.7%,市场占有率为 8.6%;Vivo 出货量为 1.0 亿台,同比下降 22.8%,市场占有率为 8.2%。可以说,智能手机的出货量已见颓势,而这背后其实是智能手机背后的平面计算所能提供的用户体验已经遇到了显而易见的发展瓶颈,需要空间计算带来破局机会。与此同时,空间计算的技术和体验拐点已经到来,Apple Vision Pro 就是标杆产品。在 PC 时代与智能手机时代,苹果已经多次证明过其定义行业拐点的成功经验——1984 年推出的 Macintosh、2007 年推出的 iPhone,2023 年发布的 Vision Pro 有望再次书写历史。

  这一轮空间计算浪潮之下,我们仍然看好苹果看准未来及塑造未来的能力。看准未来的能力,指的是苹果 Vision Pro 预测并描绘了一个全新的空间计算概念,是具备跨时代属性的。塑造未来的能力,指的是苹果有能力预测一代又一代的标杆式产品并有能力把这些预测变成行业的共识和现实。苹果在个人计算和移动互联时代都曾推出过颠覆性的产品:在个人计算,也就是 PC 时代,苹果于 1984 年推出了 Macintosh;而在移动互联时代,苹果在 2007 年推出的 iPhone,更是颠覆了业内一众键盘手机。这次,苹果自然也期待 Vision Pro 能成为其定义的空间计算时代的颠覆性产品。站在苹果的视角,个人计算时代的设备,例如 PC 和 Mac,解放了个人的计算负担,使人能专注于创造;移动计算时代的设备,例如 iPhone,iPad 这样的手机和平板,以人为结点,有效链接了世界,使得信息传递更为方便快速;那么苹果所提出的空间计算,则是解构和再造了空间,使人能有机会进入到多维时空中。

  苹果推出 Vision Pro 之后,硬件已经不是制约空间计算能力的主要因素。我们在下文 3.2 将 Pimax Crystal、Varjo Aero、Meta Quest 3、HTC Vive Pro 2、Valve Index、PICO 4 Pro、DPVR E4、YVR 2 与 Apple Vision Pro 进行参数比较。从纯硬件参数的角度比较,在涉及显示、光学、图像、追踪定位等方面,部分现有 VR 产品的硬件参数是可以等同甚至是可以优于 Apple Vision Pro 的。基于以上对硬件参数的比较,我们进一步发现,目前,制约空间计算的核心矛盾不是硬件而是算力。Vison Pro 问世之前,VR 长期以来是互联网公司的逻辑,Vision pro 出来之后,就回归到硬件公司的逻辑。过去 VR 行业长期由 Meta 引领,而 Meta 做硬件是典型的互联网公司逻辑, 重视用户数量的增长而牺牲一定程度的用户体验。而苹果 Vision Pro 将引领行业重新回到硬件公司的逻辑,以用户体验为优先,更加关注硬件设计方面的核心能力。当设备的颠覆性(屏幕替代性)得到初步显现后,将引发产业链的跑步追赶,行业将进入高速增长时代。

  4。定量视角下的空间计算能力比较

  4.1。空间计算设备的产业链剖析&供应商整理

  4.1.1。光学模组:方案各有千秋,平衡轻薄与清晰度两大关键需求

  在空间计算设备结构中,光学模组作为连接显示屏和人眼的重要桥梁,是最为关键的组件之一,直接影响到最终的显示效果与使用体验。光学技术的发展缓慢,一直是 VR/AR/MR 快速扩张的瓶颈之一。当前的主流光学模组主要包括非球面透镜、菲涅尔透镜、Pancake 三种方案,实际应用中厂商会在极致轻薄与极致清晰之间作一定取舍。非球面透镜通畅有着更清晰的成像质量、更高的放大率与更广的视野,但透镜的厚度与重量较大。Pancake 折叠光路方案则在轻薄度上领先,通过多片光学镜片让光路多次折返,从而缩小整个光学模组总长,但不可避免地会产生“伪影”、损失光效,影响最终成像效果。前沿的超表面/超透镜方案有望平衡轻薄与清晰度两大需求。超表面透镜能利用纳米结构聚光进而达到避免色差出现的平面,且能形成特定的重复模式模拟折射光线的复杂曲率,使其没有传统透镜笨重,并能在减少畸变的情况下改善聚焦光线的能力。

  4.1.2。显示面板:技术持续演进,Micro-OLED 预计成为中期行业主流

  早期 VR 头戴式设备大部分采用普通 LCD,而后逐渐被 OLED 取代。2016 年前后,OLED 技术尝试用于 VR 设备中,并一度成为 VR 设备生产商的首选。2018 年以后,Fast-LCD 技术的出现让 LCD 逐渐成为主流选择。自 2022 年起,显示方案进一步迭代,Apple Vision Pro 使用硅 基 OLED 显示方案,Quest Pro 使用 Mini LED 背光的 Fast LCD 显示面板等。

  Micro LED 有望成为远期最佳显示方案。Micro LED 指在一个芯片上集成的高密度微小尺寸的 LED 阵列,如 LED 显示屏每一个像素可定址、单独驱动点亮,可看成是户外 LED 显示屏的微缩版,将像素点距离从毫米级降低至微米级。通过巨量转移技术,将微米等级的 RGB 三色 Micro LED 搬到基板上,形成各种尺寸的 Micro LED 显示器。Micro LED 的芯片到了肉眼难以分辨的等级,可以直接将 R、G、B 三原色的芯片拼成一个像素点,变成“一个像素”的概念,不再需要滤光片和液晶层。Micro LED 用到的自主发光器件,即 LED 半导体灯珠,是一个正负极性明确、体积形状固定的固体小颗粒灯珠,再通过“巨量转移”技术平面化集成大量的微小 LED 灯珠器件。“巨量转移”技术是 Micro LED 产业独有技术,难以从其它相关产业获得巨大的技术帮助。目前,Micro LED 巨量转移技术依然处在实验室攻关阶段。

  4.1.3。背光技术:Mini LED 背光 LCD 为超高清显示可行方案

  LED 背光源由直流驱动,工作电流易控制光电转换效率接近 100%,在相同的照明效果下比传统的光源节能 80%以上。且使用寿命很长,基本都在传统背光源的 10 倍以上,甚至可以高达 10 万小时。LED 是固态发光源,启动电压比较低,防震性好,色域宽广等等。另外 LED 还具有在线编程亮度可控、灵活多变的特点。LED 背光主要有侧入式背光、直下式背光、Mini LED 三种方案。

  4.1.4。摄像头:数量显著增加,VST、面追&眼追、空间定位各司其职

  摄像头可以看做是空间计算设备的“眼睛”,摄像头品质和功能是良好用户体验的关键。从每个设备上摄像头数量来看,2022 年下半年上市的 VR 设备标配 6 颗以上的摄像头,旗舰产品至少 8 颗摄像头,且摄像头的数量仍有增加的趋势。Apple Vision Pro 配备了 12 颗摄像头,包括 2 组 RGB 主相机、4 组下视角相机(2 组近乎垂直向下,两组斜向下)、2 组外侧视角相机、以及 4 组眼球追踪红外相机(头显内侧)。

  RGB 摄像头:用于拍摄外部影像,和内部显示模组提供实时的立体视觉,提供一种透视的效果。让 VR 一体机拥有 AR 设备的能力,可以虚实结合,已经成为标配摄像头。VST 图像的清晰程度取决于 RGB 摄像头的采样能力:1、RGB 摄像头是现在 VST 显示画面清晰度的瓶颈;2、摄像头本身是带视场角的,所以需要用 2 颗 RGB 摄像头以降低边缘畸变;3、需要机器识别算法对 RGB 摄像头拍出来的画面进行调整优化已达到最佳显示效果。

  眼动追踪摄像头:眼动追踪研究的最关注的事件是确定人类或者动物看的地方。更准确说是通过仪器设备进行图像处理技术,定位瞳孔位置,获取坐标,并通过一定的算法,计算眼睛注视或者凝视的点。所有基于视频的眼动追踪的核心是一个或多个摄像头,它们可以拍摄一系列的眼睛图像,计算出受试者正在看屏幕的坐标位置,并将此信息传递回控制刺激信号的计算机。

  面部追踪摄像头:用于捕捉用者的面部表情甚至重建使用者的面部。这是为了以后元宇宙的交流更加自然,更加像现实中的体验。这个功能会用 2 颗微光红外眼球跟踪摄像头,1 颗嘴部动作捕捉摄像头来实现。

  6DoF 摄像头:用于感知环境,捕捉手柄和手部动作,实现最重要的人机交互方式。经过一个联合标定的过程建立一个 SLAM 地图,用来捕捉手柄和人手在这个 SLAM 地图中的运动情况。标定的算法与空间算法上的差异会导致用户使用中体验的差别,在 VR 世界中进行球类游戏和其他需要跟踪精准的手部动作的应用中会体现得比较突出。

  4.1.5。传感器:重要性凸显,dToF LiDAR 有望成为标配方案

  传感器所占的比例越来越重,颠覆性的人机交互依赖于传感器的实现。普通的彩色相机拍摄到的图片能看到相机视角内的所有物体并记录下来,但是其所记录的数据不包含这些物体距离相机的距离。仅仅能通过图像的语义分析来判断哪些物体离我们比较远,哪些比较近,但是并没有确切的数据。而深度相机则恰恰解决了该问题,通过深度相机获取到的数据,我们能准确知道图像中每个点离摄像头距离,这样加上该点在 2D 图像中的(x,y)坐标,就能获取图像中每个点的三维空间坐标。通过三维坐标就能还原真实场景,实现场景建模等应用。Apple Vision Pro 配备了 5 个传感器,包括 1 个 LiDAR、2 颗深度相机、2 组未知传感器(位于外壳上方中间区域)。深度传感器一般分为结构光、双目立体视觉、ToF 三种技术路径,其中结构光与双目技术都是基于几何原理做间接深度估计,而 ToF 则是测量发射光和反射光之间的飞行时间并根据光速来直接估计深度。其中,ToF(time-of-flight,飞行时间)的概念是扎根于深度传感器的, 指采用像素阵列来获取整个场景的高分辨率深度分布。而 LiDAR 主要应用于自动驾驶领域,是根据发射光和反射光之间的飞行时间来直接估计目标距离。也就是说,如果从测量原理来看,所有的 LiDAR 都是 ToF。因此,ToF LiDAR 通常指的是那些基于测量发射和反射光之间的飞行时间来获得高分辨率场景深度/目标距离分布的传感器。

  ToF 方案又可进一步细分为 dToF 与 iToF。dToF 和 iToF 的原理区别主要在于发射和反射光的区别。dToF 的原理比较直接,即直接发射一个光脉冲,之后测量反射光脉冲和发射光脉冲之间的时间间隔,就可以得到光的飞行时间。而 iToF 的原理则要复杂一些,在 iToF 中,发射的并非一个光脉冲,而是调制过的光。接收到的反射调制光和发射的调制光之间存在一个相位差,通过检测该相位差就能测量出飞行时间,从而估计出距离。从原理上来看,iToF 的最大问题就在于最大测距距离和测距精度之间的矛盾。而 dToF 相较于 iToF 来说难度要大许多。dToF 的难点在于要检测的光信号是一个脉冲信号,因此检测器对于光的敏感度比非常高。常见的 dToF 传感器实现是使用 SPAD(single-photon avalanche diode,单光子雪崩二极管)。SPAD 的工作区域位于二极管的击穿区附近,当单个光子进入 SPAD 后就会产生大量的电子-空穴对,从而 SPAD 能检测到非常微弱的光脉冲。从器件角度来看,SPAD 的集成度要低于普通的 CMOS 光传感器,因此 dToF 传感器的 2D 分辨率较差。

  随着近几年深度传感器和 LiDAR 的发展,dToF 也得到了长足的发展。从光传感器像素来看,dToF 目前也可以使用 CMOS 工艺实现,并且已经可以实现不错的 2D 分辨率。随着 ARVR 等新应用的兴起,消费电子领域对于深度传感器的需求也在快速上升。消费电子领域传统上是 iToF 的天下,因为在消费电子领域的应用中对于 ToF 传感器的最大测距距离需求较低(数米之内),而对于 2D 分辨率和成本的需求则较高。然而,随着 dToF 技术,尤其是高集成度 CMOS SPAD 的发展,dToF 正在从高端进入消费电子市场。

  4.2。空间计算设备的硬件参数比较

  我们选取了 Pimax Crystal、Varjo Aero、Meta Quest 3、HTC Vive Pro 2、Valve Index、PICO 4 Pro、DPVR E4、YVR 2 与 Apple Vision Pro 进行参数比较。从纯硬件参数的角度比较,在涉及显示、光学、图像、追踪定位等方面,现有 VR 产品的硬件参数是可以等同甚至是可以优于 Apple Vision Pro 的。

  显示:预计 Apple Vision Pro 可实现等效 3400x3400 单眼的清晰度,支持 90Hz 刷新率;而 Pimax Crystal、Varjo Aero、Meta Quest 3 也能够实现 2880x2880、2880x2720、2064x2208 单眼的清晰度,支持 90-120Hz 刷新率。

  光学:Apple Vision Pro 采用 Pancake 光学模组,支持自动瞳距调节,通过双摄像头实现 Passthrough 功能;其余空间计算设备在光学模组的选择上包含 Pancake、非球面透镜、菲涅尔透镜三种,多数也都支持自动瞳距调节,有 Passthrough 功能。

  图像:Apple Vision Pro 目前的水平与垂直视场角未知,其余设备的水平视场角在 95°- 110°之间,垂直视场角在 73°-104°之间。Apple Vision Pro、Pimax Crystal、Varjo Aero 均支持动态注视点技术。

  追踪定位:多数设备采用 6DoF Inside-out 追踪定位方案,支持眼部追踪、脸部追踪、手势识别等。

  4.3.以 Apple Vision Pro 为标杆,量化评分各空间计算设备

  4.3.1.Apple Vision Pro 的再拆解(评价基准)

  在前文对空间计算设备的定义中,我们强调了空间计算设备是以人为本,服务于连通及融合虚拟世界与现实世界的计算过程的设备。空间计算设备的意义,最终还是以人为本,帮人去解脱空间与时间的双重限制。立足于用户视角,向虚拟世界、现实世界的输入、输出都是多维的双向的。输入完成指令功能,既支持人向虚拟世界的输入,路径包括眼睛注视、头部及手势识别、语音输入、记录空间视频,也支持人向现实世界的输入,路径为 Eyesight(现实互见),戴上空间设备之后仍然需要与现实世界当中的人与物互动。输出完成感受功能,既支持虚拟世界向使用者的输出,路径包括超高清显示、空间视频、空间音频,也支持虚拟世界向其他用户的输出,Persona(数字人),同时也是人在虚拟世界的一种存在形态。

  4.3.2.空间计算设备重点功能分析(评分体系)

  核心功能模块为以苹果对于其空间计算设备的核心功能定义作为框架,包括输入的眼睛注视、头部及手势识别、语音输入、记录空间视频、Eyesight(现实互见),输出的超高清显示、空间视频、空间音频、Persona(数字人)。重要性/优先级排序:眼睛注视、头手识别、超高清显示为第一梯队,空间音频、空间视频为第二梯队,语音输入、视频记录、现实互见与数字人为锦上添花体验。在现有的用户体验框架下,我们认为眼睛注视、头手识别、超高清显示是能够显著提升用户体验的功能模块,在此基础上,辅以空间音频、空间视频体验,有助于加深用户在虚拟空间中的沉浸感,而语音输入、视频记录、现实互见和数字人体验,是在实现上述功能之后的锦上添花体验,重要性或优先级相对不高。 评价基准为我们对算力的需求程度、算法的有效优化、整体的实现难度、其相应功能之于用户体验的重要性、以及现有行业解决方案的成熟度,进行“高-中-低”的主观评价。

  4.3.3.国内外厂商空间计算能力排序(具体评分)

  在算力不足的前提下,厂商的竞争力首先体现在整机整合、调校能力上,即如何用 Cost effective 的方式挖掘和利用上游厂商提供元器件的物理性能极限,决定了目前阶段整机厂商能 Deliver 产品的核心体验。苹果的整合和调通能力壁垒毋庸置疑,而 Meta 作为近几年将研发重心投向元宇宙的巨无霸企业,也理应具备相应能力,但其产品策略为“出货量优先、低价强推”,一定程度上为了尽快扩大用户基数而牺牲了用户体验。例如国内企业小派科技,就是并没有在“安全/保险”的建议边界内做平庸的产品,而是坚持自己对行业和用户体验的认知,利用现有相同的上游产品,去打造相对体验更好的产品,构筑了其行业上半场较高的技术壁垒。同时,我们也应该意识到,多数 VR 设备/硬件厂商,在语音输入、空间音视频、数字人方面的集成和积累不如苹果,但这些能力,大多不是硬件层面的问题,而存在于软件/算法层面。对于空间计算的核心公司来说,不同整机厂商在下游的应用开发者平台体验和 App 层面的用户体验也存在核心差异。目前在 PCVR 领域,无论是在游戏场景趋于成熟的 Valve 生态,和微软已经深耕多年的 Windows Mixed Reality 生态,都是对纯硬件厂商较为友好的,能够支撑 VR 硬件的有效增长。而一体机领域诸如 Apple、Meta 这样较为封闭的生态,在逐步成熟后,也必然会出现替代的开放生态平台。

  基于上述观点,我们以 Apple Vision Pro 的核心功能模块为基础,按其对用户的体验重要程度以及实现难度进行加权:眼睛注视权重 24.9%、头手识别权重 8.3%、语音输入权重 2.8%、记录空间视频权重 4.6%、Eyesight 现实互见权重 4.6%、超高清显示权重 24.9%、空间视频权重 13.8%、空间音频权重 7.7%、Persona 数字人权重 8.3%。苹果各功能模块基准评分为 10.0,对 VR 行业的核心厂商进行评分如下,加权后评分从高到低依次为 Apple(10.0)、Pimax(5.9)、Meta(5.0)、Varjo(4.5)、PICO(4.4)、HTC(4.3)、DPVR(3.5)、YVR(3.5)、Valve(3.2)。对于以苹果核心功能为基础,权重是指我们认为现在的 MR 设备对用户体验影响相对最大的部分。

  5.阵营与主赛道分析:出货量优先 VS 性能优先

  5.1.Apple Vision Pro 发布对竞争格局的影响

  5.1.1.MR 形态成为 XR 产品的主流形态

  MR 的 VR 和 AR 能力可以兼顾且可以自由切换,核心技术构架则为 VR+VST(Video See Thru)。展开来说,传统意义上的 AR 公司所采用的是 Optical See Through,即 OST 方案,是指周围 环境反射的可见光穿过镜片直接进入人眼成像,虚拟物体则直接显示在在半透明的近眼显示屏幕上,两者叠加形成虚实结合的效果。OST 方案从理论上可以做的更轻便,更接近常见的眼镜,但其本质特点是较小的视场角内的虚拟物体直接叠加在更大的自然视野内的真实环境的物体之上,无法真正实现虚实“无缝”融合的效果。OST 方案的另外一个致命缺陷是它只能适用于狭义的 AR 模式,无法支持 VR 模式,通用性不足,不能成为真正的 MR 产品。

  而 VST 模式则可以把周围环境的信息全面采集,经过处理后,和虚拟的物体实现无缝的结合,再统一展示在完整的视野中。这样在理论上才能保证虚实完美融合的可能性,同时保留了对 真实环境进行加工和升级的可能性,也保证了在数字空间中再次传播的一致性,显然是更具通用性和可扩展性的一种模式。另外 VST 方案可以同时兼容 VR 和 AR 两种模式,显然更符合 MR 的产品理念。行业内长期以来存在这两条路线之争。苹果这次推出的 Vision Pro,是采用了 VR+VST 的技术路线。VST 模式才能从理论上真正保证优秀的用户体验,是实现 MR 的终极模式。该模式目前面临的挑战比如算力、体积和续航问题,都在随着技术的进步而逐步解决中,但是 OST 模式有其底层产品逻辑上的致命缺陷,无法支持通用 MR 的未来。有苹果带头与引领,相信 VR+VST 也必然将在相当长时间内代表通用 MR 产品的核心形态和技术路线。

  5.1.2.Apple Vision Pro 树立性能与体验标杆

  Vision Pro 问世之前,市面上的 VR 硬件参数虽然整体呈现优化、改善的趋势,但是部分参数距离良好的用户体验始终存在差距,最典型的莫过于屏幕分辨率。主流 VR 设备的分辨率长期停留在 4K 以下,仅仅极少数 VR 设备如 Pimax 8KX、Pimax Crystal 等分辨率达 8K 水平,视觉沉浸感严重不足;同时,显示不清晰也是造成用户“眩晕感”的重要原因之一。Vision Pro 问世之后,将重新刷新用户对于良好的视觉沉浸感的认知,倒逼厂商改善光学与显示方案以提高分辨率。视觉本身是一个“环绕”的球面概念,所谓的 2K/4K/8K 分辨率,其实可以看做是像素点平铺在了人眼的球面空间上。如果在单位角度上像素点较为密集,自然在平铺的角度上就会有所牺牲,即在相同的总分辨率下,“清晰”和“宽广”是矛盾的,这就反映了行业核心参数角分辨率 PPD(Pixels per Degree)和视场角 FOV(Field of View)之间此消彼长的关系。反过来说,只有将屏幕的总像素数做的足够多,才能同时做到显示效果的“清晰”和“宽广”。小派和苹果的产品都做到了 8K 级别的水平像素总数,才能同时保证这两方面的体验。

  低于 8K 分辨率水平,比如占据目前行业出货量大部分的 4K 级别 VR 头显,确实是在低价格基础上帮助用户用较低的成本体验 VR 的一些乐趣,一定程度上加快了 VR 在消费市场的渗透。但是对行业的不利影响则是,进一步强化了消费者群体对 VR“还是不够清晰”的偏见。在视觉体验之外,Apple Vision 在输入、输出方面的多项能力与配置,有望引领行业内产品跟进。比如空间视频、空间音频将成为普遍配置,与超高清显示一起,共同为用户提供沉浸式的视听体验。比如眼动追踪&面部追踪、手势识别将成为重点优化功能,人在虚拟世界当中的交互将变得更为自然。比如现实互见与 Persna 数字人将迎来更多探索,进一步丰富虚拟与现实之间的社交生态……

  5.2.互联网公司“出货量优先”VS 硬件公司“性能优先”

  苹果入局之后,整个 VR 市场暂时分成了两条不同的战线,分别对应通往终局的两条不同的路径。一条是苹果和小派为代表的“性能先行、价格渐降”路径,这条路径遵循硬件行业的基本商业逻辑和演进规律。另外一条则是 Meta 和字节主导的“出货量先行,低价强推”路径。虽然从终局思维的角度看,最后两条战线必将殊途同归。但是在很长一段时间内,这两条战线的将走出两条截然不同的道路。从出货量的角度看,目前第二条路径占据了绝大多数,但这条路径也面临相当大的挑战,最核心的问题是硬件性能局限。Meta 和字节主导的“出货量先行,低价强推”是典型的做互联网平台的逻辑,互联网公司做自己的通用硬件品牌。但是互联网平台业务和通用型硬件业务这两个商业模式本身就是互斥的。核心的原因,就是作为一个通用平台这种互联网业务,尤其是大社交业务平台,必然是赢者通吃的,目标是 cover 百分之百的人群。但是硬件天然不是这样,它天然是更分散的,因为同一个品牌、同一款产品不可能 cover 所有人的需求。

  但是为什么以 Meta 为代表的互联网公司会决定自己来做自己的 VR 硬件呢?其中固然有“反抗”苹果在面向互联网应用运营商的强势地位这样的战术性因素,但更重要的是在战略层面,扎克伯格要在互联网从 2D 到 3D(也就是空间互联网)这种代际转移的过程中,确保自己不会掉队实现,从而实现“安全”的跨越。“保证”在互联网进入 3D 时代之后,自己能够继续“维持”甚至“强化”其行业龙头地位。为达成这一战略目的,Meta 采取了所谓“垂直封闭策略”,就是把硬件、软件、内容和用户等 VR 行业发展所必需的、本来应该多家公司分别经营的业务资源整合在同一个公司下面,主动催生整个行业的爆发,并在这个过程中,积累元宇宙时代大社交业务的种子用户群体。当种子用户群体的体量一旦跨越临界质量,便可以通过强大的网络效应,形成不可逾越的先发优势。到时,再把这个社交软件向其他硬件开放,形成跨硬件的大社交平台。这样就实现了通过“垂直封闭”的过渡性策略实现在最终“开放兼容”格局下的垄断地位。

  做消费电子产品的逻辑,首先要把核心性能指标做到“良好”的水平,能够较好地满足用户的基本需求。这时候价格一定是偏高的,针对的是市场上对价格不敏感的 early adopters 形成一定的出货量,在商业上达成一定意义上的成功(至少是较高的毛利率)。Apple Vision Pro 很有希望成为一个行业拐点产品。在这个基础上,通过技术的迭代、供应链的完善,逐步降低成本,从而降低价格,从上往下逐次形成对不同层级的消费者的分段渗透,在这个过程中随着出货量的增加,供应链整体成本会进一步降低,形成良性循环,最后实现对大部分消费者的渗透。大部分技术含量较高的耐用消费品(电子和汽车为典型代表)各自的发展都是经历了这样一个过程。这个演进的过程的节奏,在很大程度上是由相关底层技术进步的节奏和整个产业链的发展节奏决定的。作为整机厂商在这个过程中有可能发挥较大的作用,但是很难在本质上大幅影响这个演进过程的节奏。

  6.大模型×空间计算平台,预计 24、25 年爆款将频现

  6.1.大模型×空间计算平台:景气上行的诸多方向(6 个)

  以大模型(ChatGPT)为代表的新一轮 AI 浪潮,正掀起新的产业革命。上一轮移动互联网浪潮本质上是实现网络渗透率提升的过程,头部大公司如腾讯、阿里、百度、滴滴、美团、字节跳动等,它们的投资价值通常需要用更大的用户数量及单用户价值来体现,所以这些大公司都体现为平台型公司,即覆盖及连接用户为核心壁垒。以大模型为代表的新一轮 AI 浪潮是在场景数字化程度较高的基础上掀起的智能化升级,大模型通过自然语言交互的方式重新定义了人与机器交互的方式。ChatGPT 作为 AIGC 的一种产品形态,对话框的“聊天”功能只是表象,其背后是底层 AI 能力的改变,即主要是 NLP(自然语言处理)的一大进步,它所呈现出来的自然语言交互能力,其本质是“下一代人工智能的操作系统”。此外,通过生成式 AI 提高了诸如文案生成、脚本创作等工作的效率,由于颠覆了内容生产方式,因而对现有的平台格局将形成巨大的冲击。

  其景气度及持续期取决于是否会迁移至新的计算平台上——再次升维的空间计算平台。新一轮 AI 浪潮已经对现实世界形成了巨大的影响,但如果仍在移动互联网框架内,那则只是对现有的产业进行升级与迭代,则是在存量空间中的零和博弈。我们认为以 Apple Vision pro 为代表的 MR 眼镜出现有望打开新的增量空间,一方面存在虚拟世界,在其上所有的场景都值得被建设一遍;另一方面虚拟与现实融合将产生更多交互关系,也将产生满足新交互范式的内容。大模型 x 空间计算平台,这一轮的创新周期是软硬结合向前走,带来乘数效应,不是简单的加法。人工智能、智能硬件(空间计算)、智能合约分别对应生产力、新空间(新平台)、生产关系,软硬结合相互促进、相互影响,是各类技术涌现以及众多企业接力赛的过程。人工智能:AI 现在涌现的是 AIGC,爆款产品形态是 ChatGPT,它实际上是先进的生产力,代表的是软实力部分;智能硬件:开辟了新的空间入口,分布式垂直硬件改造了现实物理世界空间,相当于在现实物理世界叠加了一层智能维度;智能合约:可以实现自动化的合约执行,从而降低交易成本,提高交易效率,改善生产关系。实际上智能合约确实是面向未来搜索的,基于让人的创造力更加迸发的要素之一。

  6.2.大模型×空间计算平台:每个方向上可能出爆款的大致推演

  每一代新计算平台的发展,都伴随着技术与工具的升级,并带来各类创新的内容与应用。尤其是在移动互联网发展的最初几年,各类 to C 端的应用不断涌现,如淘宝、微信、视频平台、手游等,其中绝大多数的热门 App 或应用都是属于顺人性产品。在互联网产品设计的过程中,工程师会将人性的因素考虑进来。我们将产品分为两大类,顺人性产品与逆人性产品。顺人性,即顺应用户的需求,更方便、更快捷的满足人类基本的低层次欲望。顺人性产品往往利用人性中本能的欲望来打造产品,以迎合人性,比如欲望驱使下的贪嗔痴的需求,越低层的需求市场越大,比较典型的就是游戏、长短视频、打折优惠等这类产品。逆人性,即通过某些手段克制人类某些原始的欲望,如贪嗔痴,目的则是为了满足人类更高层次的需求。典型的逆人性产品主要集中在延迟满足需求强的行业,比如教育与健康类的产品;以及需要自律管理需求的行业,比如各类办公管理类的产品。

  移动互联网与智能手机率先对人们的“吃喝玩乐”领域进行了革新,尤其是在内容供给端,手游、长短视频的发展丰富了人们的精神娱乐,但这类“吃喝玩乐”的内容与应用多为顺人性产品,而移动互联网时代的逆人性产品则发展的非常缓慢。当下,我们正处于下一代计算平台的技术变革中,目前来看,这一轮 AIGC 的崭露头角,从 AI 绘画到 ChatGPT,随着应用场景的扩容,人们对 AIGC 商业化潜力的关注度,逐步从偏 C 端的娱乐,拓宽至工业、金融、 教育等 B 端领域。一定程度上,AI 绘画其实是属于小 B 端的应用,ChatGPT 也在论文写作、商业分析报告以及代码编写等领域展现出了非常的能力。AIGC 与 ChatGPT 的本质是 AI,AI 作为新的生产力工具而存在,从这个角度看,AI 对传媒产业的影响,将显著不同于移动互联网时代的顺人性产品跑得快的逻辑,我们预计 AIGC 将率先革命化的应用/场景可能是逆人性产品。上网时代,顺人性的爆款应用非常多,而上算时代,逆人性的应用会更加多,这背后的原因在于:1)AI 将着重率先改造移动互联网未能解决的领域,存在增量;2)基于防御性目的,人们“主动”学习 AIGC 以提升自身生产力。这一轮 AIGC、ChatGPT 本身是生产范式的变化,若将 AI 看成是生产力,与人在工作上将成为竞争关系,当 AIGC 在各个领域崭露头角的时候,如作画、作曲、写代码、撰写商业分析报告等,人们会担忧自己在未来会被 AIGC 所替代,而出于防御性的目的,人们会倒逼自己去了解甚至是学习 AIGC。

  我们从三个维度去对场景进行划分,即技术要素是虚拟现实还是人机协同/共生,模式是 to C 还是 to B/G,以及当要素与场景以产品或服务形式共同作用于的人性是顺人性还是逆人性。我们建构出了未来 Web3.0/元宇宙的八大场景模型:第一大场景:虚拟现实 + to C → 顺人性:各类娱乐类、社交类应用、内容、产品等;第二大场景:虚拟现实 + to B/G → 顺人性:各类办公类、业务类应用、产品、服务等;第三大场景:人机共生/协同 + to C → 顺人性:如家庭端的服务型机器人;第四大场景:人机共生/协同 + to B/G →顺人性:如应用于医疗领域的脑机接口;第五大场景:虚拟现实 + to C → 逆人性:如学生的网课、健身应用等;第六大场景:虚拟现实 + to B/G → 逆人性:如考勤/规范类的应用、产品、服务;第七大场景:人机共生/协同 + to C → 逆人性:如机器人管理员类的应用、产品;第八大场景:人机共生/协同 + to B/G → 逆人性:如管理类的应用、产品、服务。

  6.3.大模型×空间计算平台:开源 VS 封闭两种阵营

  个人计算机面世之初,人机交互最早的形式是命令行。Apple II 问世。在 70 年代末开创了个人计算机的产业。IBM 兼容机+DOS 操作系统。每次操作计算机,都要从记忆中抓取命令字符,准确输入,才能准确输出。Apple Macintosh 问世,图形用户界面(GUI)开始成为主流。图形用户界面彻底改变了计算机信息呈现和交互。鼠标来回轻点,随便拖曳窗口,极大地降低了操作难度。Macintosh 使用独立的 Mac OS 操作系统,微软研发的 Windows 操作系统发力兼容机市场,二者合力推动了个人电脑的大规模运用,也改变了人类的生产和生活方式。90 年代初期的个人电脑市场主要由三部分构成:1)来自 IBM 的 IBM PC 以及 OEM 厂家的 IBM PC 克隆机:运行 MS-DOS、Windows3.0 或是 OS/2 操作系统;2)苹果 Macintosh:运行苹果 System 6.0/7.0 操作系统;3)其他 PC 厂家(Atari、Commodore、Amiga、NeXT)。此时操作系统主要由硬件厂家主导,硬件厂家可以一手包办硬件设备与软件操作系统。

  Symbian 与诺基亚一同成就了功能机的巅峰,也一同消弭于智能机的浪潮。iPhone 重新定义了智能手机,触摸取代键盘成为人机交互的主流。iPhone 所搭载的 iOS 操作系统只能为苹果硬件服务,市场上其他的硬件厂商必须选择搭载其他操作系统来满足终端用户的需求。谷歌组建 OHA 联盟,Android 操作系统成为适配多元硬件的开放生态中最大的赢家。智能手机一超一强格局延续至今,基本是 Android(70%),iOS(20%+),其他(10%-)。但近几年,Android 份额下降而 iOS 份额提升,主要是苹果在高端智能手机市场的优势进一步拉大。

  智能手机操作系统鏖战,Android、iOS 突出重围,分别代表着开源与闭源的两种形态。

  iPhone 的闭环生态:自研芯片+iOS+App Store

  苹果 iPhone 以“自研芯片+iOS 操作系统+App Store”构建软硬件一体的闭环生态。闭环生态的突出优势在于软硬件整合程度高、可升级、安全性高。 软硬件整合程度高:iOS 操作系统的软硬件整合度高,实现从“自研芯片+iOS 操作系统+应 用软件”的完美适配,避免兼容性差异等常态化问题,大幅提升系统的稳定性。与之对照,Android 系统的分化程度较高,碎片化程度较高。系统可升级:通过 FOTA(Firmware Over the Air,固件空中升级)技术,苹果用户摆脱了过去仅允许连接 iTunes 才能进行系统更新的限制,使其第一时间在联网状态下就能完成 iOS 系统的在线升级,以获得更强的手机性能。安全性高:在闭环生态下,苹果能够快速捕捉到系统中存在的安全漏洞,并通过 FOTA 方式及时推送给用户以实现在线修补。同时,应用软件开发商仅能通过苹果提供的工具包进行应用开发,并在其严格的审核机制下才能推出应用功能。

  Android 的联盟生态:开放硬件+开源软件

  由于自身软硬件能力的缺乏,Android 采取了与苹果不同的开源策略——建立联盟生态:联合手机制造商、软件开发商、芯片制造商等多方势力,共同成立 OHA(Open Handset Alliance,开放手持设备)联盟,基于 Android 源代码构建包含操作系统、中间件、应用程序在内的开源软件框架,以实现 Android 系统与不同手机终端及芯片间的兼容与适配,形成从“芯片+操作系统+应用+终端”的 Android 联盟生态。OHA 联盟中成员可分为五类:通信运营商、手机制造商、半导体公司(芯片厂商)、软件应用开发商、商业公司。近五年 Android 统治地位有松动迹象,iOS 稳中有升。据 Statcounter 统计,Android 市场份额由 2018 年的 75.45%下滑至 2022 年的 71.44%,降低 4.01 个百分点;同期,iOS 市场份额则由 20.47%增长至 27.88%,增加 7.41 个百分点。外因:华为 1)受到制裁后芯片短缺,暂时难以再参与高端手机市场的竞争,这部分用户转向苹果手机;2)华为手机自研鸿蒙 OS,所有搭载华为麒麟 710 芯片及其以上的机型均可升级。内因:OHA 成员需要保持对 Android 的兼容性,导致安卓手机同质化较严重、用户体验待优 化,难以攻克高端机市场份额。

  在定义新交互范式的竞争中,目前微软与苹果再次相互角逐。在过去,苹果曾经两次定义硬件的交互方式,PC 时代的 Apple Lisa 电脑,是首次采用图形用户界面(GUI)与鼠标的个人电脑;到智能手机时代,iPhone 定义了触控交互。在 50 年前,即个人电脑的发展初期,微软与苹果是 PC 互联网时代的两大科技巨头,分别代表了软件与硬件、封闭与开源之间的竞争。50 年后的现在,微软携手 Open AI 实现抢跑,迅速推进 AI 与各业务的协同,并开放 ChatGPT 的第三方插件的功能,加速 AI 在各行各业的落地商用。Open AI 开放 ChatGPT 的插件功能,意味着 ChatGPT 不仅提供服务,还正在创建一个生态系统,使开发人员可以为用户创建与分发他们自己的插件。这类似于苹果的 App Store 通过允许第三方应用在其设备上繁荣起来,从而革新智能移动生态,ChatGPT 的生态系统直接对标苹果的 App Store。 行至中场,XR 时代需要怎样的操作系统?XR 需要一套全新的原生的操作系统。专门基于 XR 特性设计的包含交互方式、应用模式、内容分发的操作系统。XR 设备、内容有着区分于 PC 或 智能手机的显著差异,3D 化、空间化、多任务等,对算力和功耗的要求也更苛刻。基于现有 Android 系统改造的 XR 操作系统长期难以适应 XR 的发展需求。

  四大巨头角逐操作系统霸主。复盘 PC 及移动操作系统历史,寡头垄断可能是最终格局。争夺 XR 操作系统霸权的战争已经开始。下一代硬件仍在演进,但四家重要的参与者——苹果、微软、谷歌和 Meta 针对 VR、AR 头显提供操作系统的竞争已经非常激烈。

  来源:未来智库

大巡礼
新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述

微博

HOT RECOMMEND

关于新浪VR | 论坛社区

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有