“MR 硬件的升级跟 Web3 有什么关系?”我们先从 Mint Ventures 对元宇宙赛道的 Thesis 聊起。
原文作者:Scarlett Wu
原文来源:mintventures
6 月 6 日的 WWDC(苹果全球开发者大会)凌晨,也是发现自己 covid 二阳的第五天,我摆着养生茶跟朋友连麦唠嗑 : 一小时过去了,这次的 One More Thing 不会又推迟了吧?
于是等到凌晨两点库克出现,大手一挥 “One More Thing”,屏幕这端的我跟朋友一起欢呼:
Macintosh introduced personal computing, iPhone introduced portable computing, and Apple Vision Pro is going to introduce Spacial Computing
麦金塔电脑开启了个人计算机的时代,iPhone 开启了移动互联网的时代,而 Apple Vision Pro 将开启空间计算的时代。
作为前沿科技爱好者,我为明年可以拥有的新玩具欢呼,但作为关注游戏、元宇宙和 AI 的 Web3 投资人,这是一个让我颤栗的新时代标志。
你可能会感到怀疑,“MR 硬件的升级跟 Web3 有什么关系?”那么,我们先从 Mint Ventures 对元宇宙赛道的 Thesis 聊起。
区块链世界的资产溢价,来源于:
虚拟世界的商品比实体商品更容易证券化:
那么,下一步会是什么? 可交易的虚拟世界资产将是我们始终看好的主题。
随着虚拟世界的体验提升,人们在虚拟世界中的沉浸时间会越来越长,从而带来注意力的转移。而注意力的转移也将带来估值溢价从强依附于实体向虚拟资产转移。Apple Vision Pro 的发布,将彻底改变人类跟虚拟世界交互的体验,从而带来虚拟世界沉浸时长增长,和沉浸体验的大幅提升。
Source: @FEhrsam
注:这是我们对于定价策略的变体定义,在溢价定价策略中,品牌将价格定在一个远高于成本的价格区间,在定价和成本的差值里填充品牌故事和体验。此外,成本定价、竞争定价、供需关系等等也是商品定价时会考虑的要素,此处仅针对溢价定价进行展开。
现代社会对 XR (Extended Reality 拓展现实,包括 VR 和 AR) 的探索始于十多年前:
当我们回顾 XR 的历史,可以看出这个行业的拓展和培育难度远远超出市场上所有人的预估,不管是财大气粗手握众多科学家的科技巨头,还是聪明能干融资上亿专注 XR 的创业公司。2016 年消费级 VR 产品 Oculus Rift 发布以来,所有 VR 品牌,如三星的 Gear, 字节的 Pico, Valve 的 Index, 索尼的 Playstation VR, HTC 的 Vive 等,累计出货量不到 4500 万台。由于 VR 设备目前最广泛的用途仍然是游戏,在 Vision Pro 发布之前,人们愿意偶尔使用的 AR 设备并没有出现,根据 SteamVR 的数据,可较为粗略地推断,VR 设备的月活跃用户可能仅有小几百万。
XR 设备为什么得不到普及?无数创业公司的失败经验和投资机构的总结可以给出一些答案:
视觉上,VR 设备由于视角更广,离眼球更近,即使是最顶尖的设备,屏幕上的像素点仍然难以忽视。单眼 4k, 也就是双眼 8k 的分辨率才能充分沉浸。此外,刷新率也是维持视觉体验的核心要素。市面上普遍认为,为了达到防晕眩的效果,XR 设备需要每秒 120 HZ,甚至 240 HZ,来维持类似现实世界的体验。而刷新率,在同等的计算能力下,是需要与渲染水平平衡的要素:Fortnite 在 60 HZ 的刷新率下支持 4k 清晰度,而在 120 HZ 的刷新率下则仅支持 1440p 的清晰度。
因为跟视觉的直观相比,听觉短时间内显得似乎不值一提,大多数 VR 设备都没有在这个细节上下功夫。但想象一下在一个空间里里不管是左侧还是右侧的人,说话的声音都稳定地从头顶传过来,会大幅削减沉浸感。而当 AR 空间里的数字 Avatar 被固定在客厅里,玩家从卧室走向客厅时听到 Avatar 说话的音量大小相同,也会微妙地降低空间的真实感。
交互上,传统的 VR 设备都配有控制手柄,更有如 HTC Vive 需要在家里安装摄像头以确认玩家的移动状态。虽然 Quest Pro 有眼动追踪,但延迟高、灵敏度一般,主要用于局部渲染加强,实际交互操作仍以手柄为主。同时,Oculus 也在头显上安装了 4 – 12 个摄像头以确认用户所在的场景状态,达成一定程度上的手势交互体验(比如,在 VR 世界里用左手捡起一部虚拟手机,右手食指虚空点击确认开启游戏)。
重量上,让人体感舒适的设备质量应该在 400-700g 之间(虽然相比正常 20g 左右的眼镜,这仍然是庞然大物)。但为了达到上述清晰度、刷新频率、交互水平、与其渲染要求匹配的计算能力(芯片性能、大小和数量),和数小时的基础续航要求,XR 设备的重量是一个艰难的取舍过程。
综上,如果要实现 XR 成为下一代的手机,成为新一代大众硬件,需要分辨率 8k 以上的设备,且刷新率大于 120 HZ 以避免用户感到眩晕。这个设备应该拥有十几枚摄像头,4 小时甚至更长(只需要午饭/晚饭休息时取下)的续航能力,不发热或少发热,重量小于 500g, 且价格低至 500 – 1000 美元。现在的技术实力,尽管相比上一波 15 – 19 年的 XR 热潮已经提升不少,但达到上述标准仍然具有难度。
但即便如此,如果用户开始体验现有的 MR(VR + AR) 设备,会发现目前的体验虽然不算完美,也是 2D 屏幕无法比拟的沉浸的体验。但这种体验仍有相当大的提升空间——拿 Oculus Quest 2 举例,大多数可以观看的 VR 视频都是 1440p,甚至没有达到 Quest 2 4K 的分辨率上限,刷新率也远不到 90HZ。而现有的 VR 游戏,仅有相对拙劣的建模,且可供尝试的选择并不多。
Source: VRChat
Killer App 的“尚未出现”有其受困于硬件的历史原因——即使 Meta 尽力压缩利润空间,几百美元的 MR 头显与相对简陋的生态,相比现有生态丰富、用户基数已成规模的游戏主机,仍然不具有吸引力。VR 的设备保有量在 2500 – 3000 万之间,而与之对比的,3A 游戏的终端(PS5, Xbox, Switch, PC)保有量为 3.5 亿。因此,大多数厂商都放弃支持 VR,支持 VR 设备的少数游戏也是“顺带布局 VR 平台”,而非“仅支持 VR 设备”。此外,由于在第一点中提及的,像素点、晕眩、续航差、重量过沉等问题,VR 设备的体验并没有比传统 3A 游戏终端更好。而 VR 支持者试图强调的“沉浸”优势,则由于设备保有量的不足,“顺带布局 VR 设备”的开发者鲜有专门做针对 VR 设计的体验和交互模式,难以达到理想体验。
因此,目前的局面是,当玩家选择 VR 游戏而不是非 VR 游戏,他们不仅是“选择了一款新游戏”,而且“放弃了与大部分朋友社交的体验”,这样的游戏场景往往是游戏性、沉浸体验远大于社交性。当然,你可能会提及 VR Chat,但如果深入挖掘会发现,其中 90% 的用户并非 VR 用户,而是在普通的屏幕前想体验以各种 Avatar 跟新朋友社交的玩家。因此,VR 软件中最受欢迎的游戏是《节奏光电》这样的音游也就不足为奇。
所以我们认为,Killer App 的出现,需要以下几个要素:
Source: The Verge
那么,Vision Pro 能够解决上述问题吗?又会给行业带来怎样的转变?
6 月 7 日的发布会上,Apple Vision Pro 发布,按上面我们分析的“ MR 在硬件和软件所遇到的挑战”框架,可以进行如下类比:
硬件:
软件上,Apple 不仅可以凭借其数百万开发者生态完成一定程度的迁移,而且实际上已经凭借 AR Kit 的发布早已有了一系列生态布局:
早在 2017 年,Apple 就发布了 AR Kit: 一套与 iOS 设备兼容的虚拟现实开发框架,允许开发人员创建增强现实应用程序并利用 iOS 设备的硬件和软件功能。VR Kit 可以通过使用 iOS 设备上的摄像头创建该区域的地图,使用 CoreMotion 数据检测桌面、地板和设备在物理空间中的位置等事物来实现数字资产在摄像头下与现实世界进行互动——比如,你可以在 Pokemon Go 里看到埋在土里、停在树上的宝可梦,而不是大剌剌地显示在屏幕上随摄像头而移动。用户无需对此进行任何校准——这是无缝的 AR 体验。
https://pokemongohub.net/
回顾 AR Kit 从七年前就已经开始的布局,可以看出,Apple 在 AR 方面的技术积累并非一朝一夕,而是潜移默化地先将 AR 体验融入已经广泛传播的设备中,Vision Pro 发布之时,Apple 已经完成了一定的内容和开发者积累。同时,由于 AR Kit 开发的兼容性,开发出来的产品不仅是面向 Vision Pro 的用户,也能在一定程度上适应 iPhone 和 iPad 的用户。开发者可能不需要受限于 300 万月活跃用户的天花板来开发产品,而是潜在地面向数亿 iPhone 和 iPad 用户进行测试和体验。
此外,Vision Pro 的 3D 视频拍摄也部分解决了如今 MR 内容有限的难题:内容生产。现有的 VR 视频大多是 1440p,在 MR 头显的环形屏幕体验里显得像素很差,而 Vision Pro 的拍摄则兼具高像素的空间视频和不错的空间音频体验,或将大幅提升 MR 的内容消费体验。
尽管上述配置已经相当震撼,苹果 MR 的想象力并不止步于此:Apple MR 发布的当天,一位自称曾参与过 Apple 神经科学方面的开发者 @sterlingcrispin 如此说道:
Generally as a whole, a lot of the work I did involved detecting the mental state of users based on data from their body and brain when they were in immersive experiences.
总的来说,我从事的许多工作都涉及通过用户在沉浸式体验中的身体和大脑数据来检测其心理状态。 So, a user is in a mixed reality or virtual reality experience, and AI models are trying to predict if you are feeling curious, mind wandering, scared, paying attention, remembering a past experience, or some other cognitive state. And these may be inferred through measurements like eye tracking, electrical activity in the brain, heart beats and rhythms, muscle activity, blood density in the brain, blood pressure, skin conductance etc. 用户处于混合现实或虚拟现实体验中,AI模型试图预测他们是否感到好奇、心不在焉、害怕、专注、记忆过去的经历或其他认知状态。这些状态可以通过眼动追踪、脑电活动、心跳和节律、肌肉活动、脑部血液密度、血压、皮肤电导等测量得出。
There were a lot of tricks involved to make specific predictions possible, which the handful of patents I’m named on go into detail about. One of the coolest results involved predicting a user was going to click on something before they actually did. That was a ton of work and something I’m proud of. Your pupil reacts before you click in part because you expect something will happen after you click. So you can create biofeedback with a user’s brain by monitoring their eye behavior, and redesigning the UI in real time to create more of this anticipatory pupil response. It’s a crude brain computer interface via the eyes, but very cool. And I’d take that over invasive brain surgery any day.
为了实现特定的预测,我们使用了许多技巧,这些技巧在我名下的几项专利中都有详细介绍。其中最酷的结果之一是在用户实际点击之前预测到他们要点击某个目标。这是一项艰巨的工作,我为此感到自豪。你的瞳孔在你点击之前就会有反应,部分原因是你期望在点击之后会发生某些事情。因此,通过监测用户的眼动行为并实时重新设计用户界面,可以与用户的大脑进行生物反馈,从而创造更多的预期性瞳孔反应。这是一种通过眼睛进行的粗糙的脑-计算机界面,非常酷。相比侵入性的脑部手术,我更愿意选择这种方式。 Other tricks to infer cognitive state involved quickly flashing visuals or sounds to a user in ways they may not perceive, and then measuring their reaction to it.
其他推断认知状态的技巧包括以用户可能不察觉的方式快速闪烁视觉或声音,并测量他们对其的反应。 Another patent goes into details about using machine learning and signals from the body and brain to predict how focused, or relaxed you are, or how well you are learning. And then updating virtual environments to enhance those states. So, imagine an adaptive immersive environment that helps you learn, or work, or relax by changing what you’re seeing and hearing in the background.
另一项专利详细介绍了使用机器学习和来自身体和大脑的信号来预测你的注意力集中程度、放松程度或学习效果如何,并根据这些状态更新虚拟环境。因此,想象一下一个适应性的沉浸式环境,通过改变你在背景中看到和听到的内容来帮助你学习、工作或放松。
这些与神经科学高度相关的技术,可能将标志着机器和人类意志崭新的同步方式。
当然,Vision Pro 并非没有硬伤,比如其 $3499 的天价,是 Meta Quest Pro 的两倍有余,Oculus Quest 2 的七倍有余,对此,Runway 的 CEO Siqi Chen 如是说:
it might be useful to remember that in inflation adjusted dollars, the apple vision pro is priced at less than half the original 1984 macintosh at launch (over $7K in today’s dollars)
也许大家需要记得,根据通胀调整后的美元价格,Apple Vision Pro 的定价不到 1984 年 Macintosh 推出时的一半(相当于今天超过 7000 美元)。
在这样的类比下,Apple Vision Pro 的定价看上去并不算过于离谱……但是,Macintosh 第一代的销量仅 37.2 万台,很难想象在 MR 上下大功夫的 Apple 能接受类似的尴尬处境——几年内的现实可能并不会有大的改变,AR 不一定需要眼镜,短期内 Vision Pro 也难以大量普及,很可能仅作为开发者体验和测试的工具,创作者的生产工具,和数码发烧友昂贵的玩具。
Source: Google Trend
尽管如此,我们可以看到,Apple 的 MR 设备已经开始搅动市场的风云,将普通用户对数码产品的吸引力重新转移到 MR 上,让大众意识到 MR 已经是较为成熟、不再是 ppt / 演示视频类产品。让用户意识到,在平板、电视、手机之外,还有一个头戴沉浸式显示器的选择;让开发者意识到,MR 可能真正成为了下一代硬件的新趋势;让 VC 意识到,这可能是一个有极高天花板的投资领域。
在过去的半年里,RNDR 已经作为元宇宙、AI、MR 三重概念结合的 meme,多次领涨市场。
RNDR 背后的项目是 Render Network, 一个利用去中心化网络实现分布式渲染的协议。Render Network 背后的公司 OTOY.Inc 成立于 2009 年,其渲染软件 OctaneRender 针对 GPU 渲染进行了优化。对普通创作者而言,本地进行渲染对机器的占用较高,这就产生了云渲染的需求,但如果租用 AWS,Azure 等厂商的服务器用于渲染,可能成本也会较高——这就产生了 Render Network,渲染不局限于硬件条件,连接创作者和拥有空闲 GPU 的普通用户,让创作者得以便宜、快速高效地进行渲染,节点用户可以利用闲置 GPU 赚份零花钱。
对于 Render Network 来说,参与者有两种身份:
RNDR 的 tokenomics 也今年 2 月进行了更改,这也是它价格大涨的原因之一(但直到文章发布,Render Network 尚未将新的 tokenomics 应用到网络中,也暂未给出具体上线时间):
此前,在网络中,$RNDR 的购买力和 Credit 的购买力是一样的,而 1 credit = 1 欧元。在 $RNDR 价格小于 1 欧元时,购买 $RNDR 相比法币购买 Credit 更划算,但当 $RNDR 的价格提升到超过 1 欧元,因为大家都倾向于用法币进行购买,则会出现 $RNDR 失去用例的情况。(虽然协议收入可能会进行 $RNDR 的回购,但市场上其他玩家没有购买 $RNDR 的动力。)
而更改后的经济模型采用了 Helium 的”BME”(Burn-Mint-Emission)模式,创作者购买渲染服务时不管是用法币还是 $RNDR,都会销毁等 95% 法币价值的 $RNDR,剩余 5% 流向基金会作为引擎使用的收入。而节点提供服务时,则不再直接获得创作者购买渲染服务的收入,而是获得新铸造的代币奖励,奖励的依据不仅基于任务完成的指标,还包括客户满意度等其他综合因素。
值得注意的是,每个新 epoch(特定时间阶段,尚未说明具体时长)都将有新的 $RNDR 被铸造,且铸造量被严格限定,随时间推移递减,与代币燃烧的数量无关(详见官方白皮书的释放文档)。因此,会带来对下述 Stakeholders 的利益分配变化:
Source: https://medium.com/render-token/behind-the-network-btn-july-29th-2022-7477064c5cd7
相比之前收入(不定期)回购的模式,新的模式下,在渲染任务需求不足时,矿工可以得到比之前更多的收入,而在渲染任务需求对应的任务价格总额大于释放的 $RNDR 奖励总额时,矿工相比原有模型将获得更少的收入(燃烧掉的 token > 新铸造的 token),$RNDR 代币也会进入通缩状态。
虽然最近半年 $RNDR 涨势喜人,Render Network 的业务情况并没有如币价一般有大幅增长:过去两年的节点数量没有大幅波动,每月分配给节点的 $RNDR 也没有大幅增长,但渲染的任务数量确实有提升——可见创作者分配给网络的任务由单笔较大金额,逐渐走向了多笔小金额)。
https://dune.com/lviswang/render-network-dollarrndr-mterics
虽然赶不上一年五倍的币价涨幅,Render Network 的 GMV 确实迎来了较大的增长,2022 年 GMV(Gross Merchandise Value,成交总额)相比去年增加 70%。根据 Dune 看板的 $RNDR 分配给节点的总量,2023 年上半年 GMV 约为 $1.19 M,相比 2022 年同期基本没有涨幅。这样的 GMV 在 7 亿美元的 mCap 上显然不够看。
Vision Pro 的推出对 RNDR 的潜在影响
在 6 月 10 日发布的 Medium 文章中,Render Network 宣称,Octane 针对 M1 和 M2 的渲染能力是独一无二的——由于 Vision Pro 也采用 M2 芯片,在 Vision Pro 中进行渲染并不会与普通桌面渲染有区别。
但问题是:为什么要在一台续航 2 小时,主要用于体验玩耍,而非生产力工具的设备上发布渲染任务?如果 Vision Pro 价格降下来,续航大提升,重量轻下来,真正实现 Mass Adoption, 可能才会到有 Octane 发挥作用的时机…
可以确认的是,数字资产从平面设备往 MR 设备的迁移,确实会带来对基础设施的需求增长。宣布与 Apple 合作研究如何制造更适配 Vision Pro 的游戏引擎 Unity,当日股价上涨 17%,也说明了市场对此的看好情绪。随着迪士尼和 Apple 的合作,传统影视内容的 3D 化或将迎来类似的需求增长。擅长影视渲染的 Render Network 在今年二月推出了结合 AI 的 3D 渲染技术 NeRFs,利用人工智能计算和 3D 渲染来创建可以在 MR 设备上查看的实时沉浸式 3D 资产 – 在 Apple AR Kit 的支持下,任何人都可以通过较高配置的 iPhone 对物体进行 Photoscan 以生成 3D 资产,而 NeRF 技术则通过 AI 加成的渲染,将简陋的 Photoscan 3D 渲染成不同角度可以折射出不同光线的沉浸式 3D 资产——这种空间渲染将是 MR 设备内容生产的重要工具,为Render Network提供了潜在的需求。
但这个需求是否会由 RNDR 来满足?观察其 2022 年 200 万美元的 GMV,相比影视行业投入的成本可谓九牛一毛。综上,RNDR 当然可能继续以“元宇宙、XR、AI”赛道的 meme 在赛道火热时再创价格辉煌,但要产生与估值相匹配的收入仍然难度较大。
虽然我认为实质上的基本面改变有限 – 但与 MR 相关的话题似乎也绕不开这几个大型元宇宙项目,猴子的 Otherside, Animoca 系的 The Sandbox,最古老的区块链元宇宙 Decentraland,以及想做 VR 世界 Shopify 的 Highstreet.(对元宇宙赛道的详尽分析参考 https://research.mintventures.fund/2022/10/14/zh-apecoin-values-revisited-with-regulations-overhang-and-staking-rollout/ 的 4. 业务分析 – 行业分析与潜力部分)
但正如上文在“Killer App 仍未出现”中分析的,大多数现有支持 VR 的开发者,并非“仅支持 VR”(就算仅支持 VR 且做到了行业头部,在一个百万量级 MAU 细分市场里做到头部也不是碾压级别的竞争力),已有的产品并未对 MR 的用户习惯、操作交互做细致的适配。而暂未推出的项目实际上和其他所有看到 Vision Pro 潜力的大厂、创业公司实际上站在相距不远的起跑线上:在 Unity 与 Vision Pro 做出更好的结合之后,MR 生态游戏开发的学习成本有望降低,过往较为狭窄的市场积累起来的经验难以在一个即将走向 mass adoption 的产品里复用。
当然,如果要谈及先发优势,已经布局 VR 的项目当然可能有微弱的开发进度、技术和人才积累的优势。
如果你没有看过下面这个视频,那么这将是你对 MR 世界最为直观的感受:便捷、沉浸,但又混乱、无序。虚拟与现实融合得如此无缝,被虚拟现实宠坏的人们将「失去设备中的身份」视为世界末日般的大事。视频里的细节在现在的我们看来,仍然觉得有点科幻和难以理解——但这很可能就是我们即将面对的,数年内的未来。
这让我想到另一则视频,2011 年,也就是 12 年前,微软发布了 Windows Phone 7(作为对那个年代没有多少记忆的 Gen Z, 很难想起来微软也曾在手机上下过大功夫),并制作了一则关于智能手机的讽刺广告“Really?”:广告里的人们每时每刻都紧握手机,盯着手机骑单车,盯着手机在沙滩太阳浴,紧握手机洗澡,在宴会上因为看着手机下楼梯而摔倒,甚至因为分神把手机掉进小便池……微软的本意是向用户展示“微软发布的手机,会把我们从手机上瘾中拯救出来”——这当然是一败涂地的尝试,这个“Really?”的广告名甚至可以改成“Reality”。智能手机的“在场感”和符合直觉的交互设计就是比反人类的“手机版 windows 电脑”更让人沉迷,就像虚实结合的现实就是比纯粹的现实更让人上瘾。
怎样把握这样的未来?我们有几个正在探索的方向:
当然,这个领域的创业者大概率会比我们有更深入的理解、思考和更具有创造力的探索——欢迎 DM @0xscarlettw 交流和探讨空间计算时代的可能性。