讲稿 | PICO的UGC之路,是时候为VR摄影制定标准了

 文 | HW君 

本文为B站【R7】期的视频讲稿

此讲稿未经校对,仅作参考,最终版本以成片视频为准。


【0】导入:双目VR摄影

 

我们在某个位置拍一张照片,然后将相机向右水平移动65mm,再拍第二张照片。

这样拍出来的两张照片,画面会有细微的不同。

 

人眼也是如此,两只眼睛之间存在着距离(瞳距),因此左右眼在同一时刻看到的画面是有差异的,称为「双目视差」。

大脑可以依靠这种「双目视差」来产生立体视觉,从而判断眼前的物体与我们之间的距离(深度信息)。

 

而VR设备这类「双目显示器」的秘密就在于,两只眼睛的画面是分开显示的。

VR设备通过在同一时刻对左右双眼输出带有「双目视差」的不同画面,从而为我们提供「深度信息」,营造视觉上的立体感。

 

因此我们可以模仿人眼的这一特性,用水平放置、距离为人眼「瞳距」的两个摄像头,去共同拍摄一个场景。

后期使用VR设备进行观看,那么我们的大脑就能还原出所拍摄场景里的深度信息。

这就是「双目VR摄影」,它至少需要用到2个摄像头。

 

因此如果想要成为「下一代智能设备」,现阶段的PICO还是不够格的,它缺少一个可用的「双目相机」。

只单单一台PICO,就像一个缺了摄像头的智能手机一样,它是不完整的。

 

 

 

「双目相机」一直是小众中的小众,我淘了一些,但能用的并不多。

「看到科技」生产的「酷看EGO」其实就是一款不错的,被低估的「双目相机」。

不贵,拍摄方便,画质够用,后期剪辑配置要求不高,能快速出片。

 

在「PICO视频」里有一个「抖音」入口,目前在这里只能刷大屏版的2D版抖音。

这么显眼的一个位置,估计将来会规划上线3D版的抖音短视频,专供PICO。

 

如果使用「酷看EGO」这个双目相机,那么普通人其实也可以拍摄3D版的抖音短视频。

这些3D版的短视频,只有在使用VR设备观看才能获得完整的立体感,其观感大致和看PICO视频里的那些3D电影一样。

 

我用「酷看EGO」拍摄并制作了一些3D视频,网盘链接放在视频下方简介里了。

有VR设备的朋友,可以试试下载观看。

 

PICO里的抖音板块,未来应该会逐步开放上传分享3D短视频的功能。

而借助类似「酷看EGO」这样的双目相机,3D短视频的创作门槛会变得很低,应该会有很多人投入到这一类创作中来。

 

 

当然,「酷看EGO」拍摄的这种16:9的3D视频,虽然它也带有深度信息,但是相机镜头的水平视野只有很小的66°。

因此它的观感跟我们在电影院看3D电影的体验类似,故事里的画面虽然很立体,但仍与你保持着一定的距离感,你像是在透过一个16:9的画框去看这个世界。

 

我们不妨将这类在电影院里能体验到的3D视频,称为「平面3D视频」,因为电影院的银幕就近似是一个平面。

那区别于「平面3D视频」,还有另外的一种形式的影像,我们则可以称之为「球面3D视频」。

「球面3D视频」其实也可以依靠「球面银幕+投影」来实现,但性价比最高的方案则是用VR这种「双目显示器」来模拟。(iDome)

 

 

其实「球面视频」有个更广为人知的说法,叫「全景视频」。

但「全景」之间亦有不同,它也可以分为2D和3D的。

其区别就在于画面是不是「双目」的,能不能提供基于「双目视差」的「深度信息」。

 

现在也有很多自称「VR全景」的网站,但它们提供的其实都是「单目2D」的全景资源。

而这里所讨论的是「双目VR摄影」,它和「单目2D」的传统全景摄影,还是有区别的。

如果你不理解「单目2D全景」和「双目3D全景」的区别,那可以看一下上一期【R6】期的第2节。

 

受限于当下的摄影技术,360°完整球面的全景视频,常常都是2D的。

做成3D需要用多个摄像头进行图像拼接,在技术上会很困难,

而在有一款便宜好用且画质合格的VR设备出现之前,制作3D全景完全是一件费力不讨好的事情,辛苦制作的3D影像却没有多少设备可以观看。

 

但现在PICO 4出现了,相比于Pico Neo 3,它至少在颜色还原上是合格的了,让我产生了尝试VR摄影的念头。

 

3D全景确实很难,但若不追求360°的完整球面,则可操作的空间就比较大。

如果「双目相机」所使用的圆周鱼眼镜头,视野为180°,则可以一次性记录下空间半球大小的3D画面。

 

虽然实际上我们可用的「深度信息」范围大概只有中央的90°,到边缘部分会丢失立体感。

但是问题不大,通常情况下我们只关心视野中间的部分,因此180°视野一个非常具有性价比的方案。

而180°视野已经可以完整覆盖PICO 4的105°视场角,并留有转头的余量,于是它可以提供更高的VR沉浸感。

 

 

谷歌在2017年的时候就为视频网站Youtube制定了「VR180」视频格式。

现在PICO视频里的才艺直播,采用的就是那时候定下来的VR180模式。

 

许多硬件产商也生产了符合VR180规格的相机硬件。

例如,这是2019年的「Insta360 EVO」,可以拍摄6K的照片和5.7K+30帧的视频。(二手1500)

这个设备生不逢时早已停产了,但它却是目前在国内能买到的性价比最高的入门级VR180相机。

而前面提到的「酷看EGO」的镜头视野只是很窄的66°,我们不妨称其为VR66相机。

 

我用「Insta360 EVO」拍了些照片和视频,然后在PICO 4里进行回看。

因为VR180模式要覆盖的画面远大于「酷看EGO」的中央66°,如果将「视场角」定为缩放标准,那么「Insta360 EVO」的画面大小会是「酷看EGO」的9倍。

假设要达到相同的PPD清晰度,那么像素量也应该要有9倍。

 

所以虽然「Insta360 EVO」可以拍5.7K视频,而「酷看EGO」只能拍4K视频。

但「Insta360 EVO」的观感和清晰度实际上是更差的,颗粒感十足。

 

但这仍然是一种非常神奇的体验,虽然我已经在PICO里看过很多别人拍的VR180影像,但是当你尝试着去记录自己周围所熟悉的环境时,会有一种截然不同的感受。

 

传统的「单目相机」拍出来的照片,记录的是空间里一个平面的2D切片。

而这种「双目相机」拍出来的照片,记录的则是空间里的一个3D切片。

 

这段时间里我拍了很多VR照片,恍惚间像回到了学生时代。

中学时期,在拥有了自己的第一部安卓手机之后,我每天都会用手机到处拍照。

 

不同的是,手机照片拍完就可以直接查看,而这些VR180的照片只有在VR设备里才能被完整观看。

「VR头显+双目相机」,这样才能算是一个具有完整输入输出的整体。

现在的PICO还不能算是一台完整的智能设备。

 

 

 

【0-1】物理法则无法违背

 

如果你严格遵照某些标准,来拍摄球面的VR照片或者VR视频,那么这些带有深度信息的3D影像在VR设备里的显示就是非常还原真实的。

它们几乎和我们人眼感受到的现实世界是一样的,就像是你虽然带着PICO,但你把它中间的屏幕和挡板给拆掉了,只是透过一个中空的VR镜框在观看这个世界。

 

这种真实的感觉非常好,大多数时候都能给我一个可用的画面。

直到,你需要显示一些近端的物体。

大概1米以内,所有在近端的物体,都会有一种微妙的不自然的感觉。

 

是这台便宜的「Insta360 EVO」的问题吗?似乎并不是。

我在很多VR180视频里都有察觉到这个问题。

无论是Youtube上的,或者是PICO里的视频和直播,以及一些不能提的视频里,在1米以内的近端显示里,常常能察觉到相同的问题。

在确定 「瞳距」没有问题的情况下,近端显示的透视关系非常奇怪,明明我已经靠得很近了,但是总觉得画面里的物体还不够大。

 

鉴于「Insta360 EVO」这款相机是个黑盒,我无法知晓它的详细工作参数。

所以我自己又DIY了一套「双目相机」,用的是索尼A6400机身和老蛙4mm F2.8鱼眼镜头。

用它可以拍VR180模式的6K照片和4K视频,后期需要对两个画面进行手动拼接。

虽然像素并不高,但因为传感器的底更大,所以这套「双目相机」的实际画质要比「Insta360 EVO」要好。

 

而且因为它是可更换镜头的,如果把鱼眼镜头更换成普通的线性镜头,那么也能拍像「酷看EGO」那样的8K「平面3D视频」,并且是16:9的竖版画面,等效24mm广角端的水平视野约为45°。

并且因为这套相机可以直出实时画面,因此理论上它也可以用来做3D直播,包括VR180直播和平面3D视频的直播。

 

所以这里也有一个很关键的思维转变,3D直播不一定非要是现在「PICO才艺直播」的那种VR180模式,也可以是平面16:9(4:3或1:1)的模式。

「球面3D」还是「平面3D」并不是关键,关键的是要有VR设备独享的深度信息。

 

而「平面3D」相对于VR180也有一些优势。

「平面3D」如果选取合适的镜头,就可以更好地进行产品或者景物特写,直播员也可以对画面进行选取和把控。

而VR180的视角就只能是固定的180°,无法线性缩放。

一个优秀的「平面3D」直播,在体验上肯定要比硬上的粗糙VR180直播好,并且直播的成本和门槛也会下降很多。

 

 

 

那回到这套DIY的「双目相机」,因为机身和镜头的参数是透明的,所以我们可以更加准确地做出分析。

那么最后我得到了一些结论,这些结论非常有趣,不过有点枯燥。

所以这里我只是稍微提一下,以后会专门做其他的视频来讨论这个话题。

 

我们可以得到这样的一张「深度-放大率」图。

横轴是深度(距离),单位为米。

纵轴是放大率(垂轴放大率),1表示1倍。

 

我DIY的这套双目VR相机,它线性等效全画幅的「深度-放大率」曲线是这样的。

这条曲线取决于这颗老蛙4mmF2.8圆周鱼眼镜头的物理光学设计。

 

那老蛙的这颗镜头的光学设计是很常规的,目前公认口碑不错的VR镜头是佳能的RF5.2mm双鱼眼,它的曲线和老蛙的这颗差不多贴合,都是在各自画幅下性价比较高的方案。

(线性等效13.5mm)。

 

但如果我们把人眼也看做是一个镜头,那么人眼的「深度-放大率」曲线是怎么样的呢?

其量级大概是这样的。

 

对比两条曲线可以看到,在2米以外,我们可以把这两条曲线的放大率都近似当作是固定的1倍,人眼基本上察觉不到区别。

但是在靠近1米以内的近端位置,人眼的放大率相对于我手上的这颗老蛙鱼眼镜头,会有一个快速的上升,尤其是到了0.5米以内,两条曲线之间会出现一个比较大的分离。

 

而这就是我所察觉到的不适感的来源。

在保证瞳距正确的情况下,明明已经靠得很近了,但是我总觉得眼前的物体很小。

要知道人眼对于自己熟悉的物体的大小变化是非常敏感的。

包括自己的双手和手机,日常的办公桌面,以及其他人的体型。

 

尤其是其他人的体型大小,人眼很容易一眼就发现差异。

朋友见到我的第一句话常常会是,你怎么又变胖了。

 

而这种「深度-放大率」的不匹配,纯粹是镜头的物理光学性质导致的,几乎没有办法靠后期的算法来进行弥补。

所以现阶段所有在近眼端(1米以内)的VR摄影,包括基于双目摄像头的VST彩色透视功能,都会遇到这个棘手的问题。

 

当然,目前的VR技术还远没有到需要考虑这个问题的地步。

相对来说,它的影响不算太瓶颈,因此优先级并不高。

还有更多急迫的问题需要解决,解决之后即便不考虑这个问题,VST也可能已经是够用的了,因人而异。

因此这里只是一个相当超前的个人推论。

 

而要解决这个问题,要么得去设计新的符合人眼「深度-放大率」曲线的镜头(线性等效全画幅50mm的鱼眼镜头),要么你就避开在1米以内的近端显示。

可是这1米以内的近端显示,却是我们在现实世界里活动的最重要的区域。

 

Meta想通过VST透视功能来实现VR办公,PICO主推的VR直播,都很大程度上需要一个优秀的,符合真实观感的VR近端显示功能。

否则我们就不得不去适应这种不自然的透视关系,而这会破坏VR的真实沉浸感。

 

PICO的VR直播还好,可能看久了你就适应了这种怪异,因为你不知道真实场景是怎么样的。

而Meta依靠实时VST功能的VR办公,可能问题会更大一点,因为我们摘下VR设备就能对比看到现实场景是怎么样的,你很容易感受到异常。

 

所以这里我也有一个推论,如果近端显示的问题无法得到解决。

那么很多人所畅想的有关VR的,基于「VST双目彩色透视」功能的混合现实应用场景,可能会有很大一部分是难以落地实现的。

因为它无法还原人眼所看到的真实场景,会造成严重的错位和眩晕,作为生产力工具来说不太合格。

 

而这其实是一个物理镜头光学设计上的问题,很难靠软件算法进行后期弥补。

因为人眼是一个「定像距系统」,它有一套测量世界的基准。

我们无法违背物理法则。

 

 

【1】何以UGC社交平台

消失的模因,大家好,我是HW君。

欢迎来到【R7】期,R是Random,这是【HW君随便聊】系列的第7期。

开头导入的部分比较长,那这一期还是聊VR,接下来的内容分为3个部分。

聊聊PICO的UGC社交平台之路。

聊聊我为什么看好VR照片,最后也会谈谈对PICO《轻世界》的看法。

 

那先解释一下标题,UGC是「User Generated Content」的缩写,指的是平台上的内容由用户自己生产。

与它对应的是PGC,「Professionally Generated Content」,指的是平台上的内容由专家来生产。

 

其实UGC和PGC之间也没有非常明显的界限,说白了就只是创作门槛的高低不同而已。

UGC意味着创作门槛低,人人都能自由创作。

这在智能手机上是差不多已经实现了的,但是到了VR领域里,VR内容创作的门槛又重新变得很高起来。

 

例如在抖音上开直播,你只需要有个智能手机就行。

但是目前PICO里的VR直播却有着普通人难以跨越的门槛。

像PICO官方使用的双目VR相机是「西顾视频」的FM·DUO,一台报价是2万美元,并且推流8K直播要用到的电脑配置需要i7+32G+3060。

因此目前它的模式就只能是高门槛的PGC模式,而不是「人人皆可创作」的UGC模式。

 

那PICO应该要如何应对当前VR内容创作门槛过高的问题呢?

这是我这个视频思考的起点。

 

那我思考的结果其实也很简单,那就是「VR照片+平面3D视频」。

这是为数不多,可以在有限算力下达成最大丰富度的VR内容UGC模式。

 

尤其是「VR照片」,它是一个被人忽视却非常重要的功能。

我相信很多人用了这么久VR设备,但却从来没有自己去尝试过拍摄一张VR照片,包括一大批VR从业者。

 

如果要把VR当作类似「智能手机」的下一代智能设备,那就不应该忽视「拍照」的这个功能。

我自己的手机里占据空间最大的APP并不是社交软件「微信」,而是手机自带的相册。

而且相册里存得最多的不是视频,而是照片。

 

现在很多人天马行空地展望着VR的科幻愿景,但却忘记了「VR照片」这个最简单的事物。

一方面是我们处于短视频和直播的时代,容易忽视最基础的静态照片,一张不能动的照片好像就不那么酷,不那么具有科技含量。

 

另一方面是因为市面上可用的「双目相机」很少,非常小众。

并且「双目VR摄影」和传统的平面摄影有非常多不同的思考逻辑,没有尝试过的话,就难以体会到其中的魅力,与一些困境。

 

 

那如果你对「双目VR摄影」这一块的理论感兴趣,可以关注一下我的频道。

后续我会再开一个新系列来讨论这些内容,也包括有哪些入门器材,VR影像可以如何进行后期等。

还有那条「深度-放大率」曲线是如何计算的,以及VR摄影的近端显示困境和衍生出来的VST难题等。

 

那并不是说我在摄影这一块有多专业,而是「双目VR摄影」这个领域真的太新了。

它有很多与传统的「平面摄影」截然不同的思维模式,我对这种「思维模式」上的转变很感兴趣,目前国内也没有见到关于这一块的通俗内容分享。

不过这些是后续视频的制作打算,这一期主要还是想谈谈我对PICO做UGC内容平台的看法。

 

 

 

【1-1】戴着算力的镣铐跳舞

上一期【R6】期我们聊了Pico Neo 3和A-SOUL。

那这次PICO 4发布会官宣了A-SOUL的演唱会之后,我也购入了PICO 4。

算是爱屋及乌吧,毕竟PICO也是A-SOUL的一个舞台。

 

11月6号A-SOUL的VR演出我也看了,有妥协也有感动,那希望A-SOUL能越来越好。

像我这种其实就是PICO的核心付费用户,只要PICO上还有A-SOUL的独占内容,那么我就还会继续使用和购买PICO。

 

但像我这样的群体毕竟是少数,因此我也一直在想,如果我不是A-SOUL的观众,我会在什么情况下去购买使用PICO呢?

 

这个问题其实还是挺重要的。

像这次的PICO 4发布后,用户群里最感兴趣的和讨论得最多的,是如何转区然后使用VD串流玩SteamVR游戏。

这是一个要让PICO有危机感的现象。

 

Meta的Quest系列证明了「VR游戏机」这条路走不通,或者说不好走。

游戏玩家买了Quest之后,并不满意VR一体机上的游戏,而是选择串流PC。

可是一但串流,用的就是Steam的平台,玩的是Steam的游戏,消费的是Steam的内容。

 

Meta花钱补贴硬件想做生态,却为Steam做了嫁衣,到头来发现VR一体机的应用场景并没有什么想象空间,玩家想要的只是更加便宜的PCVR而已。

这是Meta在资本市场上不被看好的原因之一。

 

 

而这仍然是我们在【R6】期里讲的,VR目前所遇到的困境,人均算力不足。

VR一体机的算力无法支撑其内容的呈现,于是游戏玩家通过串流,来向PC索要更多的算力。

XR2的算力只有1.2T, 3090ti是40T,最新的4090依靠台积电的工艺把算力堆到了83T。

 

但桌面端显卡堆高算力的代价就是巨大的耗电量和发热量,而VR一体机用的这种移动端的芯片无法做到这一点。

这种量级上的算力差距,苹果来了也没有办法解决,M2芯片的算力也就3T,物理法则无法违背。

 

因此构想VR一体机的使用场景,便是带着镣铐跳舞。

我们要在如何有限的移动算力和网络带宽下,去创造新的使用场景。

 

 

Meta也有打过云端计算的主意。

但VR应用非常在意延迟,很多云计算的设想并不能实现。

像VR云游戏就很难实现,本地串流玩PC游戏的VR玩家整天都在考虑怎么降低延迟,如果把游戏放在云端,那延迟只会更加严重。

 

于是Meta又给出另一个回答,VR云办公。

用VR一体机来取代PC进行办公,不够的算力跟云端服务器借,VR云办公对延迟的要求会比云游戏要低。

 

但我觉得这其实有点病急乱投医。

苹果推iPad Pro的广告是,你的下一台电脑何必是电脑。

但我和朋友聊起这个事情一致的结论就是,如果你对手上的工作还有点尊重,那么就赶紧放下iPad,去找台笔记本来干活。

 

而我认为「VR办公」比「iPad办公」还不靠谱,虽然的确在有些细分的场景下,iPad确实会很方便,VR也是如此,但是所谓的「办公」生产力,一定是效率优先。

而人力往往比设备更贵,我想象不到那种只有VR一体机,却没有其他设备的办公环境。

 

那同样是带着算力的镣铐跳舞。

PICO给出的回答是VR健身和VR视频(包含直播)。

健身这一块我不太了解,所以只谈VR视频。

其实我是挺看好PICO的这套「VR视频」的模式的。

 

我在上一期【R6】期里有提到过,「双目VR视频」是一种算力的集中化,能做到一次渲染,多次分发,算是现阶段可以绕过「人均算力不足」的一种方式。

它可以用「传输带宽」来弥补VR一体机不足的「即时算力」。

 

这其实是比较合理的,因为现在芯片算力的瓶颈,要远比网络传输带宽的瓶颈大。

Meta的云游戏和云办公,用到的是定制化的私有算力,无法多人复用。

但PICO的VR视频所使用的,是一种可以复用的公共算力,效率会更高,虽然缺点是自由度会受限。

 

但即便如此,「VR视频」模式用于制作分发源视频的那个中央算力,它的门槛仍然是非常高的。

像PICO的8K直播的门槛就很高,目前没有办法大规模铺开。

因此现在PICO视频只能走PGC模式,没有办法实现「人人都可以VR直播」的UGC模式。

 

 

 

【1-2】有限算力下的丰富度

Meta和字节都是智能手机时代的社交平台巨头,也都一脚踏入了VR的河流,希望能拿到通往新时代的船票。

 

很多人都觉得VR的未来充满想象力,设想了许多天马行空的使用场景。

但天马行空地幻想未来并不难,难的是在有限的算力约束下,对想法进行取舍。

 

Meta烧了很多钱制作的《Horizon world》,月活跃用户不足20万,据说内部员工都不喜欢使用这个APP。

此前扎克伯格的那张自拍图,受到了全网一致的嘲讽。

难道扎克伯格不知道这张照片太过于简陋吗?

他当然知道,但是没有办法,算力不足。

 

其实我非常喜欢Meta在今年6月份提出的「视觉图灵测试」的概念。

Meta认为VR技术的发展目标,就是让VR中的场景变得足够真实,以至于让你分辨不出这是电脑生成的VR画面,还是一个现实场景。

 

这个概念的提出是非常好的,虽然以人类目前的技术是实现不了的。

首先是算力不足,其次是「丰富度」不够。

现实世界拥有无穷无尽的信息细节,而计算机生成的画面缺少这种近乎无限的「丰富度」。

 

这是所有像《Horizon world》这一类型的应用,必定会遇到的问题。

烧了这么多钱的《Horizon world》,里面大多数的世界场景在建立之后就没有人访问过。

原因有很多,一个是我在《A-SOUL一周年》专栏文章里提到的,哲学意义上的原因。

虚拟世界来去自由,凭什么我去要接受你Meta定义的世界观,加入你的「元宇宙」。

当然这个部分我们留到第3节谈PICO《轻世界》时再展开聊。

 

而另一大现实原因就是丰富度不够,《Horizon world》的这些世界场景都是玩家用有限的素材,在有限的算力约束下,手动捏出来的。

可能这些粗糙简陋的场景模型对于创作者自身来说已经足够了,里面包含着自己建造时的热情与回忆。

但是对于大部分陌生的游览者来说,又过于单调和简陋,其丰富度甚至比不过算力约束更小的《VRChat》或者《Minecaft》。

那我为何要花时间和精力去逛这个千篇一律的积木世界呢?成年人的时间很贵啊。

 

所以《Horizon world》最后只能变成小部分爱好者的圈地自萌。

创作者可能花了1个月的时间和心血去建造一个世界,但是游览者不到10分钟就逛完了,还觉得没有意思。

这显然不是一个良好的UGC创作模式。

 

因此我们的思考方向就变成了,要如何才能在VR一体机有限的算力下,去实现近乎无限的「丰富度」呢?

 

 

 

 

【1-3】VR摄影图灵测试

用计算机的3D引擎渲染一张丰富度足够的8K图片,需要使用多少算力呢?

并且前期需要花多少时间来进行建模、制作贴图和布置场景呢?

 

但是拍摄一张8K的VR照片,却只需要花不到1秒钟的时间。

因此摄影可以解决「丰富度」不足的问题,现实世界里有取之不尽用之不竭的信息细节。

而相机是从「现实」到「虚拟」最好的信息映射工具,可以在瞬间生成无穷无尽的丰富度。

 

其实参考Meta的「视觉图灵测试」,我们不妨提出一个「VR摄影图灵测试」的概念。

 

想象这样的一个场景。

你身处于房间A里,戴着一个VR设备。

这个VR设备的显示光路非常短,可以忽略不计。

并且它用于显示的「光学模组」,和前端用于摄影的「双目相机」,均为可移动的模块。

 

那么它有2种工作模式,可以让你在不摘掉VR设备的情况下,看见房间A的场景。

 

模式1:前端的「双目相机」拍摄房间A的实时画面,然后传输给「光学模组」显示,最后显示的画面进入人眼。

这其实也就是我们所说的VST双目彩色透视模式。

 

模式2:设备移开「双目相机」和「光学模组」,人眼透过中空的VR镜框直接看到外界的房间A。

我们不妨称这个模式为「空气模式」,因为房间A的光线仅经由空气进入眼睛。

 

如果这个VR设备的光学设计非常完美,至于你分不清自己在VR设备里看到的房间A画面,使用的是模式1,还是模式2,那么就算通过了这个测试。

 

 

当然这仍然是非常理想化的思想实验。

而细究起来,这个概念也没有什么太高大上的,就是拍摄和播放足够真实的「双目VR视频」而已。

 

这样的一个「VR摄影图灵测试」的思想实验,与Meta「视觉图灵测试」的不同点是,

Meta的场景是计算机3D引擎实时渲染出来的,需要非常高昂的算力。

而「VR摄影图灵测试」的信息量是「双目相机」所捕获的,本质上你是在播放VR视频,相对而言不需要那么高的实时渲染算力。

 

像最近被谈论得比较多的VST彩色透视功能,其实也能算是一类实时观看的VR摄影。

VST的难点在于要对视频进行实时处理,其实也是有一定算力要求的,但相对于3D引擎的实时渲染来说,已经是非常节省算力的了。

 

当然我们开头有说过,除非是有新的符合人眼「深度-放大率」光学设计的镜头出现,不然VST的近端显示就必定是失真的,算法很难后期弥补。

 

但总的来说,「VR摄影」仍然是一条更加可行的路径。

凭借它可以在有限的算力下实现近乎无穷的「丰富度」。

 

其实这也可以解释为什么很多类似《VRChat》的VR社交应用里,在建造世界的新鲜感过去之后,玩家最后都喜欢聚在一起观看投屏的影片。

因为虚拟世界里的建模场景总归是比较有限和单调的,而那些投屏的影片却可以提供额外的足够多的丰富度。

 

当然事实上「人」或者说「自由意志」,也是「丰富度」的重要来源。

那对这个话题有兴趣的朋友,可以去看《A-SOUL一周年》专栏文章的第4.2节。

 

 

 

【2】我需要一个VR相册

在相同的算力约束之下,「VR视频」虽然牺牲了自由度,但是却可以做到更多的丰富度,并且同一算力所产出的内容可以低成本复用,一次渲染,多次播放。

 

但它还是有很高的门槛的,保证VR观影清晰度的8K视频并不是谁都能拍,谁都能剪的。

8K视频的拍摄和剪辑需要巨大的算力和存储空间,并且VR视频起步要有60帧才能保证流畅度,用目前常规2D视频的30帧会造成严重的眩晕感。

 

我自己DIY的这一套「双目VR相机」,并不能直出谷歌VR180格式的视频,拍完需要自己手动后期拼接。

我的电脑配置还算中等,i7-8700K+32G+1070Ti,拼接1分钟的4K+25帧的VR视频,全画质渲染导出要花30分钟。

这显然不会是一个可以轻松实现UGC模式的内容创作形式。

 

那就没有办法了吗?也不是。

我觉得身处于短视频时代的人们,似乎忘记了短视频之前的日子是怎么样的了。

 

虽然我拍不了8K视频,但我完全可以拍8K的VR照片。

而8K照片,其实就是3200万像素而已。

像最近刚发布的「红米Note 12 探索版」,已经在宣传2亿像素了,换算过来已经到了20K。

 

对于手机摄影来说,像素数已经是完全过剩了的,今年iPhone14 Pro也才刚从祖传的1200万升级到4800万像素。

而对于VR摄影来说,8K的3200万像素才刚刚入门,12K的7200万像素也就还算够用。

 

在我的电脑上用Premiere实时预览并剪辑4K的VR视频压力还是很大的。

但是用Photoshop来处理一张8K的3200万像素的VR照片却是非常容易的,没有任何压力,导出照片时也可以秒出。

可以肯定用手机的算力来处理VR照片也不会有太大的问题。

 

这里说个题外话,像现在对于「VR影像」支持比较好的后期软件是Mistika,很多的好莱坞3D电影的后期是用这一款软件来做的。

但我几乎找不到有关Mistika的中文讨论,所以最后还是不得不使用更加熟悉的Premiere来做后期剪辑,而Premiere在「VR影像」这一块上并不好用。

所以整个VR影像的后期流程还是有点波折的。

 

 

而更加尴尬的是,在PICO上并没有一个能用的VR相册。

为此我需要把一张6000*3000的VR180照片给压成一段10秒的短视频,再用PICO系统自带的视频播放器打开这个视频,才能正常查看照片。

 

当然我也可以把6000*3000的VR180照片处理成6000*6000的VR360格式,然后就能直接用PICO的图片浏览器正确查看。

但是这样得到的照片画质,却还没有压制成视频的清晰,显然PICO对于「VR照片」这一块是没有上心的。

 

如果是Quest用户,还可以用一款叫《immerGallery》的VR相册,来满足管理、观看、和分享VR照片的需求,但这个应用没有在PICO上架。

但我觉得「相册」这种基础功能,应该要由PICO系统自己来提供。

 

就像智能手机一样,很多人手机里占据空间最大的APP并不是微信,而是系统自带的相册。

相册里拍的最多的是照片,而不是视频。

但是PICO却连一个可以查看VR照片的VR相册都没有,我觉得这是不应该的。

 

很多VR从业者都在追逐星辰大海,展望着那些炫酷的充满科幻感的功能,却忽视了脚下的这个可以达成VR端UGC模式的不起眼的「VR照片」。

我觉得可能他们至今没有尝试过,自己拍摄一张VR照片或者一段VR视频,并在VR设备里进行回看。

 

如果你有尝试过自己拍摄VR照片或VR视频,那么你会意识到这是一个巨大的潜在的刚需市场。

因为这些基于「双目视差」的带有「深度信息」的VR照片,只能在VR设备里完整观看。

 

 

那么现在回到开头,我对自己提出的那个问题。

如果我不是A-SOUL的观众,我会在什么情况下去购买使用PICO呢?

 

在用Pico Neo 3的时候我还没有太多的想法,但是PICO 4可用的色彩表现让我开始想要尝试VR摄影。

而在体验过自己拍摄的VR照片之后,我的回答是,我会因为这些VR照片而去购买一个VR设备。

 

我并不必一定是要一个每天都玩VR游戏的重度用户,但是因为这些VR照片一定要在VR设备里才能完整查看,因此我会为一个能提供优秀显示效果的VR设备付费。

 

就像我手机、电脑、NAS里的那些照片,我并不是需要每天都去翻看它们。

但是它们一定要存在哪里,那些东西储存着我的回忆,是我在这个世界生活过的证据。

 

 

我手机里存着的那些照片,每一张对我来说都格外珍贵,承载着独一无二的记忆。

我喜欢与好友分享照片,也偶尔会自己一个人在深夜里翻看过去。

这些手机里的照片我都会备份到付费购买的云空间上,很多东西弄丢了只是会很麻烦,但是有些照片弄丢了就只有永远的遗憾。

 

去年我的电脑坏了一块硬盘,送修之后虽然恢复了大部分数据,但刚好丢失的那一部分文件里就有一些照片。

于是在失眠了两个晚上之后,我下单了一台能备份数据的NAS。

 

 

在跑通了「VR摄影」的流程,拍摄并观看了我的第一批VR照片和VR视频之后,那一刻我真的很希望时光可以倒流。

 

我很想回到过去的某些瞬间,某些场景。

例如我离开电子实验室的那个下午,离开大学宿舍的那个早晨,离开深圳之前的那几个夜晚。

我很想回到那些场景里,去拍一些带有深度信息的3D照片,记录自己人生转折点之中那些翻腾不已的情绪。

 

我更想回到那个搬家前生活了20多年的老房子,回到奶奶还在世的那些日子,去为她留下一些VR照片。

戴上VR设备回看这些VR照片,时间像被凝固了一样。

在这个小小的VR设备里有一个熟悉的空间,而那些熟悉的人似乎还在这里,永远在这里。

我会愿意为这些被凝固的瞬间而付费。

 

可惜时光并不能回溯,人生总是会有一些遗憾。

要是这些技术能再早几年成熟就好了。

 

 

 

【2-1】VR摄影标准的制定

在体验过VR摄影之后,我很确定自己会愿意为之付费。

并且我也相信,真实体验过它的人,也大多会愿意为其付费,虽然目前还有很多门槛。

但它至少在现有的算力约束下也仍然是可行的,并且价格可以在短时间内被做得很便宜。

 

手机摄影是个非常庞大的市场,目前的手机厂商基本上都在卷手机摄影,而VR摄影的魅力是要远超过手机摄影的。

很多人至今不看好VR,很可能是因为他们没有试过亲手用「双目相机」拍过一张VR照片。

 

就像我妈曾经一直理解不了我为什么整天玩手机,直到她自己开始用手机拍照,然后发朋友圈和抖音。

而现在我给她换手机,她唯一的要求就是新手机拍照一定要好看。

 

 

可是「VR摄影」这一功能可不是PICO独占的。

假如苹果的VR设备出来了,它有更好的VR显示效果和VR照片管理功能,只要价格不那么离谱,那么类似我这样的人就很可能会转投苹果,因为影像功能一直都是苹果的强项。

要知道苹果在影像设计领域里,可是有一呼百应的影响力的。

 

那么现在PICO其实还是有一段空窗期,一方面是PICO 4的价格足够便宜,另一方面是抖音对内容创作者有号召力。

因此PICO其实需要趁这个空窗期,把自家的本地「VR相册」功能做好,并提供一个分享「VR照片」的内容平台。

 

而这所有步骤的前提,其实是制定新的更科学的「VR摄影标准」。

「双目VR摄影」和传统的平面摄影有着非常不同的逻辑。

现在大家用的都是谷歌多年前制定的VR影像标准,但实际上这套标准并不合理,也很低效。

它并不是为「VR设备」制定的,而是为Youtube这个「视频网站」而制定的。

 

这段时间我也有看一些券商的报告,说到VR相机应该提供机内拼接,直出谷歌标准的视频。

其实这样的说法是有问题的,因为你不能让VR硬件反过来去适配一个PC端「视频网站」的标准。

 

PICO拥有自家的VR硬件和内容分发平台,因此在标准制定上可以做得更高效、更科学。

PICO的相册也并不需要像《immerGallery》一样,去适配乱七八糟的图片格式,而是应该有自己的一套标准,并且这套标准应该要和抖音的UGC内容平台是通用的。

 

那么我作为摄影师、内容创作者,自然会去适配这套显示标准。

相机产商也会根据这个标准去生产VR相关的拍摄设备。

类似「Insta360 EVO」和「酷看EGO」这样的双目VR相机,便可以针对这个标准做更高效的优化,并且把价格做得更低。

 

 

我并不是专业的摄影师,也不太懂「光学设计」和「计算机图形学」。

但是这段时间的「双目VR摄影」的经历,让我对此有很多新的感受。

我后续会出一个系列视频来谈论自己的这些感想,我也希望有更多专业的摄影师或者计算机图形学的工程师,共同参与到这个话题里,这个领域国内目前的讨论可以说是一片空白。

 

那目前我的基础观点是,「双目VR摄影」应该要按照「投影方式」和「视场角」来制定标准。

其实PICO视频的工程师技术很厉害, PICO本地自带的PicoPlayer播放器已经可以做到直接解码播放12K的视频。

但是PICO的工程师似乎并不是很关注摄影上的东西。

 

像PicoPlayer里的这个「鱼眼模式」的选项,原本应该是一个最方便摄影师的播放模式,可以减少内容创作者在前期对视频做不必要的二次转换。

但是PicoPlayer用的鱼眼投影模式却是很少见的「体视投影」。

 

鱼眼镜头有很多不同的投影方式,「体视投影」具有「保角」的性质,一般是出现在工业或者科研领域里,例如汽车的360环视功能里这种特殊摄像头。

我觉得很可能PICO用来定位的那4颗黑白摄像头,采用的就是这种投影方式。

 

可是在消费级的摄影镜头里,采用「体视投影」的鱼眼镜头寥寥无几。

消费级的摄影镜头基本上都是采用「等距投影」的,像我用的老蛙4mm,或者佳能的RF5.6mm双鱼眼,都是采用标准的「等距投影」。

 

因此PicoPlayer的这个「鱼眼模式」基本上是不能用的,没有摄影师会去拍这个格式的照片或者视频,直接套用这个模式会导致画面出现扭曲的变形。

 

而除了这个奇怪的「体视投影」的鱼眼模式,还有一些其他的问题。

像PicoPlayer很贴心地兼容了Youtube网站的立方体贴图VR360格式。

可是Youtube为了节省带宽,立方体贴图都是做了「等角映射」的。

而PicoPlayer在这个模式下只是用了简单的「线性映射」。

 

因此你用PICO的播放器去播放Youtube立方体贴图格式的VR360视频,它的画面就全都是扭曲的。

这是一个非常明显的错误,PICO的开发者似乎没有真的去尝试过,用PicoPlayer欣赏一个完整的Youtube上的VR360视频。

 

 

不过上面讲的这些其实都是些小问题,可以一点点修复。

更重要的是探索并制定新的VR摄影和显示标准,以及推广普及「双目VR摄影」的一些基础知识。

它和传统平面摄影有着非常多不同的思路。

 

我自己在实拍了一些VR照片和VR视频后,才发现上一期【R6】期里有一些观点存在问题,包括对A-SOUL的虚拟直播的一些判断。

有很多新的思维模式和细节,你得尝试过之后才会有体会,这个领域目前还没有什么前人的经验。

 

但因此这也是一个可以重新制定标准的机会, 字节有自己的VR硬件,也有自己的社交媒体平台,它完全有能力去创造一个更合理的VR影像标准。

像现在所流行的「竖版视频」模式,其实就可以看做是抖音所引领的一个标准。

把标准定下来之后,内容创作者才会有创作的基准。

 

因此我确实会挺在意苹果在VR上的动作,因为苹果在影像领域一直都是规则制定者。

举个例子,苹果生态的色彩管理就做得非常好,而Windows的色彩管理则是一团糟,因此很多设计师会单凭这一点而去使用苹果的生态。

 

现在到了VR摄影这一块,画面从2D变成了3D,除了像传统的颜色管理之外,还有很多其他的基准。

例如投影方式,视场角,视差深度基准等。

这些都急待制定一套标准,不然内容制作会缺乏规范,容易导致画面上的问题。

在2D平面的影像上,出问题最多只是让人觉得怪异。

但在3D影像里,出问题可是会实打实让人感觉难受和眩晕的。

 

 

像不久前,PICO进行了一场VR180的大熊猫直播,前期做了一定的宣发,我也挺期待的。

结果当天我一进直播间就发现3D画面有问题,让人感到非常眩晕。

直播间里的其他观众也有反馈,而官方的建议就只有切换成2D模式观看。

 

当天我的感受就是,远处景物似乎出现了不应该存在的垂直视差。

我也试着分析了一下原因,似乎是左右眼的视场角不一致。

理想情况下,这两个镜头大小要一致,因为我们左右眼的视场角相同。

 

左右眼不一致,导致大脑解算「深度信息」时出现问题,无法拼合成一个整体的立体图像,让人感觉到3D眩晕。

 

造成这种结果有可能是硬件的问题,也有可能是软件的问题。

要么是镜头位置出现偏移没有对齐,要么是机内的「垂直视差」校准功能出现程序上的bug。

 

如果能够确定是左右双眼视场角不一致,那排查起来应该还是很容易的。

但是官方好像并没有去排查这个问题,第二天直播时,远处景物的垂直视差还是有问题,左右双眼仍然不一致,还是会让人觉得晕3D。

 

大熊猫直播本来是一个非常有话题度的活动,我也很喜欢这一类户外题材,可是那两天的直播效果是真的不行。

很可能PICO平时的才艺直播也有很多这样的问题,只是因为在室内所以不明显而已。

 

说到底「双目VR摄影」的这个领域真的很新,缺少前人总结的经验,整个流程还没有一套可以保证画面不出错的行业标准。

官方的专业人士都一头雾水,换成普通用户只会更加一筹莫展,这无疑会是PICO的UGC模式的一大门槛。

 

因此是时候为VR摄影重新制定标准了,这样PICO的UGC之路才有可能成为现实。

 

 

 

 

 

 

【3】PICO轻世界的难题

 

不久前PICO的《轻世界》开始公测了,各方面的反响还挺不错的。

 

其实我不太清楚PICO自身对《轻世界》项目的定位是怎么样的。

但市面上大部分人的看法是,PICO《轻世界》是对标Meta《Horizon world》的竞品。

如果以这个假设为前提,那么《Horizon world》现在遇到的问题,《轻世界》将来大概也可能会遇到。

 

 

《Horizon world》并不如扎克伯格的预期。

原因之一是「丰富度」不够,《Horizon world》的这些3D场景需要用户在VR一体机有限的算力约束下,用有限的素材来进行创作。

 

那《轻世界》也会面临相同的问题,玩家们可能一开始会很有热情,但新鲜感过去之后,就容易腻,能玩的场景和方式不多,来来回回就只有几个。

于是小部分深度用户会希望开放更多的创作权限,甚至引入电脑端创作以丰富场景,但这会让创造变得更加专业化,离UGC模式越来越远。

 

而对于大部分的轻度用户而言,其实并不喜欢辛苦的创造过程,单纯只是想免费逛各种场景,玩各种小游戏。

因此最合理的分工方式仍然在《轻世界》之外的「PICO应用商城」里,让专业团队去开发设计有趣的场景与关卡,而普通人只管付费购买游戏并游玩就行。

而这些游戏也完全可以加入社交元素。

 

还有一种方式就是引入外部的丰富度。

例如接入视频播放器,大家一起聚在《轻世界》里看各种各样的视频,但这似乎和「PICO视频」的多人影院功能重合了。

 

因此若把时间拉长,当用户的新鲜感过去之后,PICO《轻世界》可能就会遇到要如何留存用户的问题。

 

当然,这最终还是要看《轻世界》的产品定位。

如果《轻世界》只是定位为一个轻量级的玩家DIY创造的社交应用,那么以上我提到的这些问题,其实也算不上是什么大问题。

总会有人热爱这类「创造+社交」的模式,能一直充满热情地玩下去, 《Minecraft》和《VRChat》也有很多忠实的玩家,《RecRoom》也活得不错。

 

但它们总归是一类的小众的线上游戏,不太可能会成为一个覆盖大众的社交平台。

而资本市场对于《Horizon world》和《轻世界》这一类应用的看法,似乎远不是如此。

 

 

【3-1】投元宇宙在期待什么

虽然我并不喜欢「元宇宙」这个说法,但这一概念已经被普遍使用了,那么我们姑且先这么称呼它。

 

资本市场为什么会相信扎克伯格的「元宇宙」故事呢?他们只是在期待另一个《VRchat》吗?

这里头固然会有些傻子,但绝大部分还是聪明人,因为这是要投真金白银的。

 

扎克伯格是做成了Facebook的人,他也不像是那种会花这么多钱,压上自己的身家,只为做一个VR一体机版《VRChat》的人吧。

 

《Horizon world》的失利固然有「算力不足」的问题,但退一万步来讲,哪怕现在Meta能把它的画面做得非常好,其实我觉得也不会有特别大的本质区别。

《Half-Life:Alyx》的画质再好,我也只是上去感叹一下3D效果做得真好,然后就没有再打开过第二次了,而这很可能也会是现实中绝大部分普通人的反应。

 

实际上我并非那种不愿意接触新事物的人,相对来说我应该已经算是很积极拥抱新事物的人了。

但《VRChat》和《RecRoom》,我也都体验过几次之后,就再也没有打开过。

 

因此比「算力不足」更深层次的原因是,凭什么我要加入你的世界。

这也是我在《A-SOUL一周年》专栏文章里谈「元宇宙」概念时提到的,哲学意义上的问题。

 

虚拟世界来去自由,凭什么我要去接受你Meta定义的世界观,加入你的「元宇宙」。

你无法给出一个我不能拒绝的理由。

 

 

要更加具体地理解这一点,我们不妨看一下那些旧时代的社交软件。

在智能手机的时代,B站,微博,抖音,知乎,贴吧,豆瓣……

其实这些「社交平台」APP,每一个都可以算是一个独立的「世界」。

你点进了一个APP,就像进入了一个虚拟世界。

 

抛开一些特殊场景,对于大部分普通人来说,这些世界都是来去自由的。

我使用它,便是走进了这个世界,我不再使用它,便是离开了那个世界。

 

像我一直都不是字节产品的用户,我不玩抖音不看头条,我融入不了那样的世界里。

但对于我身边的很多人来说,这是他们日常的生活方式,而他们也从来不玩B站。

我们在网络上就处于不同的虚拟世界里,没有什么交集。

 

而虽然我是一个B站的重度用户,每天会花很多时间在B站上。

但是如果你让我明天就卸载掉B站,退出「哔哩哔哩」世界。

其实对我来说也是可以接受的,我大可以换一种方式生活,是吧,大不了回归现实。

因为这些社交软件所构建出来的虚拟世界就是这样的,来去自由,你有的选。

 

除了…..微信。

 

在所有的社交软件里,我可以卸载B站、微博、知乎、抖音……退出这样的一个个虚拟世界。

但是我唯独无法卸载微信。

 

微信的情况是如此的特殊,在所有的社交平台APP中,只有它与现实世界是强连接的。

这些与现实世界连接的部分会给我一个无法退出的理由。

因为我实际上唯一无法退出的,就只有这个现实世界。

 

因此我其实能理解资本市场所期待的是什么,为什么他们愿意相信扎克伯格的「元宇宙」故事,并投下自己的真金白银。

在旧时代做出了Facebook的扎克伯格,在VR里真正追求的东西,在太平洋的对岸有一个旧时代的样板,那就是「微信」。

 

资本市场所期待扎克伯格最终实现的结果,并不是一个简化版的《VRChat》,而是创造出一个VR时代里的「世界微信」,一个新世界里的基础设施。

因此你才能理解为什么他们愿意往这个看上去像是骗钱的概念里,大把地投钱。

 

 

在国内,「微信」是一个很特殊的社交平台,它不是一个纯粹的来去自由的虚拟世界,而更像是现实世界在虚拟互联网上的直接投射。

「微信」是一个公共基础设施,甚至可以看做是一个盘踞在中国互联网上空的影子政府。

它并非政府部门,却承担了很多公共职能。

 

如果你是一个中国人,我们会默认你有微信,而「加你微信」便是最正式的社交邀请。

可以想象得到,腾讯的员工不一定会玩抖音,但字节的员工一定会用微信。

 

我是一个喜欢虚拟世界的人,所以我才一直泡在B站上,也喜欢看A-SOUL。

而我也一直觉得微信很无趣,但我无法回避微信,因为现实世界是逃不掉的,它是强制且唯一的,永久寄生在你的手机上。

 

微信与我的现实生活有着强连接,因此它才能给我一个无法拒绝的理由。

但微信也是在历史的进程中被选中招安,才有了今日的模样。

因为还有一些更庞大的东西,可以给微信一个无法拒绝的理由。

 

 

那么还是那个观点,我并不清楚PICO对于《轻世界》的定位到底是什么?

如果只是一款轻量化的《VRChat》,或者一款体验更好的社交创造游戏,那我倒也没有什么好关心的。

 

纯粹一点的娱乐应用,可以给人带来更加纯粹的乐趣。

我很喜欢那种可以忘掉现实的体验,沉浸在一个想象的世界里,然后忘记现实生活里的纷纷扰扰。

我一点都不喜欢微信里的那些不得不去回复的烦人消息。

 

但是,如果倾注了PICO资源的《轻世界》是Meta的「元宇宙」迷思下的产物。

那么就不得不警惕,资本市场渴望的是一款新时代的「VR微信」,一个可以卷入所有人的公共基础设施。

资本市场是以此来对「元宇宙」概念进行估值和定价的,如果这个幻想破灭,那么反噬也会很大。

 

扎克伯格不能回应资本市场去创造一个「VR微信」的期望,所以资本市场便抛弃了他。

一个来去自如的虚拟世界,支撑不起这样高昂的定价。

那我希望PICO的团队能够避免陷入像扎克伯格那样的困境,因为我对接下来一段时间的全球金融环境不是很有信心。

 

 

很多人围绕「元宇宙」概念对VR的未来进行展望时,总能想象出非常科幻、炫酷的场景,而最后实际做出来的东西,却都是一些像是学了3年建模的劣质骗钱游戏。

 

但其实资本市场也并不太关心那些3D动画小人的建模够不够真实,场景够不够有趣。

这些在办公室写「元宇宙」PPT的金融现充们,哪里有那么多时间去玩电子游戏。

 

资本市场想要的,只是一个与现实生活有强连接的,能让所有人都被迫卷入的基础设施,它是连接虚拟和现实的入口,就像中国地区的「微信」那样。

 

它不一定非要是游戏的形态,只是说它在VR里的呈现,现在大家普遍认为看起来会比较像是一个3D游戏。

但是将这样的一款应用的形式,刻板化为一个仿真的模拟世界3D游戏,以至于一提起VR的未来,就想到了黑客帝国、刀剑神域、头号玩家、元宇宙……在我看来其实反而是失去了想象力。

 

 

 

 

想象一下这么一个场景。

 

有一天VR设备普及了,然后有一款应用,我们不妨叫它「VR微信」。

起初你只是想在「VR微信」里和朋友、家人聊聊天,偶尔看看他们更新了什么VR动态。

后来你的同事、上司也都在使用这个应用,慢慢他们开始用这个并不高效的VR软件,来和你讨论工作上的事。

你变得越来越讨厌这种感觉,只想退出这个「VR微信」去放松摸鱼,可是你又不得不去处理这些事情。

你还得学会在各种「VR微信群」里逢场作戏,并认真经营自己的「VR朋友圈」,因为它其实已经是你现实形象很重要的一部分了。

某天周末,你刚兴致勃勃地打开一个新上线的VR游戏,突然上司给你打了一个「VR通话」,听到铃声后你顿时心肺骤停,立马退出游戏去接听,然后开始了加班的一天。

 

这样的一个「VR微信」才符合我对未来「元宇宙」生活的想象,科技并带着趣味。

 

 

 

 

 

【3-2】连接现实的虚拟世界

可以预见在VR领域里必定会诞生一款类似「微信」的应用。

这款VR应用仅作为一个公共基础设施来说,其实可能是非常无趣的,但它也绝对是易用的,并且与现实有着强连接,能将足够多的人卷入其中。

我们都不得不去使用它,最后连政府部门也会接入这样的一个入口,于是它就永久地占据了一个生态位,除非下一代智能硬件到来。

 

如果字节真的把PICO当作一个「长期主义」的事情来做,豪赌VR设备是继智能手机之后的下一代智能硬件,那么必然不能将这个连接现实与虚拟的重要入口拱手让人。

 

字节有一套自己的基于算法的世界观,而头条和抖音的这种打法,其实还挺适合现在的「PICO视频」的。

但是做一款「VR微信」的逻辑,似乎并不是字节所擅长的。

 

事实上扎克伯格也做不好这件事情。

如果「元宇宙」概念脱水后的内核是VR时代的「微信」,那它的画质好不好其实并不是最关键的。

重要的是它要与现实世界有足够强的连接,它不能是一个纯粹的虚拟世界,让你想走就走。

 

扎克伯格有点着急,想用「VR办公」来构建这一种虚拟与现实的连接。

那「微信」确实也经常被用来办公。

但其内在逻辑其实是反过来的,因为「微信」这个社交平台和现实世界有了太多的硬连接,所以才会被很多人顺手拿来办公。

被用来「办公」是微信与现实硬连接的结果,而不是原因。

 

说个题外话,用「微信」来工作是非常低效的,还不如QQ,更比不过专门的企业协作软件。

一个专注于效率的工具型应用,其实反而要杜绝过多的私人社交因素。

 

因此Meta从「元宇宙」社交概念,一夜之间全面转向「VR办公」,在我看来过渡是非常生硬的。

这不像是按部就班的战略布局,反而更像是扎克伯格面对资本市场压力时的一种无奈举动。

 

 

如果假设PICO有一天也不得不去回应资本市场的这个「元宇宙」期待,那么要如何破局呢?

我们不妨带着这些问题,回到移动互联网浪潮到来之前的时期。

 

这段时间体验下来的PICO《轻世界》,让我想起了当年的QQ空间。

在智能手机浪潮到来之前的桌面电脑时代,那时候我还是学生,周末的空闲时间喜欢玩电脑。

除了和同学玩像《穿越火线》和《地下城与勇士》这样的游戏,花最多时间的就是QQ空间。

 

我会去搜索如何装饰、美化自己的QQ空间,也会去别人的QQ空间瞎逛和留言。

当时有很多人会用自己喜欢的动漫影视作品,来自定义自己QQ空间的装扮主题,我还挺喜欢逛的,当然那时候最潮的风格是「非主流」。

偶尔我也会玩玩QQ空间的社交小游戏,例如偷菜和抢车位这些。

 

我记得当时班里喜欢的女同学QQ空间是加锁了的,要回答问题才能访问。

而我又不好意思直接去问她,所以就跑去询问她的闺蜜。

现在想起来还是一段蛮有意思的时光。

 

 

那这段时间PICO《轻世界》给我的体验,就是让我回想起了学生时代玩QQ空间的感觉。

当年的QQ空间也是一个年轻人、特别是学生群体们会喜欢的新鲜事物。

年轻人有热情、有好奇心,觉得好玩、也有时间玩,所以会花很多精力在上面,我也是如此。

 

只不过现在的我确实变了,少了很多学生时代天马行空的想象力和创造力。

如今的我连GoneMeme的主站都懒得装饰,有个文档编辑器能让我写写文章就行了。

所以至少这段时间体验下来,我并没有成为PICO《轻世界》的重度用户。

 

我还算是一个挺看重虚拟世界的人,很多在其他人看来没有什么意义的东西,对我来说却很重要。

像我玩《守望先锋》就攒了很多游戏视频,这些视频对我来说,就跟现实里的照片一样重要,它们都有非常重要的意义,记录了我的一些回忆。

 

但同时我也明白,其实像我这样的人是少数。

这个世界上绝大多数人都是生活在现实世界里的,他们会觉得你在虚拟世界里看重的那些东西,例如QQ秀、QQ宠物,或者游戏角色的等级和胜率,不过都是一些虚拟的0和1数据,就跟小孩子过家家一样。

他们不能理解你在虚拟世界里所珍重的那些东西。

 

虽然我自己很清楚「虚拟的物品并不是虚假的」,但可惜大部分人并不是这么认为的,而他们才是这个世界的主流。

而一款作为基础设施的国民级社交软件,是不得不去争取这部分「大多数人」的。

 

 

那么回到VR里。

VR设备对算力、存储和网络带宽都提出了更高的要求。

于是我们似乎一夜之间又回到一个硬件资源非常拮据的状况里。

能用的算力并不富裕,而用户又想要索要更多的丰富度。

 

只是我们现在不仅要考虑,如何在有限的算力下去实现更多的丰富度。

并且还要再考虑,如何实现虚拟与现实的强连接,最终给用户一个无法退出的理由。

那么目前我自己能想到的回答,好像也仍然只有「VR相册」。

 

当年还在玩QQ空间的时候,还有一个印象很深刻的事情,就是班上有个老师也在玩QQ空间。

这个平时一本正经很严肃的老师,竟然会跟我们这些小朋友一样,玩这些在当时的主流舆论看来是不正经的东西。

但其实她并没有像我们这样整天折腾美化和玩小游戏,她用到的功能只有一个,那就是相册。

 

在那个网速很慢,没有智能手机,没有微信朋友圈,也没有抖音短视频的年代。

QQ空间相册是为数不多,可以很方便地用来分享现实里照片的平台。

这是它与现实有强连接的部分。

可惜QQ空间也并没有成为中国版的Facebook,因为后来智能手机的浪潮袭来,微信的时代来临了。

 

 

 

因此现在对于「PICO的元宇宙之路」,我也并没有得出什么新鲜的观点。

能想到的仍然是前面回答「PICO的UGC之路」的那个结论。

在现有的各方面约束下,其实「VR相册」是一个很不错的切入点。

 

想象这么一个场景,虽然我对在《轻世界》里建造世界没有什么兴趣。

但是我在《轻世界》的里有一本珍藏的VR相册,我可以邀请你一起过来翻阅这些照片,聊聊我这段又去了哪里,遇到了哪些人,发生了什么事。

 

当然这些照片也不一定要是VR180格式的,平面的也可以。

但总之,它是《轻世界》与现实世界能产生硬连接的部分。

 

 

当然我并不是建议说,《轻世界》应该往这个方向去做,毕竟我个人的想象力有限。

但是在「元宇宙」思潮下,资本市场期待有一个「VR微信」出现,到了一定时间PICO必然会受到来自投资者的压力。

PICO需要管理好资本市场的预期,避免出现像Meta那样的反噬。

 

《轻世界》可以保持它的纯粹性,定位为本土版的《RecRoom》或《VRChat》

因为很多东西是从立项开始就确定下来的,例如底层的框架,美术风格这些。

许多技术上的东西并不支持中途的随意修改。

并且我也不能肯定目前这个环境,就真的支撑得起一个「VR微信」的出现,PICO用户基数还太少。

现阶段定位为一个吸引年轻人的轻松时尚的VR版QQ空间,也许反而是更可行的。

 

 

但还是那个观点,PICO需要有另外一手准备。

如果字节真的把PICO当作一个长期主义的事情来做,将VR设备视为下一代智能硬件。

那么VR领域必定会诞生一款类似如今微信一样的应用。

 

一款可能非常无趣,但是和现实有着强连接,能让所有人都无法退出的社交应用。

这才是资本市场所期待的「元宇宙」的脱水内核。

而这其实有点政治不正确,不太能拿出来放在台面上讲。

 

现在字节还有发育的时间窗口。

当作为旧时代霸权的腾讯,开始做一个正统的「VR微信」时,这个时间窗口就可能会被关上。

 

而「微信」的那一套打法,并不是字节擅长的。

说不定张小龙比扎克伯格还要更懂「元宇宙」。

 

但话又说回来,VR时代的「VR微信」的逻辑,也不一定就会照搬智能手机上「微信」的逻辑。

因此我上面的那些理论也有可能是错误的。

腾讯也是革了自己QQ的命,才有了现在的微信。

 

但是至少在上一代智能手机浪潮里,年轻人更喜欢的、更时尚的、功能更丰富的手机QQ,终究没有成为国民社交软件。

反而是无趣且低效的微信,成为了腾讯驶向移动互联网的大船。

 

 

 

 

 

 

 

【E】总结

当然说了这么多,我也只是一个侃侃而谈的普通用户而已。

PICO的团队看上去有点忙,很多发布会上画的饼还在赶工制作中。

那我也不知道PICO能不能听见我的声音,但最后还是再简单地总结梳理一下吧。

 

作为一个刚刚喜欢上了「VR摄影」的普通用户,我希望PICO能有一个可用的本地VR相册,最好能带上分享功能。

这样我就不用把图片压成视频,用各种迂回的方法去查看VR照片,这会大大增加创作门槛。

 

只有门槛降低了,内容创作者才会增加,相应的VR相机产商也可以做针对性的开发和优化。

8K的VR180直播对普通人来说真的太遥远了,当前的人均算力、存储和网络都是不够的。

 

而以「VR照片」为主,「平面3D视频」为辅,就可以有不错的UGC模式了。

「VR抖音」做不成,做一个「VR小红书」其实也不错。

目前的《轻世界》则更像是没有相册功能的VR版QQ空间。

 

如果「双目相机」硬件产商的思路能从「VR视频」转向「VR照片」,那么成本也可以大幅度降下来,做到极致的性价比。

「Insta360 EVO」和「酷看EGO」就是可以参考的硬件设计,而实际上它们还是拍「VR视频」的思路。

如果是以拍「VR照片」的思路来做,那么硬件成本还可以再降,一张优秀的高清VR照片要好过一个马赛克般模糊的VR视频。

 

APP的模式则可以参考《immerGallery》。

但最关键的是要重新制定与VR硬件深度结合的VR摄影和显示标准,也要在创作者之间达成约定俗成的VR摄影共识。

虽然我不是专家,但我能很明显感受到谷歌的Youtube标准是过时且不合理的,需要有企业出来推动新的标准。

 

我一直以来都不是字节产品的用户,我不用抖音和头条,相反我是B站的用户,因为我更喜欢长视频。

但到了VR影像这一块,则必定是要和VR硬件深度结合的,Youtube都承载不了,更别提B站了。

 

所以我还是挺期待PICO能成为一个优秀的VR影像创作平台,填补这一部分的空缺。

当然这一切的前提是,新的VR摄影和显示标准要足够科学与合理。

在我看来,这个新标准似乎应该是要基于「投影方式」和「视场角」来制定,并且要提供科学的垂直视差校准。

 

 

当然,如果要展望更远的未来,还需要解决很多关键技术难题。

例如在「深度-放大率」的问题上,则需要设计全新的鱼眼镜头,甚至研发曲面CMOS传感器。

这样在近端显示里,例如拍摄近处的人像或物体,才有可能还原更真实的观感。

同理,VST双目彩色透视也才能变得更加实用,我们无法违背物理法则。

但PICO应该还没有探索这类前沿领域的精力,得慢慢一步一步来。

 

 

而「元宇宙」思潮其实也很简单,资本市场期待的是一个VR版的微信,一个虚拟与现实有强连接的社交平台,一个让人无法拒绝的入口,它会成为VR里通用的公共基础设施。

资本市场是以此来估值定价「元宇宙」的,但是如果不及预期,那么反噬也会很大。

 

目前字节的VR之路还有一个发展的窗口期。

在硬件上的挑战是,苹果可能会有更好的VR显示标准和VR摄影方案。

在软件上的挑战是,腾讯可能会利用已有的微信优势,再复刻出一个正统的「VR版微信」。

但眼下还有发展的窗口期,希望PICO的朋友们继续加油。

 

 

 

那我自己后面也会开一个新系列,分享一下对「双目VR摄影」的一些思考和探索,主要谈谈原理,也会谈小部分器材、拍摄和后期。

不过其实我并不是专业的摄影师,我只是很喜欢「双目VR摄影」相对于「传统摄影」那种思维上的转变。

 

因为它真的很不一样,只有亲自上手了,你才会发现有非常多的坑。

但是当你在VR设备里看到自己拍摄的VR影像时,又会觉得一切都很值得。

我很建议VR相关的从业者,要亲自去尝试一下VR摄影,虽然它目前还有不小的门槛。

 

我希望自己能对国内的「双目VR摄影」有所推动,也希望VR摄影最终能像现在的手机摄影一样普及。

要知道如今这个丰富的短视频和直播生态,其实也都是建立在手机摄影的普及之上的。

 

 

 

今年其实发生了很多事情,完全打乱了我年初的规划,因此我反而不得不停下来,重新整理自己的生活。

那大流行也终究会过去,等逐步解封后,我也打算出去走一走转换思路,顺便也拍一点VR影像,希望到时候能赶上PICO发布一个带分享功能的VR相册吧。

 

而在那之前,我也只能先用一些比较传统的点对点分享模式。

后面我会不定时地分享一些自己拍的VR影像,就上传在视频简介里的那个网盘链接里,有兴趣的朋友可以下载到VR设备里观看。

但是也不用过分期待,我不太懂怎么去做炫酷的视频,这些VR影像还是以探讨「双目VR摄影」的理论为主,可能在画面上并不精彩。

希望屏幕前有条件的朋友,也可以分享你拍摄的VR影像,大家一起学习和进步。

 

好了,这一期【R7】期就到这里了。

我是HW君,我们下期再见。

 

 

(本讲稿完)

By HW君 @ 2022-12-03

guest
9 评论
最新
最旧 最多投票
内联反馈
查看所有评论
phil
phil
2023-11-22 12:25

写的真好,作为刚接触vr影像的人来说,获益匪浅。
apple vision Pro的 3D视频和照片就如您所说,也是kol和媒体印象最深的功能之一。
目前也有想法从手机影像 转到 VR影像发展,期待后续和您交流的机会!

最后由phil编辑于5 月 前
阜阳市33
阜阳市33
2023-08-12 01:15

作者你好,我希望了解您分析的镜头”曲率-放大率”曲线公式是如何得到的,人眼算作镜头,是指接近50MM的标准镜头曲率吗?

阜阳市33
阜阳市33
2023-08-12 17:29
回复给  HW君

非常感谢作者的解答,是不是焦距的不同不单影响成像清晰度,还影响透视关系?相机系统是否在改变焦距的同时像距也随之改变?

我还想问一下,假如作者您的推论正确,那么近距离成像的透视关系人眼相对于常规的鱼眼镜头,可闻差异非常明显(y=0.0137/X+1与Y=0.05/X+1在0.2M以内的比较),我只是个人认为这些近距离透视问题无法忽视!

最后您能简单说说 LAOWA 4MM镜头的线性等效13.5MM(还是13.7MM)是如何换算的?谢谢感谢!

阜阳市33
阜阳市33
2023-08-12 21:59
回复给  HW君

十分感谢作者的指点,您这个系列的探讨非常有意义。我查阅了国内外(也许我能力差劲),几乎找不到深入探究的资料…

最近您研究是否指,在VR观察近景物体比现实小的现象影响因素很多,但因镜头物理设计而导致的失真不是最严重的那个!?

最后我还有一个疑惑,VR视频是不是有这样的过程: 实物–鱼眼镜头(镜头畸变)–成像平面(二维畸变),然后VR播放器反镜头畸变,VR设备的屏幕和透镜反二维畸变,而透镜会放大4寸屏幕的图像,那么这里的透镜放大率是任意的吗(放大到接近现实),还是我理解不对?如何通俗理解呢!?期待作者以后能继续更新这个系列的探讨视频!

阜阳市33
阜阳市33
2023-08-12 22:30
回复给  HW君

非常感谢作者,期待后续的相关话题!目前的VR在还原现实方面,并不能说服和欺骗我的大脑。无论VR视频还是VR游戏,里面的立体空间都非常怪异,当我将VR里面的空间场景和物体与现实比较时,现实里总是那么真实,VR的立体空间总是那么虚拟!

1tothree
1tothree
2023-07-09 11:41

写的好,看完才发现我跟你差不多:
开始是看到vr头显串流打游戏、vr直播、3d电影买的pico。后来发现转了一圈也就这样,新鲜一会儿就过了。
现在在刷全景照片视频,疫情这波催生了好些个全景视频拍摄的站点。估计刷完就开始考虑自己拍点VR照片视频啥的。