讲稿 | 从Pico到A-SOUL,聊聊VR以及偶像

 文 | HW君 

本文为B站【R6】期的视频讲稿

此讲稿未经校对,仅作参考,最终版本以成片视频为准。


【0】前言

消失的模因,各位好,我是HW君

欢迎来到【R6】期,R是Random,也就是说,这是【HW君随便聊】系列的第6期。

这一期聊聊A-SOUL,先分享用这台Pico Neo 3观看A-SOUL节目的体验,然后谈谈VR技术和「偶像」话题。

 

这期视频的内容结构分为4大节:

(1)对A-SOUL观众的Pico Neo 3购买建议

(2)以A-SOUL节目为例,聊聊Pico的使用体验

(3)聊聊我对当下VR技术的看法

(4)聊聊我对A-SOUL的看法

 

视频比较长,也讲得很细,每个分段都有跳转点,大家各取所需,量力而行。

这期的话题和我平时聊的有那么一点不同,部分老观众可能会一头雾水。

但这仍然是一个具有我个人风格的视频,希望你会有所收获。

 

我预设看到这个标题会点进来的新朋友,应该是接触过「虚拟直播」这个亚文化生态圈,或者听说过「A-SOUL」。

因此一些基础的东西我就不再去解释了,如果你不是很清楚并想去了解,可以看我半年前写的那一篇「A-SOUL一周年」专栏文章的第3节,引用链接都放在视频下方简介里了。

 

 

先说明一下,这期视频并不是一个正统的Pico Neo 3测评视频。

我购买这台VR一体机的直接原因是A-SOUL与Pico有一个联动合作,用Pico的VR设备观看A-SOUL的某些场次的节目,会有一个独占的3D全景视角。

也就是说,我的重点其实不在于这台Pico Neo 3,而在于A-SOUL,只是因此聊了许多VR技术的内容。

 

在谈及对VR技术的理解时,我更多分享的是观看VR视频的体验,对VR游戏体验的讨论会比较少。

有些朋友关注这台Pico Neo 3,是想用来玩VR游戏的,  。

 

 

【1】A-SOUL观众的Pico购买建议

在开头的这一节,我先简单提一下一些人会关心的购买建议。

如果你是A-SOUL的观众,想要一个对这台Pico Neo 3的购买建议。

那么首先看你是不是学生,学生党并不是很建议购买。

 

A-SOUL的观众很大一部分还是在校学生,1000多接近2000元的价格对于学生来说算是非常贵的。

并且观看VR直播是需要一个比较良好的网络环境的,校园网环境不一定可以符合需求。

 

6月的那场四人VR首播,我看了路由器的后台,目测直播码率平均是12M,峰值到了20M,一场2小时的直播大概产生了超过10GB的流量。

当然这个数据并不严谨,只是一个粗略的目测估算。(单位bps,注意这里是小b)

 

而7月的那场贝拉VR单播的推流应该是降画质了, 平均码率在8M左右,1个小时的直播产生了3.8GB的流量。(似乎有降帧率)

降画质的策略还是有效的,这场我没有看到有人在直播间里反映卡顿。

不过我还是比较喜欢之前画质拉满的效果,希望官方能够有个画质可调的选项。

 

其实无论是12M还是8M,这对于100M起步甚至1000M光纤入户的家庭宽带来说肯定是绰绰有余的。

我不知道现在各个学校的校园网是怎么样的,但我当年上学的时候,校园网是有10M小水管这种奇葩操作的,并且延迟很高,还经常跑不满。

 

因此如果是10M校园网的话,感觉还是比较勉强的。

10M宽带的最高下载速度是1.25MB/s,如果没缩水能跑满的话,那么你用Pico看A-SOUL的VR直播时,网络带宽应该就不会成为瓶颈。(但没降码率之前跑满至少需要20M)

 

而除了运营商的宽带质量之外, VR直播的观看体验也会吃路由器的稳定性和性能。

因为VR设备是直接贴在我们眼睛上的,一些细小的网络延迟和卡顿都会被成倍放大,让人出现不适感。

 

而我当年上学时,很多同学可能整个宿舍就共用一个远古的单2.4G的迷你路由器。

用这种WiFi信号看A-SOUL的VR直播很可能会有瓶颈,至少要有一个近距离不用穿墙的5G WiFi,并且最好不要有人同时在跟你抢网速,而这可能又会是一笔额外的开销。

 

很多人可能没有意识到这些,但这些是学生党可能会遇到的硬性约束。

 

而作为一个非学生党,我自己是一个愿意为技术和内容付费的人,我也知道VR技术的真实发展情况,不会对现阶段的VR技术抱有什么不切实际的幻想。

因此我可以接受以这样的一个价格去购买这样的一个体验,虽然它目前还有很多问题。

 

我这款是京东自营店购入的「超值基础版」。

而选这个版本的需求也很明确,我不会拿它来玩游戏,哪怕要玩也是用电脑来串流Steam VR玩。

我只用它来看VR视频,最重要的就是A-SOUL的节目。

 

目前Pico和A-SOUL合作的节目安排是,每月至少一场「夜谈」的直播。

例如6月17日的四人VR首播,以及7月27日的贝拉VR单播。

A-SOUL的这些节目在Pico上其实平时经常会有重播,类似于电视上的重播或者B站上的轮播,是不能拉进度条的那种。

但是它没有确切的公告,重播的时间非常随机。

我觉得最好还是能给粉丝一个时间表,毕竟我就是冲着A-SOUL的内容购买Pico。

 

那这个内容量其实还是非常少的,早买也没有早享受,至少在我准备视频讲稿的2022年7月的这个时间点是这样的。

据说后续Pico和A-SOUL会定制独家舞台,那说实话,它画的这个饼我还是比较期待的。

 

我猜测应该是按照汪峰VR演唱会的那种节目形式来做。

那我的要求不高,A-SOUL后面的定制舞台,只要能达到汪峰那场VR演唱会的规格就行,那买这个Pico对我来说就算值回票价了。

 

 

可能还有一部分人是冲着A-SOUL去的,虽然之前没有接触过VR,但也在考虑是不是还可以用它来玩VR游戏。

那这部分人需要调整好自己的预期,现阶段玩VR游戏还是有比较高的门槛的。

 

首先你需要一个宽阔且安全的活动场地。

然后Pico应用商城里的游戏主要还是以小游戏为主。

如果你想用它来串流电脑,玩资源更丰富的Steam VR上的那些知名大作,那你需要一台配置比较高的PC,游戏也得在Steam上另购。

 

如果你想体验更高品质的无线串流,则还得再有一个高性能的无线路由器,并且你最好要知道怎么去配置和优化你的网络环境。

如果是在线互动游戏,需要有良好的运营商上下行带宽;如果是国外的游戏,你可能还需要懂得使用科学技术或者加速器等。

 

但说实话,即便全部折腾一遍之后,VR游戏体验的提升仍然十分有限。

像Pico Neo 3用的是光学定位追踪的方案,也就是主要是依赖它头显上的四个摄像头,来感知头显本体和手柄的位置和移动。

这类定位方案对「光线环境」和「空间环境」是有要求的。

 

它要求你使用的时候,房间的光线不能太亮也不能太暗,也不要有什么太复杂的变化光源,包括红外光。

因为手柄就是通过圆环上的红外光斑,来被4个摄像头进行定位追踪的。

 

虽然绝大部分的环境光线干扰都会被算法过滤,但如果你的光线环境过于复杂,或者玩非常吃动作精度的游戏,有时就可能会体验不佳。

 

像很多人习惯正对着电视或者电脑屏幕使用Pico,虽然大多数时候是没有问题的。

但实际上电脑屏幕的动态画面变化,还是会对光学定位产生干扰的,只不过基本上都被算法过滤了而已。

 

我用电脑串流玩Steam VR上的《Half-Life: Alyx》时,就有遇到过一次定位乱抖的问题。

而那次我只要把电脑上的实时游戏窗口最小化,让显示器只显示一个静态的桌面,定位就又恢复正常了。

 

虽然也只遇到过一次,不过后来我使用Pico的时候,都尽量保持电脑只显示一个静态画面。

当然你也可以干脆把屏幕关掉,确保你的环境里没有复杂的变化光源。

 

因为显示器或电视其实就是一个巨大的变化光源,我猜测如果头显上的摄像头离屏幕很近,而屏幕的画面变化又刚好超出了Pico算法的考量,就有可能会干扰到它的定位和追踪。

 

而除了「光线环境」,它对「空间环境」也有要求。

因为Pico除了要对你的动作进行即时定位,还需要对「空间环境」进行地图重建,环境太过复杂也会影响解算,因此最好是在一个干净整洁的房间里。

不过反过来,如果你家徒四壁、六面白墙,那也是不行的,机器会找不到特征点。

 

但一般用户并没有理想的使用场景,普通人很难辨别究竟是哪些因素导致了体验不佳。

但实际上普通人也不需要知道这些,他们拿到手后觉得不好用,那就是产品的问题,这些是厂商才需要去考虑的问题。

 

因此对VR设备的评价是两极分化的,有的人觉得定位很准,有的人觉得手柄乱飘,有的人不觉得头晕,而有的人很明显感觉晕3D。

这种结果很有可能是因为他们的「光线环境」和「空间环境」是完全不同的,而这还没有算上「网络环境」。

 

因此类似Pico这样用4个摄像头做光学定位的方案,虽然性价比很高,但其绝对性能仍然是不够的,当然我们也可以说Pico的算法还不够完善。

 

现阶段最好的解决方案,仍然是分体摄像头或者说定位基站的方案,搞一个专门的动捕房,才能真正畅快地玩VR游戏。

 

所以VR和HiFi殊途同归,得先搞装修,万物基于房地产。

HiFi走到尽头,就是专门搞个房间,做定制的声学装修,用来听音乐。

VR走到尽头,同样也要专门搞个房间,定制一个私人的动捕房,用来机械飞升。

这下双向奔赴了。

 

而像我这样不玩「VR游戏」,只看「VR视频」,那我也不会只满足于Pico自带的那些资源。

 

 

而VR视频通常文件都很大,我都是下载到NAS里,或者在PC上开「共享文件夹」,然后走内网直接播放。

但如果每次都用数据线来拷贝进Pico里,那体验就会很糟糕。

 

总的来说,虽然Pico Neo 3的性价比已经很高了,但是它对于普通人来说还是有一个价格之外的门槛,你需要去了解和学习很多知识,才能够得到一个不错的体验。

这注定了它现阶段不可能是一个大众产品,虽然喜欢折腾的人可能会玩得很开心。

 

小结一下。

我作为一个非学生党的A-SOUL观众,冲着A-SOUL的内容去购买的这台Pico Neo 3。

对我来说,它就是购买A-SOUL节目的VIP视角,然后附送一个「VR一体机」的功能。

 

对我来说还算值回票价,它能引发我的一些思考,让我想要做一个视频来谈谈VR和A-SOUL,而这原本不在我的更新计划之内。

 

但目前我觉得Pico对于大部分A-SOUL观众来说都是不值得购买的,特别是考虑到这个群体多为学生党,并且目前A-SOUL在Pico上的节目量还很少。

当然,我也很期待后续Pico和A-SOUL能有一些精彩的内容制作,希望不要辜负大家的热爱。

 

好了,购买建议就只到这里,我们开始正片。

 

 

【2】用Pico看A-SOUL的体验

去年「元宇宙」这个概念在资本市场里被炒得很火。

那时候刚好A-SOUL一周年纪念,于是我写了一篇专栏文章,分别从「科技」和「认知哲学」的角度谈了谈对「A-SOUL」的看法,顺便讽刺了一波「元宇宙」的概念。

文章比较长,总结一下大概是「元宇宙正统在A-SOUL」,当然只是一个调侃。

 

作为一个数码爱好者,我还是有在留意VR行业的发展的。

而刚好我又很喜欢A-SOUL的节目,因此当联动出来之后,我就下单了这台Pico Neo 3。

你可以理解为,我也是在趁A-SOUL的这个联动机会,去体验一下国内消费级的VR设备发展到什么程度了。

 

因此这一节第2大节接下来的内容,主要还是从一个A-SOUL观众的角度,谈谈Pico观看「视频类节目」的使用体验。

这里我将其简单分3种情况讨论。

 

第1种方式,用Pico观看A-SOUL普通的2D视频。

第2种方式,用Pico观看A-SOUL的VR视频,例如6月和7月的那两场「夜谈」。

最后是终极用Pico看A-SOUL,依赖客户端进行本地渲染,那这个时候它就不再是「视频直播」了,它本质上是一款「VR游戏」。

 

前两种模式在Pico上是已经实现的了,但似乎更多人期待的还是未实现的第3种模式。

不过我并不看好第3种模式,目前我比较看好「VR视频」而不是「VR游戏」。

我们从最简单的第1种开始聊起。

 

 

【2-1】看2D视频

 

我们先看一下Pico Neo 3的基本参数。

它的处理器是2019年底发布的高通骁龙XR2,也就是魔改版的骁龙865。

显示屏幕是一块5.5英寸的LCD屏,分辨率为3664*1920,刷新率默认是90Hz,最高可调120Hz。

菲涅尔透镜的视场角是水平98°垂直90°,我们可以近似理解为双眼98°单眼90°。

瞳距有58mm、63.5mm、69mm的3档调节,那很巧,我的瞳距刚好就是69mm。【尺】

 

事实上如果不是因为A-SOUL,单看这个参数我并没有购买的欲望,它的配置需要为售价做出妥协。

以这个硬件参数,如果想要获得非常顶级的体验,那么它的内容开发团队至少要有任天堂的水平。

 

因此我对它的预期就是拿来看视频类节目,例如A-SOUL的直播。

准确来说,A-SOUL的内容给了我一个购买Pico Neo 3的理由。

但就观看「视频类节目」的体验来说,它也存在有很多问题。

 

首先它用了一块5.5英寸4K分辨率120Hz刷新率的LCD屏幕,但我们在用VR的时候双眼显示的画面是分开的,因此纸面上的单眼分辨率就是1832*1920。

而扣除四周不显示的像素点,以及糟糕不可用的边缘画质,实际上可用的单眼分辨率是要更低的。【B站拆解视频】

并且因为我们的眼睛离屏幕的距离非常近,于是这块LCD屏幕的所有缺点都会被放大。

 

B站的数码UP主在测评手机、电脑、电视等产品时,往往会测屏幕的亮度、对比度、可视角度、色域、色阶、色准等项目。

如果按照这些标准,去评价Pico的这块LCD,那么它的屏幕素质是非常差的,色域色准什么的都是不行的。

 

当然有一个地方它还是有优势的,因为是直接戴在眼睛上,离得很近,所以人眼直观感受到的亮度会很高,高光部分很有HDR的感觉。

但同样也因为离得很近,LCD的暗部显示则完全不行,它不存在纯净的黑色,永远是一片很脏的灰色。

而在显示大光比的场景时,菲涅尔透镜会产生类似「丁达尔效应」的神光问题,这就比较影响观看体验。

 

人眼透过这块菲涅尔透镜后的实际观看体验,让我想起了以前学校机房里的,那些用着XP系统的办公电脑,能看到明显的像素颗粒感。

这在手机和电脑屏幕的体验越来越好的今天,还是有点不够看的。

 

那为什么Pico Neo 3使用了一块5.5寸4K的高清屏幕,但最后只能得到一个颗粒感的实际体验呢?

事实上我们在评价VR的显示效果时,除了关注显示分辨率,还会关注「视场角」FOV。

 

现实生活里,人双眼的极限视场角,在水平方向上大概是220°,在垂直方向上大概是135°。

而Pico的双眼视场角则是水平98°,垂直90°,因此你在使用Pico时,视野会被遮挡许多。

 

我们可以先比一个爱心,然后透过爱心去观察这个世界,带着Pico观看VR世界的感觉大概就是这样的。

 

如果用VR眼镜的「分辨率」除以「视场角」,就可以得到「角分辨率」PPD。

PPD的高低,决定了你实际观看到的画面是否清晰,是否会出现颗粒感。

如果按照单眼的纸面数据来计算,那么Pico Neo 3的PPD约为20(1832除以90)。

 

那么应该如何去描述Pico Neo 3的实际观感呢?

虽然我们不清楚Neo 3的光学参数,但Pico所模仿的Quest 2,有透露过它的「单眼」成像焦平面在人眼前的1.3米处,那我猜 Pico也差不多应该是这个光学规格。

 

根据我们在中学物理课上学的「凸透镜成像」原理,Pico上的这块菲涅尔透镜可以看做是一个凸透镜, LCD屏幕透过它成「正立放大的虚像」,像距约为1.3米。

 

因此对Pico Neo 3最恰当的「单眼」的观感描述应该是,先保持你的头部静止不动。

那么在你眼睛正前方1.3米的位置,有一块长宽约2米*2米,分辨率为1832*1920的巨型显示器,它覆盖的视场角为90°,PPD是20,有颗粒感,90°之外的视角被遮挡不可见。

 

而如果你的头部转动的话,那么这块屏幕会跟着你的头一起转动,永远保持在你的正前方,占据90°的所有视野。

注意这个观感描述是「单眼」的,如果是「双眼」的观感会受到「双目视差」的影响。

 

不过现实里我们很难去想象这样的屏幕,因此如果忽略「视场角」FOV,而只考虑像素「颗粒感」,可以将其20 PPD的观感近似等效为。

用50cm的距离去看一块32寸1920*1080的屏幕,或者,

用50cm的距离去看一块23.8寸1280*720的屏幕。

 

观看这两种参数的屏幕,我们感知的颗粒感也都约为20 PPD,用这种在线的「视角计算器」就能算出这些数据。

 

那20 PPD显然是能看到像素点的。

而要接近人眼感知像素点的极限,让人察觉不到颗粒感,达到类似手机或电脑屏幕所谓的「视网膜显示」级别,则理论上最低需要60 PPD。

60 PPD大概也就是用50cm距离去看一个23.8寸4K显示器的效果。

 

那么假设我们不改变Pico的透镜规格和光路设计,只通过更换这块5.5寸4K的LCD屏幕来实现60PPD的视网膜显示级别。

那么单眼分辨率纸面上需要提高到6K,双眼加起来需要12K。

也就是我们要把这块5.5寸的LCD屏幕的规格,从4K升级到12K。

 

那现实就是根本就没有这种屏幕,骁龙XR2也带不动12K的分辨率,无论是材料、工艺、还是算力都跟不上。

 

而在世界范围的VR硬件商里,「小派Pimax」就是走暴力堆屏幕分辨率的路线。

不久前在电视剧《三体》预告片里客串的那台VR设备,应该是小派的8KX。

它家在2021年10月就发布了12K的产品,不过因为视场角也做得更大,所以PPD也只有40左右,大概是50cm距离看27寸2K屏的感觉。

但现在还只是PPT,原定计划在2022年第四季度上市,还不知道真实体验怎么样。

 

走堆分辨率的路线,如果我们给足冗余度,假设要在70 PPD的颗粒感下,实现「单眼」极限的水平170°垂直135°的视野,那么理论上单眼要12K分辨率,双眼就要24K分辨率。

这一技术路线显然道阻且长,前路漫漫。

 

那40 PPD就是人类现有技术能到达的极限了吗?不是。

我们可以看一下目前VR行业内显示画质的天花板,Varjo VR-3 / XR-3。

它家可以把PPD做到70,用了一种很巧妙的方法。

 

虽然我们双眼的视场角在水平有220°,垂直有135°。

但在某一瞬间你只会注视着视野中的一块很小的区域,而余光其实是模糊的,除非你把「注视点」切换过去。

 

因此我们只需要保证眼睛注视的那部分视野,能实现高PPD就行。

Varjo的VR-3就是利用这一点,去实现高PPD的「注视点投影」。

 

VR-3用了4块显示屏,其中2块分辨率为2880*2720的LCD作为底屏,提供比较不清晰的30 PPD的水平115°,垂直90°的较大视野显示。

然后再用2块分辨率为1920*1920的Micro OLED在半透镜上进行投影,以提供水平和垂直各27°范围内的,70 PPD的清晰的注视点显示。

并且这个70 PPD的投影区域会跟随着你眼睛的「注视点」进行移动,你注视到哪里,它就在哪里投影清晰的画面。

 

因此网上那些体验过Varjo VR-3(XR-3)的人,都会感慨这才是真正的没有像素点的虚拟现实,感觉就像看到当年乔布斯在iPhone 4上展示视网膜屏幕一样。

这应该也和它宣称能做到99% sRGB的色域有关。

 

不过我自己其实没有亲身体验过,但是Varjo既然敢拿出来商用,网上连拆机图都能找到了,那我姑且先选择相信它。

而其他一些传说中的神神秘秘的VR「原型机」「工程机」吹起牛来,常常是没有上限和下线的。

 

那么实现70PPD的代价是什么呢?

首先它要有四个屏幕和四组独立的光路,其中两路投影注视点视野的光路要精确可调。

而为了追踪你的注视位置,每只眼睛需要用20个传感器进行「眼球运动追踪」。

所以这个戴在头上的东西重量会有944克。

 

这944克还只负责显示,没有计算功能,没有扬声器,连电池都没有,需要外部供电。

你需要用一堆线缆连接台式机才能用,PC配置推荐i9-9900K+3080起步。【复杂连接图】

除此之外还需要另外购买手柄以及分体的定位基站,然后还要购买它家专用的付费订阅软件。

 

总之你想要完整地使用它,全套下来预算先准备个10万人民币。

它还有一款更高端的Varjo XR-3,多了一些增强现实功能,当然价格也更高端了。

 

当然这已经不是普通的消费级产品了,这里我只是想介绍一下VR行业目前的量产天花板。

Varjo代表了企业级VR的顶尖水平,和Pico的消费娱乐级定位完全不一样。

Pico不到2000块钱,就提供了一整套完整的VR体验,这么一看就非常有性价比了。

 

那Pico的这种大颗粒的32寸1080p的观看体验,就代表了它的体验是不好的吗?

其实也不是,我是来看A-SOUL的,只要把粉丝滤镜拉满,自然就可 以做到心中无码。

 

特别是你跟着直播节目的节奏,进入了A-SOUL观众特有的「快快快」「好好好」「赢!」这样的状态之后,那你确实能够得到一个很深度的沉浸感,足以让你忘掉它在显示效果上的那些问题。

 

而这种独特的「沉浸感」,它也确实是VR设备这种「双目显示器」所独有的。

其关键就在于要让你的左眼和右眼,在同一时间看到一组相似但有差异的画面,而这份差异会告诉你的大脑,这个画面中的物体与你的距离。

 

严谨一点来说,现阶段的VR设备主要是通过「双目视差」给我们的大脑提供了一组额外的「深度信息」,从而营造出「空间感」。

 

「深度信息」翻译成大白话其实就是「距离信息」,它告诉你画面中的物体和你的距离。

在工业领域就有所谓的「RGB-D相机」,D就是指深度,它们是用来捕获「深度信息」的。

其中模拟人眼的「双目深度相机」的应用也很常见,多被用于3D扫描或者自动化控制。

 

而VR眼镜则反过来,是用来对人眼输出显示「深度信息」的。

如图,在VR眼镜里,我们双眼各看到的屏幕画面,其实是相似但不同的。

我们把左屏幕显示的蓝色小球B1固定,然后改变右屏幕的小球B2在画面中的位置。

那么双眼共同成像之后,大脑会感觉只有1个蓝色小球,而小球与我们的距离在发生改变。

 

用「双目视差」制造「深度信息」的技术其实也不罕见,我们大部分人在电影院看过3D电影,它也可以看成是一种「双目显示」,因为你必须戴3D眼镜,让双眼看到不同的画面,才能获得「深度信息」。

 

有了这种携带「深度信息」的「双目视差」,我们的大脑就能解读出,屏幕显示的图案离自己的距离。

因此虽然Pico在光学上的「单眼」成像距离是1.3米,但 是我们可以通过对「双目视差」的调整,欺骗我们的大脑,从而几乎任意地制造「距离感」。

这就是为什么玩过VR的人都会说,透过VR设备看东西,更具有沉浸感。

 

因此哪怕Pico Neo 3的实际画质体验就是10年前的低端显示器的体验,但它所额外带来的「沉浸感」,却是如今画质再顶级的单画面显示器都无法提供的,它是VR设备这种「双目显示器」所独有的。

 

所以现阶段你购买消费级的VR设备,你还远没有到为它的「画质」付费的阶段,而是在为它额外提供的「深度信息」付费。

你是在为它的「沉浸感」付费。

 

这也是为什么用手机或者电脑去看VR的录屏画面,其实是没有多大意义的。

因为你并不能从「单画面」的手机或者电脑屏幕上,获得一份基于「双目视差」的额外的「深度信息」。

而这种独有的「深度信息」正是VR塑造「沉浸感」的关键。

 

 

 

 

不过,我们在这里要讨论的还没有到「3D视频」,而是「2D视频」,下一小节才讨论「3D视频」。

而我的观感是,你用VR设备看普普通通的「2D视频」,仍然可以获得非常独特的体验。

 

要如何理解这一点呢。

同样的一段2D视频,你在手机上看,在电脑上看,在电视上看,在教室投影仪上看,在电影院里看,在全球顶级的IMAX巨幕上看,它们的体验都是完全不同的。

哪怕你去IMAX厅不看好莱坞3D大作,就只用它来刷B站上的2D视频,也会有一个非常顶级和震撼的体验。

 

这种体验是巨幕影院在物理尺度上的广阔空间感所带给你的,它与在小尺寸手机上的体验是截然不同的。

这也是为什么明明在电脑上也可以看好莱坞大片,甚至还可以免费看,但还是有很多人会选择花钱去电影院。

 

而VR设备的特别之处,就在于它可以通过「双目视差」来欺骗我们的大脑,从而「低成本」地制造出这种广阔的「空间感」。

 

以A-SOUL的Pico首播预告片为例,当你在Pico里点开这个预告片,它会给你创造一个巨幕影院看电影的氛围感。

在距离你20米远处,有一块宽30多米高20米的巨幕,上面播放着A-SOUL的影片。

并且你可以在一定范围内对这些尺寸进行调整。

 

也就是说,VR播放器会对这个平平无奇的2D视频进行一个后处理,为其添加一个可以自定义的「深度信息」,让你的左右双眼能看到出一组有差异的画面,从而模拟出巨幕影院的那种物理尺度上的「空间感」。

 

而在现实中搭建这么一个放映厅,成本是非常巨大的,国际顶级IMAX巨幕厅造价是按亿来算的,并且你在买票时未必能抢到黄金位置。

因此在当我点进来看这个平平无奇的2D预告片的时候,在那一瞬间我确实有一个很高峰的情绪体验。

 

我脑海中涌现出一个场景,如果有一天A-SOUL出了院线播放的剧场版电影,虽然你猜到了大概率是部烂片,但仍然去了你们当地最好的巨幕影院,挑了一个最好的位置进行观看。

那种感觉大概也就是如此。

 

从粉丝的角度,在这一瞬间体验的这个「情绪价值」,对我来说值200块钱,大概一张IMAX影院的黄金位置的价格。

 

当然我们还是要理性分析,这样的2D视频体验并不依赖于Pico,用任何一台合格的VR设备都可以做到。

它是VR设备的通用特性,而不是这台Neo 3的独有特性。

 

并且对我来说,这些感受又依赖于A-SOUL,也就是我其实是双标的。

在看A-SOUL的节目时我可以忍受这个画质,但是换别的内容我就没有办法忽视画质问题。

 

如果摘下粉丝滤镜,并忘掉VR设备通过「双目视差」带来的空间感,只评价它的画质。

那么它就是那一台32寸1080P低端显示器的画质体验,虽然画面尺寸你可以自由调整,但20 PPD的颗粒感是固定的。

并且它的色域和色准都很不好,而我是个画质党,平时刷B站有4K必开4K,看直播必开原画。

 

 

【2-2】看VR视频

那到刚才谈的是用Pico看「2D视频」的体验。

而A-SOUL在Pico上的节目,是一场「双目3D」的360°全景视频的直播。

 

例如6月份的这场四人VR首播,节目内容是「夜谈」,也就是除了开头和结尾的两段歌舞,中间2个小时都是四人坐在那里聊天。

7月份的贝拉VR单播内容,主要也是和观众聊天和唱歌,不过中间有特意为Pico用户设计了几个小互动,但也表现得非常克制。

 

这两场VR直播从技术角度来说非常谨慎和保守。

有一些人感觉非常失望,但我觉得还是合格的,至少它做到了可控。

在我看来,A-SOUL的VR节目的重点在于不要犯错,苟着被人骂技术不行,也要比搞出大新闻好。

 

有些活儿别人可以做,但是A-SOUL不可以。

这涉及到A-SOUL的「商业模式」和「自我定位」的问题,这两个部分我们后面都会展开讨论,一点一点来。

 

我知道有些人瞧不起「3D全景视频」的模式,但它其实是当下最适合A-SOUL的技术路径。

因为VR的「3D全景视频」+「虚拟直播」方案,是一种高效的算力集中化。

它能做到一次渲染多次分发,本质上是对当下「人均算力不足」的行业现状的妥协,是用「传输带宽」换「即时算力」。

 

我们不妨用手机性能来比喻。

我们现在的普通手机算力,要跑720p的《原神》游戏是很吃力的,但用来解码播放8K的视频则是有余量的。

 

而在Pico上运行3D游戏,你需要跑满这块LCD屏幕原生的4K分辨率才能得到一个23.8寸720p的实际体验。

 

而Pico上的这个骁龙XR2芯片,虽然已经是「VR一体机」能用到的性能最强的处理器了。

但其实也就是魔改版的骁龙865而已,它的算力水平决定了它跑不动高画质VR游戏,除非你用PC渲染,然后进行串流。

 

不过,以骁龙XR2的算力水平,它刚好差不多可以解码分辨率为7680*7680的双目3D的360°全景视频,而这又刚好差不多能够喂满Pico这块屏幕的4K像素,最终差不多呈现一个23.8寸720p的实际画质体验。

 

如果你直接走本地渲染的VR游戏模式,那就只能得到一些低模多边形小人。

这样一比较,播放8K的3D全景视频的方案就显得非常有性价比,它是当下算力水平的最优画质解。

当然,这种差不多恰到好处的,在「分辨率」、「视角」和「算力」上的妥协,其实应该是Quest 2在商业上的精心设计。

 

 

那我们看6月A-SOUL的这场VR演出,它本质上仍然是一种「视频直播」。

也就是「Pico视频」这个APP从云端服务器给你推了一个平平无奇的2D视频流。

然后Neo 3这台VR设备,将这个2D的视频,在本地解算为一个「双目3D」的360°全景视频。

 

我们可以试着去理解这一过程,如果想批评一个东西,那也要批评得高明一点。

先从更简单的2D全景视频说起。

B站上有一个搬运YouTube的过山车视频。BV1pk4y1C7XM

 

它就是一个最基础的「单目2D」的360°全景视频,注意是「单目2D」而不是「双目3D」。

如果我们关闭播放器的「全景模式」,那就会看到它其实是一个透视关系比较奇特的普通2D视频,其画面是这样的。

这就是B站的云端服务器给你推的原始画面。

 

而当我们开启播放器的「全景模式」,那么本地的播放器会将这个2D画面解算为一个虚拟的球幕,也就是将这个2D视频贴在了一个360°的球型屏幕上播放。

而我们的视角就在球幕的球心,你往任意一个方向,都能看到画面。

 

就有点像给你了一张平面的世界地图,让你自己贴成一个地球仪,只不过我们人在地球仪的内部。

 

此时暂停的实时显示画面是会发生改变的。

在电脑上的话,我们可以用鼠标对视角进行拖动。

如果是在手机或者平板上,则可以用内置的陀螺仪来获取一个更加真实的视角反馈。

 

我们在某一帧暂停,暂停之后,我仍然可以在「俯仰轴」和「航向轴」的方向,各做360°的视角自由转动,这里我们先忽略「横滚轴」。

绕「俯仰轴」,你可以抬头低头;绕「航向轴」,你可以向左转或向右转。

 

实际上可以看成,本地的播放器虚拟出了一个球幕显示器,但我们的手机屏幕尺寸太小,每次只能显示其中的一小部分画面。

如果我们有一个足够大的360°的球面显示屏,那么就可以在同一时间内,把这个视频的所有像素内容全部显示。

 

B站UP主「先看评测」就搞过一个360°环形屏幕的体验。

这组环形显示器的曲率是1000R,也就是说围成的圆环半径是1000毫米,也就是1米。

 

但它其实只有在水平方向上有360°的显示区域,而垂直方向换算之后的视野只有很窄的20°。

那么使用这一组显示器,你在航向轴上有360°的视角自由度,但在俯仰轴上只有20°。

 

 

你可以想象一下未来屏幕工艺有了巨大的进步,我们能造出一种球型屏幕,可以把你完全包起来的那种。

那么用这个球型屏幕来显示刚才的过山车视频,它的所有原始视频像素就可以在同一时刻被完全显示。

但现在我们的手机屏幕还太小,或者不够卷,因此在某一时刻只能显示出虚拟球幕的一小块区域。

 

 

但是,VR眼镜可以低成本做到这一点。

前面说了,Pico的「单眼」成像焦平面大概在人眼前的1.3米处,那如果忽略「双目视差」,它的「单眼」观感换算过来,其实就是一个1300R的球型显示器。

 

也就是说,如果我们用Pico去看一个不进行后处理的「单目2D」的360°全景视频,那其实它模拟了一个半径为1.3米(曲率为1300R)的完整的「球型显示器」,360°全方位将你包裹起来。

 

如果要在现实里制造这样的球型显示器,那么它的显示(球)面积约为21平方米,换算成 16 : 9 规格的显示面板的话,长约6.2米宽约3.4米,大概是280英寸。

这样一想,VR虚拟出来的东西真的很省钱。

 

 

但要强调的是,上面提到的这种「单目」的360°全景视频,严格来说它仍然只能算是2D的。

它虽然也会给人身临其境的感觉,但是这种感觉主要是来自于,你的「俯仰轴」和「航向轴」方向上各有360°的视角自由度。

 

现实生活里人双眼的视场角,在水平方向上大概是220°,在垂直方向上大概是135°。

因此你永远无法在同一时刻看到360°球幕的所有的画面,在现实里你想看身后的东西需要回头。

 

所以在2D全景视频里,我们可以通过视角的转动,让每一帧的实际显示画面发生改变,从而模拟人在现实中与环境交互的那种参与其中的「互动感」,并感受画面中物体的「相对」空间位置,你确实能感觉到物体在你的「前后左右」的不同方位上。

 

但这样的2D全景视频本身不包含「绝对」的「深度信息」,它给人的3D效果只是一种单纯的心理感知。

它仍然是一个2D的平面视频,只是被弯曲成了一个360°的球幕。

我们在普通的手机或者电脑屏幕上,就已经可以近似完整地体验到这种「单目2D」的全景视频。

 

但如果是「双目3D」的全景视频,那你只有在用VR设备观看时,才能解算出一组额外的「深度信息」。

「双目3D」的360°视频的原理和2D的差不多,但是由2个相似但有差异的画面组成。

 

例如这是YouTube上的一个3D的360°全景视频,一个荷兰的城市旅游VR视频。

它的原始2D视频流是这样的。

贴图方式比较简单,上面是左眼下面是右眼,本地播放器会将其同时解算成2个360°的有差异的球幕,我们的左眼看的球面和右眼看到的球面是不一样的。

 

而这一组2个不同的球面被双眼同时看到时,是携带「深度信息」的。

透过VR设备,你的大脑可以直观感受到自己离画面中的树、人、房子的距离是不同的,有前有后。

而不像2D全景视频一样全靠脑补。

 

像这样通过「双目视差」制造「深度信息」的机制是有生物学基础的,因为人类的双眼天生就存在距离,我们称其为「瞳距」。

屏幕前的你可以尝试一下,闭上左眼睁开右眼,然后将两只手指前后放置,近端的手指刚好完全挡住远端的手指。

此时再睁开左眼闭上右眼,那么你会发现在左眼看来,刚才的遮挡就消失了。

现在我们把两只眼睛都睁开,你就会发现我们熟悉的空间感就出现了。

 

这是因为在同一时刻,左眼和右眼的空间位置是不同的,因此它们看到的图像是有差异的,而这份差异能够提供「深度信息」。

因此虽然Pico的单眼「成像距离」是固定的1.3米,但是我们利用「双目视差」可以制造出不同的「深度信息」。

 

当然,这也并不是说人类就只通过「双目视差」来获取空间上的「深度信息」。

实际上双眼也有不同于「双目视差」的「双目汇聚」(视轴辐合)机制,它属于肌肉记忆。

 

单眼也有获取「深度信息」的机制,叫做「聚焦模糊」,人眼因此可以感受到「单眼3D」。

然而在VR眼镜上,单眼的「聚焦模糊」机制无法使用,像Quest 2和Pico Neo 3的单眼成像焦平面就是固定的1.3米。

 

因此我们在VR里感受到的,基于「双目视差」和单眼「聚焦模糊」的两组不同的「深度信息」之间是有冲突的,这就是所谓的「VAC问题」。

(Vergence–Accommodation Conflicts) 视觉辐辏调节冲突

 

「VAC问题」也被称为VR/AR领域的「圣杯」问题,至今还没有人能解决。

一般的做法都是只使用「双目视差」来主导VR画面的「深度信息」,让人脑被动忽略单眼的「聚焦模糊」。

为了达到更好的效果,还可以用「注视点渲染」来模拟80%的「聚焦模糊」效果,但它其实也没有从根本上解决问题。

 

而基于「双目视差」的「深度信息」,目前是最容易用摄像机记录,并通过VR设备复现的。

你只要用两个平行放置的摄像机,让它们的距离为人眼瞳距,同时去录制一个场景,那么你就能记录下一组「深度信息」。

后期用VR眼镜进行观看,大脑就能复现出被摄像机记录下来的「深度信息」。

这同样也是3D电影所使用的原理。

 

所以我们在观看A-SOUL的VR直播时,「Pico视频」的云端服务器给你推了一张类似这样的2D视频流,它包含了场景里的所有图像。

当然我这里没有原图,也不清楚Pico的贴图方式,这张只是随便画的示意图。

 

本地的Neo 3在接收到原始视频流之后,会先解算为两个360°的虚拟球幕。

然后再结合你的头部空间姿态,对球幕的显示区域进行98°视野的截取。

最终在它的5.5英寸4K的LCD屏幕上,则显示出类似这样的一个像素画面。

 

而我们的双眼透过98°视场角的菲涅尔透镜组去看这块LCD屏幕,实际看到的画面是类似这样的。

我们大脑里的这个最终画面它是3D的,它带有「深度信息」。

 

6月和7月的两场VR直播都是用的这种方式。

不过6月的首播,四人都刻意和摄像机保持一定距离,所以立体感不强。

而7月的贝拉单播,中间特意为Pico用户设计了几个小互动,贝拉站得离摄像头比较近,所以效果会好一点。

我自己的感觉是,「双目视差」在1米左右的立体感是比较好的,超过2米之后效果会变得比较弱。

 

于是绕了这么一圈,我们得到了2个在B站看「普通直播」所得不到的东西。

(1)一组额外的「深度信息」。

(2)一组2个轴位的「视角自由度」。

 

「深度信息」构造起了场景的空间感和人物的距离感,也就是你可以直观感受到画面中的物体离你的距离。

而「视角自由度」则是,你的视角可以在「俯仰轴」和「航向轴」,这两个轴位上进行360°的自由转动,简单来说就是你的脖子可以抬头低头+左转右转。

 

第一个的「深度信息」提供了「空间感」,它让你感觉演员就在你的眼前,你有一个真实的距离体验。

第二个的「视角自由度」则提供了「互动感」,你摆脱了导播员运镜的约束,可以自由选择视角,想看哪就看哪。

 

「空间感」和「互动感」这两者加起来共同构建了VR设备独有的「沉浸感」。

因此现阶段如果你因为A-SOUL而去购买Pico,其实你所支付的是这些东西,它们是你在B站上看直播时无法获得的东西。

 

 

【2-2-1】沉浸感的代价

A-SOUL在Pico上的VR直播,推流的是一个双目3D的360°全景视频。

因此本质上你仍然是在看线上的直播视频,而不是在玩本地的游戏。

这种做法其实是在用「传输带宽」换「即时算力」。

 

6月份四人VR首播的平均码率是12M,峰值码率会去到20M,约为B站2K 60帧「原画」直播码率的2倍。

不过7月的贝拉VR单播就降画质了,平均码率大概是8M,估计是为了照顾大多数人的网速。(似乎有降帧率)

 

当然我不清楚Pico用的编码格式是什么,但就这个清晰度而言,原始2D视频流的分辨率肯定是有到8K的。

 

而这也是目前所有VR设备看全景视频头疼的问题,用8K数据量在4K的屏幕上播放,然后得到一个23.8寸720P的大颗粒效果。

但它却是现阶段性价比相对较高的方案,是对「人均算力不足」的妥协。

 

在Youtube上就有不少3D的360°全景视频,这算是最容易找的VR片源了

可以说YouTube的8K分辨率就是专门为这类VR资源准备的。

 

例如这个威尼斯的城市旅游视频。

 

它的原始2D视频流是这样的一个分辨率为7680*7680的8K视频,平均码率是35M,编码格式为压缩效率更高的VP9。

我们把它下载到本地,不做额外的解算直接播放,那看到的就是这样的一个2D的原始画面。

 

这个画面是实景拍摄然后拼接而成的,分为两个部分,左半边解算出左眼的图像,右半边解算出右眼的图像。

YouTube这里用的全景贴图方式是谷歌的「等角立方体贴图」。

(Equi-Angular Cubemap )

 

像一开始我们举例的那种最简单的全景贴图方式叫「等量矩形投影」,也就是简单按经纬线进行贴图。

它贴图之后,视频像素在球幕上的分布是不均匀的,在赤道和极点的位置都会出现像素浪费。

而谷歌的这种「等角立方体贴图」则更高效,它可以确保在进行全景贴图之后,「视频文件像素」可以均匀地分配给「屏幕显示像素」,以节省数据带宽。

 

而这样的一个编码为VP9,码率为35M的8K视频,仅仅9分钟所需要的文件大小就是2.2GB。

我在Pico本地用自带的Pico Player播放这个视频,是会出现卡顿的。

 

当然我还不清楚这是Pico Player对谷歌VP9编码的优化问题,还是说这个解码压力已经超过了骁龙XR2的算力极限。

不过播放H265编码的8K视频,则没有什么太大压力。

 

但是哪怕强如YouTube,用了更加科学的8K分辨率,最后也仍然只是得到了一个更合理的720P画质效果,性价比真的非常低。

因此在大部分情况下,人们选择了一种更加折衷的做法,那就是砍掉一半的视角,制作成180°全景视频。

 

首先你的数据量会直接减少一半,并且你前期也不需要一些冗余的像素进行后期的拼接,所以也不用过多地去考虑边缘画质,只需关注中央画质。

因此现阶段真人拍摄的VR视频基本上都采用180°这种高性价比的做法。

 

Pico官方的「Pico视频」APP里,就有一些3D全景视频的资源,质量参差不齐。

但只要是真人实景拍摄的视频,基本上都是180°的。

 

它画质选项这里的8K还真不是在骗你,要实现这样的一个显示效果,确实需要推一个8K分辨率的原始视频流。

不过它的平均码率并不高,我不清楚Pico用的是什么编码,但因为大多数是静态场景,所以观感其实还凑合。

 

网络上还是能搜索到不少高画质的VR片源的。

特别是国外的VR成人视频,也基本上都是采用180°这种高性价比的方式。

但即便如此,数据量也是十分惊人的,8K分辨率60帧,H265编码,平均码率在50M左右,一个40分钟的视频文件大概要15GB。

 

在电脑屏幕上看原始视频流,感觉就像是直接用两个尼康Z9拼在一起拍出来的高清大片。

但解算为3D全景之后的实际VR显示效果,仍然只是一个画质比较好的720P。

只是说在这种题材下,人们对于画质的忍耐度是比较高的。

因此这也是VR技术在国外最成功的商用场景,成人VR视频。

你能找到的高画质VR片源基本上都是这一类,色情是第一生产力。

 

但说实在的我并不喜欢180°的全景视频。

因为本身在看360°视频的时候,我就已经有种自己是个全身瘫痪只有脖子能动的轮椅人的错觉。

而切换到180°视频的时候,我发现自己的脖子也动不了了,就只剩下眼珠子能转,整个体验再下一个台阶。

 

但是就前期拍摄来说,从180°到360°,工作量可远不止是翻倍这么简单,制作难度是直接提升了一个量级的。

180°全景的前期拍摄比较简单,两台相同的相机平行拍摄就可以完成,甚至一个相机加上一个有两光路的VR镜头也可以实现,佳能就出了一个这样的VR专用镜头。

 

而2D的360°全景视频,则也有类似Insta360这样简单的双摄像头前后拼接的解决方案,不过它的画质其实并不好。

YouTube上有许多高品质的2D的360°全景视频,都是前期用多个高端无反相机去拍摄,然后拼接成16K,最后再下压到8K进行上传。

 

而拍3D的360°视频,哪怕是性价比最高的解决方案,也至少要是Insta360        Pro2这样的6摄像头阵列,但其实它的画质不够看。

B站的UP主「马赛Marcel」就有出过一个拍3D的360°全景视频的教程。

 

整个过程非常麻烦,如果是拍摄180°视频,导演和摄影师还可以躲在摄像机背后的视野盲区里。

但拍摄360°视频时,摄影师在提前架好设备之后就要离开屋子,不然被拍进去会影响沉浸感。

 

而这也是为什么「Pico视频」里的真人VR视频和直播大多都是180°,因为那些场地都是些简陋的影棚,只有面对着摄像机的那一面还收拾了一下,更多辛酸的东西都藏在摄像机的背面。

除非你在后期进行绿幕抠图和场景合成,汪峰在Pico的VR演唱会就是这样做的。

 

总的来说,在现实世界里拍摄3D的360°全景视频,要比180°的难度高了不只一个数量级,性价比很低,极不划算。

并且这一领域的前期VR摄影技术和后期的图像融合算法都还不够成熟。

 

但是,换成「虚拟直播」的话,360°和180°之间的门槛会被抹除。

首先是工作人员仍然可以留在场景之中操纵设备,辅助镜头前的演员进行表演,而不必像现实世界里那样,需要完全离开全景相机的视野范围。

 

其次是在虚拟世界里,你可以虚拟出一个完美的360°全景相机,这个虚拟相机可以捕捉到不用拼接的360°全景视频,而不需要像现实世界一样用多个相机组成阵列拍摄,后期进行不完美的图像拼接。

像Youtube上所有的实拍现实世界的3D全景视频,图像拼接处基本上都是有问题的,人眼很容易发现过渡的接缝。

 

但是在虚拟世界的360°全景视频里,不会存在不自然的拼接缝,以及其带来的割裂感。

而因为根本不需要图像拼接,也就不需要冗余的边缘像素,那么「虚拟直播」也可以更好地节约前期压制视频的算力和带宽。

 

甚至我们可以说,VR的这种「双目3D」的360°全景直播,现阶段最好的应用场景就是「虚拟直播」,几乎就是量身打造。

它可以完美地绕过真人3D全景直播的许多棘手的问题。

 

所以6月17日那天晚上进入A-SOUL的直播间后,看到直播场景是360°的,我还是比较满意的,觉得至少Pico还有点追求的,没有完全摆烂。

低成本实现3D的360°全景,是「虚拟直播」相对于「现实直播」的一个非常明显的优势,不可以舍弃,不然就没有必要找A-SOUL合作。

 

虽然没有图像的硬拼接缝,但是Pico为了节省数据带宽,可以看到大概只有正前方90°视角的画面是高清渲染的,而出了这90°的沙发之外的视野范围就是用的低清渲染。

或者我猜测,目前真正推流的画面就只有这么90°,这是演员的安全活动区,出了这里就会生硬地丢失画面。

【6月17日首播时画质比较高,几乎察觉不到画质过渡,但后面的重播降画质后就比较明显】

 

不过这反而不是技术的问题,而是对目前「人均网络带宽」的暂时性妥协。

【我在内网用NAS播放100M码率H.265的视频,在解码上也没有什么压力】

我倒是希望Pico能推个100M的「原画」直播画质,但其实还有很多人没有这种宽带和路由器环境。

 

当然在A-SOUL的这个直播间里,你还可以在官方划定的安全区域内,进行小范围的移动。

你可以走过去,也可以往前推手柄上的摇杆,进行快速的移动坐标。

 

但是Pico云端推送的原始2D视频流里,本身是不包含视角上的空间平移信息的。

它只携带「俯仰轴」和「航向轴」上的视角转动信息。

因此这个空间移动是Neo 3在本地用纯算法模拟出来的,对我来说它的可用性很差。

 

如果你只是沿着初始视角的中心轴线前后移动,然后只关注演员不关注场景,那就没有什么问题,你能感觉到演员与你距离的远近改变。

但是如果你进行左右移动,或者开始关注场景,就会发现画面有非常不自然的透视畸变。

 

因为我们真正拥有的视角自由度,就只有在以初始位置为原点的「航向轴」和「俯仰轴」上的各转动360°。

原始2D视频流并不包含空间平移的信息,它是Neo 3在本地用算法后算出来的。

 

如果想要原视频流就携带「安全区」空间平移的信息,则需要使用「相机阵列」去捕获更多数据。

 

BBC的研发团队就实验过类似的拍摄系统。

假设这个圆是我们可以移动的安全区,那么你可以在安全区外围布置一圈摄像头,所有摄像头同步捕获记录画面。

后期我们可以用冗余的数据,更好地模拟解算出安全区内的所有水平视角,于是你就可以得到一个可用的安全区内的平移自由度,而不会让画面出现违和感。

 

很多研究计算摄影的实验室都有分享过类似的东西,例如谷歌和曾经的Lytro,它们的自由度可以做得更好。

一般人们会把这类「相机阵列」称为「光场采集系统」,目前的主要商用场景是三维建模。

为什么好莱坞电影的特效能做得非常好,原因之一就是有像Light Stage这样的三维建模公司。

 

那么代价是什么呢?这些密密麻麻的摄像头就是代价,并且目前它们的性能大多数时候只能用来拍摄静态场景。

虽然我觉得VR上的虚拟直播的话,肯定会有更高效的解决方案,但反正目前是不可能有这种直播模式的,Pico和A-SOUL也没有这个能力。

 

 

但是Pico这个鸡肋的本地自由度还是有好处的,能带来一些有趣的玩法。

例如6月17号那天我整了一个活,它就依赖于这样的一个不那么自由的自由度。【最高城】

 

如果没有了这个本地软解模拟的自由度,那么你就会觉得自己是一个全身瘫痪,只有脖子能动的哑巴轮椅人。

这也是我们在看其他的VR全景视频时,共同会面对的体验上的问题。

 

有的朋友也卡bug走出了整个球幕画面,我在他的视频下看到很多评论在冷嘲热讽,认为这场直播只是在播放一些没有技术含量的2D贴图。

 

这种说法其实比较片面,因为你不可能在手机或者电脑屏幕上感知到基于「双目视差」的「深度信息」,于是一帧画面无论怎么看它就是一张2D贴图,没有「空间感」。

 

你也无法感受到那种脖子一转动,画面跟着变化的那种「视角自由度」,因此你也无法体会到其中的「互动感」。

这种「空间感」和「互动感」就是VR设备「沉浸感」的来源,是我们在购买VR设备所支付的核心产品。

 

这就有点像前段时间618的时候,我看到了好多「人体工学椅」的测评。

我们可以从测评中了解椅子的做工、用料、设计思路。

我们也可以听测评人描述坐垫的弹性,面料的手感,腰部的支撑力度。

但是你唯独无法知道自己坐上去之后屁股是什么感觉。

 

因为屁股的坐感是一组生物神经信号,它很难用语言和画面进行编码,用一两个词语去形容这一组生物神经信号,信息量是严重失真的。

那最好就是有个线下的人体工学椅的体验店,你一屁股坐下去就感受到了,屁股会给你最真实的触觉反馈信息,语言和图像没有办法完整地传递这种信息。

 

VR设备也是这样的,你最好可以找个线下体验店去体验一下,感受它通过「深度信息」和「视角自由度」带给你的「空间感」和「互动感」,由此塑造出的独特的「沉浸感」。

用手机看VR设备的录屏,其实获取不到这些额外的信息。

 

 

【2-2-2】自由度的代价

以上还是从技术的角度来讨论,然后我们再关注一下A-SOUL的节目本身。

目前官方的说法是Pico和A-SOUL每月至少会有一场「夜谈」直播,未来还会筹备独家的定制舞台。

 

那A-SOUL平时的节目形式还是非常多样的,有歌曲、舞蹈、小剧场、游戏室、夜谈等日常安排,以及像「生日会」和「周年纪念」这样的大活。

其中「夜谈」属于强度比较低的节目,像6月的那场夜谈,除了开头和结尾的两段歌舞,中间2个小时都是4个人坐在那里聊天,尬聊。

7月的贝拉VR单播则是和观众聊天,并多了几个为Pico用户设计的小互动。

 

这样的节目形式在B站等传统2D视频平台进行直播的话,还是比较容易的。

但是换成VR设备的360°全景直播的话,会有一些新的挑战。

 

我们前面分析了,你用VR看A-SOUL的夜谈直播时,会有一组2轴位的「视角自由度」。

你的视角可以在「航向轴」和「俯仰轴」的两个轴位上进行自由转动。

这样的「视角自由度」提供了临场的「互动感」,让你摆脱了节目导播的运镜约束,可以自由选择视角,想看哪就看哪。

 

而GoneMeme曾经在【社会学】系列的【I1】期里提到过,「自由」是一种在多人互动社会下的概念。

一个人的「自由」从来都不是单独存在的,它一定是与其他人产生联系的。

群体A的「自由」,是建立在群体B的「不自由」上的。

 

因此使用Pico的观众,相对于A-SOUL多了一些视角自由,那么A-SOUL其实相对于观众也就少了一些自由。

正常情况下,A-SOUL的直播节目是会切换镜头的,什么时候给全景,什么时候给特写,要将镜头切给谁,这些都由现场的导播员决定。

当然他们在A-SOUL的语境里会被统称为「工具人」。

 

那导播员的实际工作其实就是,对整个直播现场的信息进行筛选过滤,然后分发给看直播的观众。

观众需要被动地接受这样的一种单方面的信息筛选,而这其实是可以缓解整个直播流程中的工作压力的。

 

例如当镜头切给其中某个演员做特写的时候,那么其他演员看到自己不在推流的预览画面里,就可以稍微放松一下。

或者当镜头在演员的上半身时,那么她的下半身就可以放松一下,有一些无意识的小动作也不用太在意。

 

但是Pico的360°全景直播里,它没有这样的信息筛选机制。

这场直播它用了一个360°的全景视角,一次性把所有的现场信息都给到观众,让你自己决定关注的焦点。

 

因此演员在直播节目的所有时间下的所有肢体动作,都是暴露在观众的视线之中的。

并不存在说,现在特写镜头给了嘉然,那么向晚就可以放松一下的情况。

 

在B站,当直播画面切到四人聊天的中景时,我们就只能看到她们的上半身。

但此时Pico里的视角仍然是360°全景,我们可以看到贝拉的脚部有一些小动作,一直在蹭乃琳的脚。【58:00】【22.18.07】

当然就这一点来说,我当时看得很开心,有一种丰收的喜悦。【脸红】

 

但是这样的一种视角在给了观众自由度的同时,也对演员的能力提出了更高的要求。

虽然演员仍然与观众隔着一层虚拟形象,但是你所有时间下的所有举动,都被暴露在观众的视线之中,演员需要更加注意自己的一举一动。

因为这是一场实时的直播,没有后期剪辑做最后的把关。

 

不仅对演员来说压力更大了,对于技术团队也是如此。

尤其是目前虚拟直播要用到的「动作捕捉」技术,还是很容易出现问题的。

7月贝拉VR单播的时候,那首仓木麻衣的《Time after time》唱了两遍,其实是因为贝拉左脚的动捕出问题,调整了一下。

B站上看不到这一点,但在Pico里就看的很清楚。

 

在A-SOUL平时的节目里,如果动作捕捉设备出问题,导播可以快速切换镜头,从而避开出问题的视角。

在推流的视野之外,画面崩成什么样子都无所谓。

反正观众看不到,你可以慢慢调整,然后再回到推流的视野中。

 

但是360°全景直播不行,平时的那种人物离开主镜头视野,快速调整设备的做法就不太可行。

当然我觉得理论上是可以通过设置一个隐藏的空气墙,来实现走入安全区就自动隐身的效果。

 

但如果真做了这个功能,那采用360°全景模式就会失去很多乐趣和意义,因此我也觉得有点矛盾。

就目前来说,Pico和A-SOUL的技术团队没有去做类似的功能,但不做的话会更有直播的真实感。

 

像6月的VR直播里,向晚要出去喝水,就要用特效直接隐藏掉,她不能像往常一样走出画面。

因为VR直播间里的这个虚拟的360°相机,它没有背面和盲区。

 

因此现阶段的VR直播对于A-SOUL团队来说,就变得跟「现场演出」一样具有挑战性,观众像是去到了现场参加一场实时演出的综艺节目。

 

虽然观众获得了身临其境的参与感,但代价就是演员和技术团队需要面对更大的压力和挑战。

整场「虚拟直播」的容错率变得更小了。

 

因此我觉得现阶段的「夜谈」算是一种非常好的技术测试方式,虽然比较保守和谨慎,但可以先熟悉和跑通整个流程,观察会遇到什么问题。

同时也要让四个姑娘学习和掌握一些新的节目演出技巧,因为直播逻辑发生了一些变化。

 

当然这对于路人来说就不太友好。

6月17日的A-SOUL首播,Pico就弄了一个打卡20分钟送金币的活动,因此有很多纯路人进来直播间打卡。

很多人觉得受不了这种纯聊天的节目形式,一些暴躁的小伙子直接开喷。

7月的贝拉VR单播的观影体验就好了很多,直播间里基本上都是粉丝,弹幕互动的节奏比较友好。

 

那我的看法是,别急,小场面。

 

 

 

【2-2-3】占用所有时间

不过即使从一个粉丝的角度来看,观看A-SOUL的VR直播仍然也是有很多问题的。

虽然Pico Neo 3的佩戴舒适度还不错,但戴着这样一个620g重的东西仍然是一种负担。

而这和A-SOUL一直倡导的「轻松快乐地看直播」的理念有所冲突。

 

我很喜欢看A-SOUL的直播节目,很享受那种随机性带来的惊喜感,包括节目内容的随机性与弹幕互动的随机性。

但我又并不经常看A-SOUL的直播,因为工作很忙,每天的活都干不完,因此大多数时候是在碎片化的空闲时间里刷切片和二创。

 

如果A-SOUL有重要的节目,例如「生日会」这种大活,那我会提前安排好一整段的时间,晚上什么都不做,专心享受整个节目。

这其实就有点像是在追一些长篇连载动画的时候,主线剧情必看,日常剧情则偶尔刷刷。

 

因此平时会不会点开直播,取决于我手头上的工作重不重要,如果是很重要的事情那我只能先专心干活。

如果是可以摸鱼的事情,那我会开着A-SOUL的直播窗口一边摸鱼。

 

边做手上的事情边看节目,遇到精彩的片段就停下来细品,觉得有点无聊了就继续干活,这就是我平日里最享受的「轻松快乐地看直播」的状态。

这就很像我小时候,搬了个小凳子坐在电视前,边看动画片边写作业的感觉。

 

但这种状态在VR设备上是不可能实现的,它会占用你所有的时间。

先不说戴着一个这么重的设备在头上,那种物理感受所带来的负担,你甚至不能边看直播边回手机上的微信消息。

你需要把VR设备取下来,才能去做别的事情,这个操作会造成非常严重的割裂感。

 

当然Pico在「设置 – 实验室」选项里,有一个「快速透视模式」。

开启后,双击右侧的感应区域,可以让戴着设备的你短暂地回到现实世界。

但是你仍然没有办法回微信,喝水的话得用吸管,不过拿个纸巾擦擦口水还是可以的。

 

因此我平时最习惯和享受的那种边摸鱼边看直播的状态,VR设备是没有办法给到我的。它会占用你观看节目时的所有时间,而这同样也是VR追求沉浸感所带来的代价。

 

那么A-SOUL在Pico上的节目,它的制作最好要足够用心,要值得我特意留出一整段完整的时间去享受它。

 

但就目前的这两场「VR夜谈」节目质量而言,它还是一个比较偏向 「粉丝向」 的节目。

虽然7月的贝拉单播,显然有几个小互动是为VR直播设计的,但整体的节目走向还是需要照顾B站直播的基本盘。

 

如果一个月偶尔有一两场换换心情确实还行,但日常的话我会更倾向于选择在B站看直播,这样我可以有一个更可控更轻松的观看体验。

 

这也是我不玩VR游戏的原因。

观看A-SOUL的这种3D全景视频,我可以看完整场2个小时,但是玩VR游戏不行。

Pico到手后,我自己玩了一下Steam VR上的《VR Chat》和《Half-Life: Alyx》。

 

VR游戏确实很独特,和普通游戏的体验很不一样。

但是它玩起来很累,20分钟差不多就是我的极限了,时间再长会有生理上的不适。

而这就会和我日常玩游戏所追求的感受有冲突。

 

我平时也玩游戏,玩《守望先锋》,并且只玩「街机先锋」里的「未知英雄」,也就是随机大乱斗。

这个模式的好处就是快节奏,一局大概10分钟,并且胜负基本上靠阵容的随机抽奖,因此我心态可以放得很好,不用那么在乎输赢。

一般是工作累了就玩个半小时,来两局放松一下。

 

这种形式的游戏体验,对我来说就是一种放松,在放松过后我可以继续手头上的工作。

但VR游戏可不是放松,越玩越累。

玩半个小时,还需要再花1个小时去休息恢复精力,这就完全不符合我的需求场景。

 

这倒不是这台Pico的问题,而是整个VR行业都还不成熟的问题。

同时这也是我这个年龄段所遇到的问题,购买Pico设备对我来说还构不成经济压力,但VR「占用所有的时间」的使用成本对我来说会构成压力。

 

人生有很多这样的遗憾。

学生时代,你有很多时间,但是你买不起。

工作之后,你买得起了,但是你没有时间。

等到你老了退休后,你有了钱也有了时间,但是你没有年轻时的体力和热情了。

 

 

【2-3】玩VR游戏

A-SOUL在Pico上的VR直播,虽然给我们带来了B站直播所没有的「空间感」和「互动感」。

但它本质上推的是一个「视频流」,那么它就仍然有着目前几乎所有3D视频的共同问题。

 

前面强调过,在3D的全景视频里,我们能够获得一组2个轴位的「视角自由度」,分别是「航向轴」和「俯仰轴」。

但「三维空间」里是有3个旋转轴的,剩下的那个「横滚轴」呢?

答案是,我们没有「横滚轴」上的自由度。

 

你只要稍微地歪一下头,让双眼离开基准水平面,就会发现3D画面丢失了「深度信息」。

 

像A-SOUL在6月份的这场VR首播,因为四人离摄像头比较远,所以歪头时你只是会觉得丢失3D感,有点奇怪。

而7月的贝拉VR单播,如果贝拉是坐在比较远的沙发上,那歪头的违和感也比较小。

但当贝拉靠近摄像头时,如果你的双眼偏离了水平基准,就会明显感受到画面出现3D错位,我猜有些朋友反映的「贝拉靠近时会掉帧」的真正原因其实可能是这个。

 

不只是人物,场景的画面也是这样的。

远处的墙壁几乎不会受到歪头杀的影响,但是看正下方的地板上的花纹,你会发现只要稍微有点偏,双眼画面就会出现错位。

 

我自己的感觉是,在Pico的这个光学规格下。

如果是稍远一点的画面,歪头后违和感并不明显,甚至察觉不到问题。

但是如果是2米以内的近距离物体,歪头时画面就容易出现违和的3D错位,离得越近的物体,3D错位感就越明显。

 

在所有的3D视频里,无论是180°的还是360°的,还是3D电影,都会遇到这个问题。

因为云端服务器所推流的原始2D视频里,并不携带在垂直方向上的「深度信息」。

它只有「平行视差」,没有「垂直视差」。

 

我们的双眼虽然大多数情况下都是处于同一水平位置上的,但又并不是永远都处于同一水平位置。

而3D视频的前期拍摄里,两个摄像头是模拟人眼水平放置的,因此它们只记录了水平方向上的「双目视差」。

 

而要记录垂直方向上的「双目视差」,那就需要有垂直放置的两个摄像头。

也就是一个完整的3D视频的前期拍摄,需要用4个摄像头组成「相机阵列」,去共同拍摄一组画面。(也许3个也行?)

这样,我们后期在观看的时候还要进行实时的图像融合,才能解算垂直方向上的「深度信息」,以得到「横滚轴」上的视角自由度。

 

很多人觉得看3D全景视频有说不出来的别扭,感觉不真实。

它的原因有很多,其中就有一部分在垂直方向上缺失「深度信息」的原因。

我可以找出很多观看VR视频时的体验上的小问题,其中大部分可以通过规范化前期的VR摄影流程,以及后期的播放参数来进行优化。

 

但是3D视频因为在垂直方向缺失「深度信息」导致的「歪头杀」,目前似乎还是一个无解的硬伤。

只要你稍微歪一下头,画面就会出现错位,让你感觉到严重的违和,非常影响沉浸感。

而短时间内还没有办法解决这个问题,前期拍摄设备不存在,后期融合算法不成熟,硬件算力也不够。

 

哪怕用4个摄像头阵列进行前期拍摄,后期再做图像融合的方式,其实仍然只能拍摄180°视频。

如果要拍3D的360°视频,那你可能需要一个在球体上面均匀铺满摄像头。

诺基亚曾经出过一款类似的VR相机,诺基亚OZO,售价39万,Facebook也发布过类似的Surround 360相机,不过这些项目最后都没有下文了。

 

我们前面介绍过,这类「相机阵列」也被叫做「光场采集系统」,已经完全超出传统摄影领域了。

目前基本上只存在实验室里,或者不差钱的好莱坞特效里,大众摄影里不会有人这么去做。

 

不过,我在看汪峰的那个VR演唱会时,就发现它的直播设备,看上去就有点像是一个4摄像头的「相机阵列」。

说实话,我还是非常好奇Pico的VR摄影采用的是什么方案。

 

在之前的郑钧演唱会上的VR直播设备,看上去就是普通的两个左右放置的摄像头。(也可能是左右两组双摄像头)

不过汪峰的这一场虽然看上去用了4摄像头的「相机阵列」,但应该也是没有去做针对「垂直视差」的图像融合,只是说因为摄像头离人物比较远,「歪头杀」时的3D错位感并不明显而已。(可能只是单纯的双机推流冗余)

 

当然以上这些是当你想要在VR里还原现实世界时才会遇到的问题。

而其实我们也完全可以绕过这个问题,直接在本地创建一个虚拟世界。

 

我们可以把所有的模型和贴图都存在本地,服务器只交换坐标数据。

VR设备根据坐标数据,在本地渲染出场景和物体,然后再用两个本地的虚拟摄像头来捕获本地的图像,以获得带有「深度信息」的最终显示画面。

那么此时,它就已经脱离「视频」直播的范畴,它本质上是一款「游戏」。

 

像A-SOUL的这两场VR直播,其实都会存在「歪头杀」问题,虽然大部分人不会像我这样去测试。

不过此时我们打开手柄,就会发现手柄UI和里面功能,包括观众「一个魂」形象的3D感都是正常的。

因为手柄UI和你自己的形象,都是在本地渲染的,它们有任意方向上完整的「深度信息」。

你可以打开UI里的功能,然后歪头试试。

 

像汪峰的那场VR演唱会,只有舞台中间实景拍摄的那部分画面会丢失3D感,其他的画面都不会受到「歪头杀」的影响。

那么也就是说,这些外围的场景都是在本地渲染的,拥有完整的「深度信息」。

包括我们在Pico大厅里的系统界面也都是如此,所以你可以放心地歪头。

 

事实上,电脑和手机上几乎所有的3D游戏都是采用「本地渲染」,只不过它们最终输出的画面不具有基于「双目视差」的「深度信息」。

例如那些常见的第一人称射击游戏FPS,它们在视角上都具有6个自由度(3个旋转轴+3个平移轴),你在游戏世界里可以自由行动。

 

因此「VR游戏」和「非VR游戏」的差异其实是很小的,主要是在交互的逻辑上。

大部分「非VR游戏」都可以比较容易地修改出一个VR模式,在3D引擎里再增加一个平行的摄像头视角,然后通过VR眼镜让两个画面分开显示,我们就能获得「双目视差」。

 

这样的「双目视差」是用两个本地的虚拟摄像头实时捕获的,因此它包含任意轴位上的「深度信息」。

所以我们可以用「歪头」这种方式来鉴别自己是在「看VR视频」还是「玩VR游戏」。

看「Pico视频」里的VR视频时,一歪头3D图像就会丢失「深度信息」。

而玩「Pico Home」这款游戏时,我们就可以放心地卖萌。

 

当然我们也可以用它来分辨播放的全景视频是「双目3D」的还是「单目2D」的。

单目2D的全景视频,歪头也不会对画面造成影响。

 

 

【2-3-1】动画而非游戏

 

讲到这里,我知道有些粉丝对于A-SOUL的VR直播的期待是什么样的。

他们想要有一个6自由度的交互方式。

 

如果我们玩《VR Chat》的话,其实经常可以看到很多人会用嘉然的3D模型。

也有粉丝建了A-SOUL主题的小房间,我有去逛过。

玩《VR Chat》其实是不需要VR设备的,在Steam下载PC客户端,在电脑上用鼠标键盘就能玩。

 

当然如果有关注VR领域这一块的,可能会了解到一个日本的APP《You Generation》。

6月17日首播之后,我看到很多人拿它来嘲讽Pico和A-SOUL的技术不行。

 

那这样的理解其实也没有什么问题,只是在我看来,这里面更多的不是一个关于技术的问题,而是涉及到A-SOUL的「商业模式」和「自身定位」的问题。

首先要问一个问题,A-SOUL的赛道到底是什么?

 

我的观点是,A-SOUL本质上是一个「视频团队」,具体来说是「动画团队」。

更具体的细分则是,主职做「直播动画」,兼职做「短视频动画」,盈利方式是直播流水和合作广告。

因此A-SOUL的基本盘是在B站看视频的人,视频才是它的赛道。

 

如果A-SOUL想要跨界VR,那么其最优路径也应该是做「VR视频」,而不是「VR游戏」。

虽然它们都用到了3D引擎,但其实两者的技能点和科技树是完全不同的,这是两个截然不同的领域。

 

我在《A-SOUL一周年》的专栏文章里有提到过,我自己亲身经历过2014年开始爆发的那波VR浪潮。

在那几年里,我目睹了很多VR硬件团队和VR游戏团队拿到天量的投资,发布了雄心勃勃的开发计划,然后光速地把钱烧完,整个项目在短时间内死掉。

整个VR行业堪称「资本绞肉机」。

 

但那场资本泡沫也培养了一批为VR做外围配套的3D建模工作室和动作捕捉工作室,最终孵化了「虚拟直播」这种主流边缘的商业模式。

如今8年过去了,「VR游戏」这个领域仍然九死一生,能拿出来说的也就那么几个。

而基于「动作捕捉」的3D动画行业则迎来了发展。

 

因此你会发现,去年这波「元宇宙」概念炒起来之后,国内那些资本Old Money对此并没有什么兴趣,也只有「字节」这种New Money还敢冲一波,Pico都已经成独苗了。

我上一次听到要All in VR的还是HTC,这次Meta(Facebook)也说要all in VR,现在看来它的钱也不够烧,特别是现在全球资本已经开始要进入紧缩周期了。

 

但说实话我还是比较看好「字节」和「Pico」的,因为它把业务重心放在做「VR视频」上,而「抖音」原本就有做视频的基因,这属于「字节」对核心业务的扩展,并没有商业上的冒进。

 

而虽然都同属于字节旗下,但这一次Pico和A-SOUL的合作,它们的利益点是不同的。

Pico是一家VR设备商,它可以靠卖VR硬件获利,但也需要负责构建自家的内容与生态。

因此这个合作里,其实是Pico更需要A-SOUL,而不是A-SOUL需要Pico。

 

当然更准确来说,Pico这样的VR硬件商,当下非常缺乏优质的VR内容,而字节为它倾注了很多资源,直接从抖音那边导流量进Pico。

像「Pico视频」里就有浙江卫视和抖音合作的《为歌而赞》的独家VR内容,能在这种VIP位置看容祖儿的舞台唱跳演出,那我只能说方向对了,多搞一点。

 

Pico上一次的VR演唱会邀请的是汪峰,算是很有分量的了,也只有抖音出面才能请得起。

这么一想,A-SOUL其实和汪峰站在同样的舞台上。

而汪峰在鸟巢办过演唱会,那么四舍五入A-SOUL也算……

 

说实话,对于VR的布局,这些是作为国内巨头的字节,在大战略上需要去考虑的。

但VR并不是A-SOUL的核心业务,只是说毕竟是自家总部给的任务,需要认真对待。

 

换句话说,对于A-SOUL团队而言,与Pico的合作项目并不是to C的,而是to VC的。

A-SOUL团队需要向投资人和母公司证明自己的IP价值或者技术价值。

这跟它之前为什么想做「力反馈手套」的逻辑是一样的,因此遇到的问题也差不多。

 

如果抛开这一层考虑,其实A-SOUL并没有必要和Pico进行这样的合作。

A-SOUL是个动画公司,很多人直觉地认为A-SOUL很契合他们想象中的VR世界,但实际上并不是。

VR的用户基数实在是太小了,而Pico的用户基数就更小了。

A-SOUL应该去更大的舞台演出,不应该自己把路走窄了,B站的舞台显然要比Pico大很多。

 

而如果要拿日本的《You Generation》来和A-SOUL的VR视频直播作对比,那我们应该去分析它门各自的商业模式。

国内其实有一款和《You Generation》商业模式更接近的VR端APP,叫《Go Now》,有兴趣的可以去了解一下。

 

《You Generation》其实是一个手游,它有一个手机版的普通APP,你可以在上面玩小游戏和看演出,使用它是不需要VR眼镜的。

在手机APP上你就已经可以体验到6个自由度了(3个旋转轴+3个平移轴),

 

而它在Quest的应用商城上则有一个专供VR版的APP。

用VR版的可以再得到一组额外的基于「双目视差」的「深度信息」。

 

这就有点像《VR Chat》,你没有VR眼镜也可以用电脑玩,但是就看不到3D效果。

「6自由度」从来都不是VR的专属,「深度信息」才是VR的专属。

 

可是手机的算力是非常不够看的,因此《You Generation》的场景和人物基本上都是一些没有什么光影和特效的低模多边形。【YT官方】

 

那么《You Generation》为什么不做成一个PC客户端呢?

就像《原神》那样出一个PC平台的客户端,既然手机玩不了高画质,那我用电脑玩不就行了吗?

只有核显的朋友就降一降画质,有3090 Ti的朋友就画质拉满,有VR眼镜的朋友也可以走PC串流,那么弄都比手机的画质体验要好吧。

 

答案是不行。

因为《You Generation》的商业模式,就是用一个低成本的软件投入,去赚取核心粉丝的付费打赏。

它本质上就是一款粗糙的氪金手游,任何画质上的提升,都需要付出相当大的游戏开发和运营成本,从而导致商业上的亏损。

因此它只能维持一个低劣的画质水平,然后向核心付费粉丝提供一个6自由度的视角和互动,以换取氪金。

 

而这种模式其实也是日本的「地下偶像」走的「低成本小剧场」模式的线上版。

当年的AKB48也是以这种模式起家的,但它也给AKB48留下了早期「粗制滥造」的污点。

 

所以《You Generation》的这种商业模式,其实比较适合新人VUP做突围,或者走下坡路的老VUP做粉丝收割。

但是以A-SOUL的这个体量,是完全没有必要自降身价,甚至跨界去做类似的事情的。

只是说毕竟是母公司安排的任务,需要处理一下。

 

我们思考一下,先不考虑Pico,摆在A-SOUL面前的有两条技术路径:

【1】做3D全景视频,云端高模渲染,最终给到一个「高画质-低自由度」的效果。

【2】做VR手游,本地低模渲染,得到一个「低画质-高自由度」的效果。

 

也就是在现有的商业模式和算力约束下,「高画质」和「高自由度」其实只能二选一。

那么我的看法是保留「高画质」,这是A-SOUL的主业以及核心竞争力。

 

我也了解粉丝的心理,粉丝总会想要和偶像有更多的互动。

但是现在Pico这个舞台太小了,我认为不应该浪费太多时间在这里。

 

A-SOUL所售卖的,不应该是满足粉丝窥视欲的「自由度」,而是优秀的视听演出效果。

因为它本质上是一个「动画公司」,而不是一个「游戏公司」,更不是一个日式偶像女团。

 

观众平时很喜欢说A-SOUL的技术团队不行,以刺激团队提升技术。

如果跟传统的3D动捕公司相比,那确实A-SOUL就是一个草台班子。

从动捕房的差距就可以看出这一点。

 

但是在B站「虚拟直播」这一块里,A-SOUL确实就是天花板。

不要真的觉得A-SOUL的技术和画质水平不行。

B站上现在有非常多在做3D虚拟直播的VUP了,大家可以对比一下。

 

当然你可以举一些高技术力、高画质的企划来反驳我。

但是A-SOUL团队的核心竞争力之一,就在于日复一日、可持续性地输出高品质内容。

因此它才能够替代我平日里看番、追剧、看电影的需求。

 

而这需要A-SOUL团队里有高段位的成本控制大师,因为3D动画的所有画质提升,都是需要花钱的。

整一个大活,把钱烧光,然后光速毕业,很多企划其实都是这样死掉的。

因此我不乐于看到A-SOUL团队做太多冒进的尝试,活下去永远是第一位的,要把心思放在主业上。

 

我每天点开B站的动态,最惊喜的事情就是发现A-SOUL更新了大制作高渲染的长视频。

那种感觉就像自己平时追的番出了剧场版一样。

这会让我觉得这个团队有在持续创作出高质量的、优秀的作品。

我很期待有一天能够看到A-SOUL出制作精良的动画电影,这是我对一家动画公司最好的褒奖。

 

因此对于A-SOUL和Pico的合作,我并不愿意看到A-SOUL去做那些低质量但高自由度的,满足粉丝窥视欲,以换取打赏的低成本氪金手游。

但我也不是反对「自由度」,只是在现有的「人均算力不足」的情况下,为了给到这么小部分VR用户的视角自由度,是要牺牲A-SOUL作为核心竞争力和口碑的画面质量的。

 

并且从逻辑上来说,与其用手机那么一点算力,去做一个抠抠搜搜的低成本手游,还不如先做PC客户端。

要是A-SOUL出一个类似《原神》画质的PC客户端,6个自由度(3个旋转轴+3个平移轴),有没有VR版的「深度信息」都无所谓,分辨率720p就行,大家可以用这个 PC客户端来看可互动的直播演出,或者去枝江一日游。

它只要出了我立马先充一个648。

 

但其实它做不出来,首先A-SOUL是一个动画技术团队,而不是一个游戏技术团队,虽然它们都用到了3D引擎,但技能点和科技树是完全不同的。

做「3D动画」和做「3D游戏」的,在职业上是完全不同的两拨人。

 

而Pico也只是一个VR硬件设备商,它也不是做游戏的。

其次,就算这款游戏做出来了也收不回成本,人家《原神》玩家的基数是真的大,并且是真的会在游戏里氪金充钱。

 

因此做高品质的3D全景视频,反而是当下最适合A-SOUL的技术路径,也是最有尊严的一条路径。

这其实也是A-SOUL到这个体量,除了「商业模式」还需要面对「自我定位」的问题。

这一部分我们留到最后的第4节,聊对A-SOUL的看法与展望,以及谈论「偶像」话题时再详细展开。

 

归根结底,这也是整个VR行业面临的「人均算力不足」的问题。

我很希望有一天算力足够便宜足够普及,然后我们可以在60PPD的VR世界里,创造出「高画质」「高自由度」的10万人演唱会的现场。

但目前来说,这样的梦想还是太奢侈了。

 

 

 

【3】VR困境与人均算力的匮乏

大概从2014年开始,每年我都能听到人们在说VR将颠覆世界。

但是实际情况是,虽然它没有停滞不前,但也总是不尽如人意。

 

近些年VR领域里,有能让我感到眼前一亮的产品不多。

一个是Quest,它用4个光学摄像头的方案,就做出了超高性价比的定位追踪,把这类入门级VR一体机的价格做得非常便宜,而这一方案也是现在的Pico所模仿的。

Quest拓宽了消费级VR的边界。

 

另一个就是Varjo利用眼动追踪和注视点投影的方法,把PPD做到了70,实现了VR的视网膜显示。

它扩宽了企业级VR的边界。

 

 

【3-1】所谓光场显示

当然,正当我准备文稿的时候,B站突然给我推了一个视频,讲的是一家叫CREAL的瑞士团队的工程机体验,据说用上了「光场显示」,播放量非常高。

 

那天晚上其实我本来已经很困了,点进去之后,一瞬间垂死病中惊坐起。

啊?VR技术出现大突破了?已经能做到单眼的「聚焦模糊」了?VAC问题被解决了?

 

我马上把CREAL在Youtube上的几个视频看了一遍,并且也把青亭网和映维网有关CREAL的报导和访谈都看了一遍。

 

那最后我是非常失望的,CREAL做了很多视频特效,但对最关键的「如何编码深度信息从而实现多个焦平面」这一点避而不谈。

别问,问就是「光场显示」。

 

其实看了这么多年的VR新闻,我早已经不再相信奇迹了,特别是会警惕那些打着「光场」概念的团队。

所谓的「光场显示」其实是一句废话,因为所有的显示技术都可以叫做「光场显示」。

 

那容许我稍微跑题,解释一下「光场」概念。

我们可以用7个变量来完备地描述空间中的一束光线的所有信息。

得到这样的一个函数:P(x, y, z, θ, Φ, λ, t)。

 

其中前三个变量(x, y, z)描述光线的空间坐标位置。

而 (θ, Φ) 表示水平夹角和垂直夹角,它们描述了光线的角度。

变量  (λ)  是指光的波长,它描述了光线的颜色和亮度。

最后是时间(t),它描述了光随时间的变化情况。

 

因为依靠这7个变量,就可以完备地描述一束光的所有信息,所以这个函数叫「全光函数」。

而「光场」其实就是某个空间里的所有「全光函数」的集合。

 

因此完整的「光场采集」就是获取某个空间里,所有光线的这7个变量的信息。

而反过来的「光场显示」,就是在空间重建带有这7个变量信息的所有光线。

 

我们在科幻电影里经常能看到神奇的「全息影像」。

这里的「全息」指的就是「全部的信息」,也就是在空间重建带有7个变量信息的所有光线。

 

但事实上人类目前的技术还做不到这一点。

我们只能重建光线7个变量中的部分变量的信息。

也就是我们目前所有的显示技术都是不完备的「光场显示」。

 

像我们最常见的手机或者电脑屏幕,它只能显示7个变量中的4个,R(x, y, λ, t)

其中 (x, y) 是屏幕像素点的坐标,(λ) 是颜色,(t) 是时间。

 

因此这种2D平面的手机屏幕,它就可以算是4维的「光场显示」。

手机屏幕是没有3D立体效果的,没有那个 (z) 变量的信息,也就是没有「深度信息」。

 

而VR眼镜就是利用「双目视差」,用2幅画面的像素点编码一个深度信息 (z),我们的大脑能通过双眼来解算出这个深度信息 (z)。

 

而CREAL在所有的技术讲解里,只字不提如何重建深度信息 (z)。

它的视频和PPT所展示的那些原理,讲的都是如何重建角度信息 (θ, Φ)。

 

换句话说,CREAL是在构建「多个视点」而不是「多个焦平面」。

用它的方法你能得到一幅图像的「多个角度」而不是「多个深度」。

这种情况下,单眼是完全无法得到基于「聚焦模糊」的「深度信息」的。

 

甚至按照它的示意图, 你的眼睛看不到一幅正常的图像,因为它的示意图是「光场采集」而不是「光场显示」。

它所说的原理跟它宣称能解决的问题完全对不上。

 

那我自己的判断就是,CREAL大概率是吹牛和作假了,它只不过是在赌普通人理解不了「光场」理论而已。

它用一个「采集多个视点」的理论,去解释如何「显示多个焦平面」,牛头不对马嘴。

 

而在实际的工程机演示里,我猜它应该是用「注视点渲染」去伪装成「聚焦模糊」的效果。

如果你不了解光学原理,那么要欺骗你的眼睛会有很多种方法。

 

我们也可以换个更容易理解的商业视角去看CREAL这个事情。

上一家大打「光场」概念牌的创业公司叫Magic Leap,做AR眼镜的。

 

Magic Leap于2011年成立,一路融资了26亿美元,估值一度超过100亿美元。

但实际上它们一路都在吹牛和作假,做各种炫酷的视频特效去忽悠投资人。

你可能看过这么一张动图,这就是Magic Leap做的,号称用了7维的光场显示,但其实就是一个视频特效。

 

最后2020年5月创始人宣布辞职,公司开始大规模裁员、专利出售和技术路线转型。

前面画的那些大饼一个都没有实现,从此Magic Leap避而不谈「光场」,老老实实去做它曾经看不起的「光波导」。

 

如果CREAL真的实现了单眼的「聚焦模糊」,那它至少能先拿15亿美元融资去改变世界,而不是像现在这样对外宣称拿了1500万美元的投资,然后转身去做一个视力检测仪。

 

当然也有可能是我井底之蛙不识泰山,我也经常会犯错。

如果后续它真的有什么颠覆世界的黑科技,我会专门出一个视频来道歉谢罪,并给大家解析一下这样的技术的颠覆性在哪里。

 

但按照我这么多年看VR/AR新闻的经验,估计CREAL这个事情最后会不了了之,因为它已经拿到融资去做视力检测仪了。

 

 

这一路走来,在看了很多技术团队的起起落落之后,我总有一种既视感。

 

《三体》中,罗辑在冬眠之后醒来,以为人类科技出现了突破,发明了永动机。

但后面才发现根本没有本质上的突破,人类应用的仍然是冬眠前的技术,只不过随着可控核聚变的成熟和无线充电的广泛应用,那些天上飞着的机器看上去像是装了永动机,拥有无穷无尽的能源。

事实上,人类的科学仍然被智子锁死,没有越过三体人划定的那条线。

 

当然这是科幻小说里的故事,现实世界的科技奇迹也是靠着一点一滴的量变,最终积累起质变。

 

但因此我不会对现阶段的VR行业抱有什么不切实际的想法。

有关VR/AR的基础理论并没有什么突破性的进展,现有的大部分说辞和叙事,跟我在2014年看到的那些没有本质区别。

 

基础理论,材料学,精密控制,计算机图形算法,机器算力,这些全部都需要提升,人类还有很漫长的一段路要走。

 

 

【3-2】人均算力的匮乏

 

现阶段VR技术有着各种各样的问题,其中有一个我认为是根本性问题。

我称之为「人均算力不足」。

 

「人均算力」是参照「人均GDP」「人均用电量」「人均水资源」等概念构造的。

当然「算力」的计算方式有很多种,这里我只讨论VR的3D渲染比较依赖的「浮点性能」,也就是「每秒浮点运算次数」,它的单位是FLOPS。

 

那刚好我的手机是2年多前的小米10Pro,它的处理器是骁龙865。

而现在市面上的VR一体机能用到的最好芯片是骁龙XR2,它就是基于骁龙865魔改的。

 

骁龙865的算力是1.2T FLOPS。

iPhone 13上的A15是1.5T。

移动端的天花板iPad Pro上的M1芯片是2.6T。

当然这些都是理论算力,实际使用中这些移动端的芯片,都会因为散热问题而发挥不出全部的性能。

 

而桌面端的话,则因为不需要过多考虑电池续航和发热,可以把算力堆得更高。

一张3060显卡的算力是10T。

顶级的3090 Ti的算力是40T。

而低端的GT1030也有1T算力,但它被很多网友们称为电子垃圾。

因为英伟达在2010年发布的旗舰显卡GTX480,就已经有了1.34T的算力。

 

那么换句话说,这10年的移动互联网浪潮所带来的智能手机的普及,其深层含义就是为大众普及了1T量级的移动算力。

当然其实这种说法不准确,因为手机日常主要使用CPU而非GPU,但我们姑且这么去看待它。

 

用这1T的移动算力,你可以随时随地用来刷微信,刷微博,刷淘宝,刷B站。

也可以用来拍4K视频,也可以用来看4K视频,以及玩手机游戏。

 

因此它就形成了A-SOUL如今的基本盘。

A-SOUL的直播节目在1万块的iPhone上能看,在1000块的红米手机上也能看,画面效果并没有10倍的差距,它用到的算力也远不需要1T。

 

但1T的算力无法跑满720P的原神,而在VR眼镜上你需要跑满原生的4K屏幕才能得到一个720P的效果。

但是1T的算力可以解码8K的全景视频,从而在VR上得到一个720P的效果。

 

我的电脑用的是一张1070 Ti,算力是8T。

用Pico串流玩《VR Chat》这种低模的游戏其实没有什么压力。

而我也玩了《Half-Life: Alyx》,我觉得1070 Ti下的这个画质并不能达到我的标准。

这还是建立在Pico的视场角只有98°,PPD只有20的情况下。

 

同样是用这张1070Ti的8T算力,我觉得玩27寸2K+120Hz的 《守望先锋》的体验,要远远好得多,更何况VR游戏玩起来非常累人。

 

那「人均算力」还可以像前几年那样突飞猛进吗?

我的感觉是,这几年的半导体技术,无论是移动端的SOC还是桌面端的显卡,似乎都陷入了停滞。

特别是如果你关心这几年手机芯片的发展,就会发现甚至有点开倒车的迹象,主要是遇到了制程和能耗的问题。

 

因此在「人均算力」能够迎来重大突破之前,我看淡基于本地渲染的「VR游戏」,而比较看好基于云端渲染的「VR视频」,它是算力的集中化,一次计算,多次播放。

这和电脑、手机的发展路径也是一样,现在用电脑或手机看视频的人,远比玩游戏的人要多得多。

 

在现有的本地「人均算力」限制下,「VR视频」仍然有非常大的优化空间。

通过更合理的前期拍摄和后期解码的配合,「VR视频」可以实现在相同算力开销下,获得更好的画质体验。

 

但是「VR游戏」就没有多少可供优化的算力空间,很多时候你只能被动地等待整体人均算力的提高,而这需要依赖于整个半导体行业的进步。

 

这就有点像,如果直接从「油车」切换到「电车」,而基础设施没有跟上,那么体验就是断崖式下跌的。

那么此时折衷的「混合动力」的路线,反而是一个比较好的过渡方案,比亚迪的DM-i技术就是吃到了这样的一种红利。

 

而「人均算力」其实还只考虑到「本地渲染」这一个方面。

如果你要进行VR社交,玩VR网游,我们还要考虑「人均带宽」,「人均流量」等指标。

并且玩VR需要一定的活动空间,因此我们还可以考虑「人均住房面积」。

在鸽子笼里没有办法跳舞,连高声歌唱都怕打扰到别人。

 

这些东西汇聚到一起,可以用一个国际通用的指标来参考,那就是「人均GDP」,不过那是国家层面上的宏观视角。

而在简单的物理视角上,也有一些有意思的现象。

 

像手机算力目前的瓶颈就是无法解决散热问题。

而桌面端看上去制约比较小,但其实也快遇到天花板了,毕竟公版3090ti的功耗也有450W了。

 

我用的电子设备配置虽然都比较一般,但架不住东西多,总体的发热量就很大,房间的通风也不是很好,而且我还身处广东。

这就导致了我的房间一年下来大部分时间都要开空调,这又是一笔能耗开销。

 

所以最后你会发现,科技进步里最重要的其实是「人均能耗」和「人均能效比」。

前者是总量,后者是效率。

这和游戏《戴森球计划》里的世界观是相同的,文明的发展就是获取并消耗更多的能量。

 

我们也可以依据物理学里的「最大熵产生原理」,将其总结为「人均熵产生」的提高。

当然这就扯太远了,我觉得现阶段VR行业的最大瓶颈,还是最基础的「人均算力」的不足。

 

我也很想弄一张3090 Ti的显卡,坐拥40T的个人算力,可惜从各个方面来说都还不值得。

 

 

 

 

 

【4】《A-SOUL》

AKB48在中国是什么时候火起来,其实我不是很了解。

我最早接触AKB48是因为,差不多2015年左右,当时正值「知乎」的巅峰时期,知乎上对于「日式偶像」有过非常多的讨论。

 

现在去翻知乎的AKB48话题,能看到一些在2011年提出的问题,到今天仍然有人在认真回答。

有一些人饭得彻底,也有一些人黑得深沉,仔细翻一翻,能找到很多有深度的观点。

 

那个时候HW君还在上学,对AKB48的商业模式很感兴趣,还特意去学校图书馆借过一本书,当年发朋友圈的照片还留着。

 

那时我还是以一个纯路人的旁观视角,来观察这些与自己并没有什么交集的社会现象。

2015年的我肯定没有想到,在毕业多年之后,我自己成了当年所研究的「饭圈」中的一员,只是说形式上比较赛博朋克。

 

 

国内B站虚拟直播 VUP的生态环境,早期受日本VTuber模式的影响非常大。

而日本VTuber产业,其实是整个大的「日式偶像」经济的一小块,可以说是AKB48模式的线上延续。

而它又可以一直追溯到,从1970年代开始在日本发展起来的偶像产业。

 

关于东亚的偶像产业史,我很喜欢知乎上「海尔凯特」写的《偶像大历史:艺能少女的残酷物语》这个系列的文章。

它从日本1970年代一路介绍到如今的AKB48,并提及了后起的韩国、港台和如今大陆的偶像产业。

虽然也有很多观点我并不赞同,不过我很喜欢这个系列,它算得上是对东亚「偶像」产业的一个简单的编年史。

 

 

 

总的来说,目前国内的「虚拟直播」生态,是日本「偶像产业」进入中国后,与中国本土新兴的「直播产业」结合后的产物。

要更完整地理解它,我们还得先谈一谈「日式偶像」。

 

 

【偶像的人生故事】

在日本的演艺圈里有一个身份的鄙视链,它的划分大概如下。

【1】优(演员)

【2】歌手

【3】艺人(在日本指「搞笑艺人」,形式多样,可以平行理解为国内的相声、小品、脱口秀等综艺节目)

【4】偶像

 

「偶像」是处于日本的演艺圈鄙视链的底端的。

而它又还可以再划分为「地上偶像」和「地下偶像」。

 

「地下偶像」有着日本社会不能见光的一面。【她们】

虽然这里面也有很多默默无闻,坚持着音乐和舞蹈的追梦者。

但它整体给人们的印象就是卖肉卖福利,软色情,花样百出,没有底线。

虽然它在日本确实有着非常广阔的市场,但是无法登大雅之堂。

 

AKB48其实也是从不可见光的「地下偶像」开始做起的,一路成长为励志的「地上偶像」,最后被封为日本的「国民偶像」。

 

AKB48其实取得了非常大的成就,我们可以把它看做是日版的NBA。

只不过这里是把「打篮球的运动员」,换成了「唱歌跳舞的偶像」。

但即便是这样的一种成就,它在日本演艺圈里,仍属于鄙视链的底端。

 

「偶像」也会在舞台上唱歌跳舞,会发专辑CD,甚至能够出演影视作品。

但在日本,「偶像」的地位并不如「歌手」和「演员」。

这其中的区别就在于,「歌手」和「演员」用自己的作品说话,而「偶像」并没有一锤定音的音乐或影视作品。

 

日语维基百科对「偶像」的定义是:

「与粉丝分享成长过程,并以其「存在本身」的魅力而活跃着的人」

 

所以「偶像」其实是在用自己的人生来讲故事,这个「人生故事」就是他最重要的作品。

人们提起「偶像」,第一想到的就是他的「人生故事」,而他演出的影视或音乐作品,相对于他的「人生故事」来说并不那么重要。

 

我们可以举个例子。

1970年代日本演艺圈人才辈出,其中,山口百惠可以看做是古典王道的「国民偶像」。

虽然山口百惠也演唱了许多歌曲,出演了许多电视剧,但人们对她的认知就是职业定义中的「偶像」,人们记住的是她的人生故事。

 

而同样在1970年代活跃的中岛美雪,她也是许多人心中的偶像,但人们并不会把中岛美雪当作是一个职业定义的「偶像」。

中岛美雪是一个音乐人、歌手、作家,她创作出了许多优秀的音乐作品。

 

这些音乐作品远比「偶像」的人生故事更具有长久的生命力。

50年后,很多人都已经不再关心山口百惠当年的偶像故事了,可是我们仍然在传唱着中岛美雪的音乐作品。

 

不过客观地来说,山口百惠那一代的古典「偶像」仍然是硬核的,其本身在歌唱或者演艺的实力上,有着万里挑一的顶尖水平。

直到秋元康打造出「小猫俱乐部」,「偶像」的定位开始与专业的「歌手、演员」渐行渐远。

而这个男人的巅峰之作,便是后来我们熟知的AKB48。

 

这也就是为什么在日本,「偶像」的地位远低于「演员」和「歌手」,甚至「艺人」。

许多「偶像」火起来之后,都会想要努力洗白上岸,转型做「演员」或「歌手」。

而一个「演员」和「歌手」,并不会放下自己的身份再回去做「偶像」。

 

 

那么我们现在回来看中国国内的生态系统。

然后你会发现,在「偶像」的地板之下,还有一个地下室,那就是「主播」。

【1】演员【2】歌手【3】艺人【4】偶像【5】主播

 

A-SOUL早期起步时的模式和B站其他的「虚拟主播」一样,都是「主播」。

但是它一开始对自己的定位,其实是更高层次的「偶像」。

你说歪打正着也好,B站环境共同塑造的也好,但是A-SOUL确实从走上了一条类似「偶像」的道路。

 

它完成了对「虚拟主播」这一形式的突破,成功进入了更高层级的「虚拟偶像」生态里。

那这里的关键点是什么呢?你说自己是「偶像」,那你就是「偶像」了吗?

 

我们上面说了,「偶像」是用自己的人生来讲故事,这个「人生故事」就是他最重要的作品。

A-SOUL最初的成功,源于讲了一个「嘉然」的故事。

 

而「嘉然」的故事其实就是「山口百惠」式的偶像故事,它们的故事内核是相似的,都是讲了一个「少女用真心回应恶意」的故事。

这其实并没有什么新意,只能说50年过去了,人们仍然会吃这一套叙事,我也未能免俗。

 

所以我们会看到,B站上的「虚拟主播」每天都有新人进来,也会有旧人离开。

但是那些能够给人留下深刻印象的,其实不是动画形象或者声音,而是一个个故事。

因为「偶像」相对于「歌手」和「演员」来说,并没有硬核的才华。

所以他需要去讲一个「人生故事」,这个「人生故事」是他最重要的作品,而粉丝能参与到他的「人生故事」中来。

 

但事实是,并不是谁都能讲出一个好的故事,绝大部分的「虚拟主播」就真的只是「主播」,有些「虚拟主播」拼尽全力,只是希望能成为一个「虚拟偶像」。

因此A-SOUL企划的第一个突破点,就是把自身的定位从「主播」提升到了「偶像」,并成功讲出了一个好故事。

 

而在这一过程里,你是需要去对抗很多诱惑的。

你需要去完整地讲好自己的故事,而不能再去走主播路线。

哪怕是很烂的台本,你也要有自己的故事。

 

有很多企划宣称自己是「虚拟偶像」,但它并没有讲好自己的「偶像故事」。

而是频繁找B站的其他「虚拟主播」进行各种合作联动,让它自己的故事剧情变得支离破碎。

这其实是很偷懒的做法,我最终得到的故事观感就是,这是一个在B站混V圈的「虚拟主播」。

 

「虚拟主播」可以这样做,但「虚拟偶像」不行。

偶像应该讲好自己的人生故事,而不是活成主播的样子。

偶像的定位为什么会比主播高,因为它本身就比主播难。

所以这就 是A-SOUL企划的另一个突破点,「以我为主」,讲好自己的偶像故事。

 

 

【4-1】直播动画

但如果说A-SOUL就只是AKB48模式的低配虚拟版,那么它其实不会吸引像我这一类人的注意的。

我能观察到国内这些年「偶像」产业正在爆发性地成长,拥有着非常广阔的市场前景。

 

或者准确来说,所谓的「偶像」现象是中国GDP增长摆脱温饱线之后,各行各业开始「泛政治化」的体现之一,我称之为文化意义上的「霍布斯陷阱」。

 

但我对AKB48式的「日本偶像」没有兴趣,对「韩国偶像」或者「中国偶像」也都没有兴趣。

这倒也不是说我的品味有多独特,我也喜欢听各种各样精彩的人生故事。

只是说我并不是「偶像故事」这一套商业模式的受众。

 

我有尝试观看过很多类型的「虚拟直播」,其中将自己定位为「虚拟偶像」的也有不少,但只有A-SOUL给我的观感是独特的。

 

那A-SOUL给人的这种独特的观感究竟是什么呢?

在看其他的「虚拟直播」时,那我就真的是在看直播。

「主播」用的是不是虚拟形象,其实不怎么重要,它跟我以前在「斗鱼」看直播时的感觉并没有特别大的区别。

 

而在看A-SOUL的节目时,我的状态其实是在「追番」,我是在看一部连载着的动画。

这种看「动画」的感觉对我来说是非常关键的。

因此我前面才会强调,A-SOUL是一家动画公司,它代替的是我看番看剧看电影的那部分需求。

 

而我从小是看漫画和动画长大的,因此虽然我不吃「偶像故事」这一套商业模式,但我吃「连载动画」这一套商业模式。

我将A-SOUL当作是一个有连贯剧情的动画来追,而只是说它的动画剧情,刚好讲的是一个「女孩想成为偶像」的故事。

 

如果把A-SOUL当作是动画作品,那么它的故事,可能大概会比较接近《LoveLive!》或《偶像大师》。

这两部其实我都没有看过,也不是很有兴趣,因为我确实不是「偶像故事」这一题材的受众。

 

不过我小时候看过一部题材相近的动画,叫《寻找满月》。

这是一部2002年上映的老动画,它讲了一个女孩想要站在舞台上,成为歌手的故事。

我很喜欢这部动画,它对我的影响还挺大的。

 

所以后来在评论「偶像」「饭圈」等话题的时候,我会去批评那些「偶像」的音乐或者舞蹈的技术能力不行,但是我不会去否定他们想要站在舞台上的那颗心。

这倒不是出于什么理性的分析,而单纯只是童年时《寻找满月》这部动画对我产生的感性影响。

 

一个人年少时接触到的作品,往往会塑造他后来的各种观念。

A-SOUL的节目在大部分时间里给我的观感,就是记忆中小时候看《寻找满月》的感觉。

 

但是,如果说《A-SOUL》只是一部「直播动画」版的《LoveLive!》或《偶像大师》,抑或是我记忆里的《寻找满月》。

那么它也仅仅是一部题材冷门的佳作而已,在我的心中也不会有如今的这种份量。

而这样的一种份量其实已经远远超过了A-SOUL原本的商业定位。

 

《A-SOUL》这部动画的剧情有一个关键的转折点,那就是「去鸟巢开演唱会」。

正是「去鸟巢开演唱会」的这个约定,为《A-SOUL》开启了一条故事的主线。

就像鸣人想要成为火影。路飞想要当上海贼王。

大空翼想要拿下世青杯。樱木花道想要夺得全国冠军。

这个并不光彩的「地下偶像」,开始想要堂堂正正地走在阳光下。

于是《A-SOUL》这部动画,成了我记忆中的王道热血漫的模样。

 

 

当然我们仍然可以将「去鸟巢」,看作是对AKB48的拙劣模仿。

在2006年1月正式出道后,AKB48 的网站首页就明确写着她们的发展目标:「前往东京巨蛋的道路」。

此后直到2012年,AKB48团队从运营到成员,都是围绕这一目标而努力发展。

从「AKB剧场」到「东京巨蛋体育场」这短短的1830米,她们足足奔跑了7年。

 

但是,我觉得自己对于「音乐」和「舞蹈」这个行业,还是有最基本的认识和尊重的。

我对A-SOUL的粉丝滤镜,不如说是一种「动画滤镜」。

我可以接受《足球小将》《灌篮高手》《网球王子》里浮夸的球技,或者《中华小当家》中乱来的菜谱。

 

我并不会对一部动画里发生的剧情,过分地采用一个现实世界的标准,因为那些都是发生在架空的虚拟世界里的故事。

 

但是如果回到现实世界里,我会采用一个共同的标准。

现实世界里优秀的人实在太多了,在音乐和舞蹈这条路上,很多人既有天赋又很努力。

并不是你所喜欢的偶像的努力才叫努力,因此请用作品说话。【我家哥哥这么努力了】

 

而A-SOUL成员的歌舞水平,如果拿掉动画滤镜,将其置于现实世界的同一标准之下, 哪怕是放在B站的音乐区和舞蹈区,也都是非常不够看的,属于我听两句就会划走的那种。

 

虽然AKB48最后也去了东京巨蛋,但那并不光彩。

将她们送进东京巨蛋的,不是那些音乐作品和舞蹈本身,而是一张张捆绑CD销售的「握手券」。

 

 

如果A-SOUL的约定只是去「上海体育场」开演唱会,其实我倒不会苛求什么。

但「鸟巢」是不同的,它在观众心中的分量感是完全不一样的。

印象中的鸟巢,是一个周杰伦去了也会紧张的地方。

 

因为提起鸟巢,记忆里是2008年夏奥会和2022年冬奥会,是帝都的庄严与肃穆,是领导人接见万邦来朝的威严。

这是华夏「天下观」里不能亵渎的道德洁癖,并非华夏外围的次生文明所能够轻易理解的。

若想要到达鸟巢,你需要堂堂正正地站上舞台。

 

有很多歌手曾在鸟巢开过演唱会,他们想通过鸟巢来证明自己。

但鸟巢并不需要这些歌手,鸟巢就是鸟巢。

它是一个A-SOUL永远到达不了的地方,但这却是我在2021年里听到的最好的故事。

 

2021年5月约定「去鸟巢」之后,A-SOUL制作组其实并没有意识到故事的主线发生了变化,但是观众已经开始有了这些期待。

后来2021年6月份发生了「力反馈手套事件」,A-SOUL官方想要借助「VR手套」来出售与虚拟主播的「互动券」,引发了粉丝的强烈不满。

 

我们可以看到,至此,A-SOUL制作组的思路仍然是在摸着AKB48过河。

或者说A-SOUL企划从一开始,就是参照着AKB48的案例来「自我定位」的,它比照着AKB48成熟的商业模式,亦步亦趋。

而「握手券」既是AKB48商业模式的成功之处,却也是它后来永远无法洗白的污点。

 

「力反馈手套」的这场风波,其实就是观众们已经对《A-SOUL》这个故事有了新的期待。

粉丝已经有了成长,而A-SOUL停滞不前。

那么企划团队需要察觉到这一点,彻底断了走「地下偶像」路线的念头,不能再摸着AKB48过河了。

 

这些未必是A-SOUL制作组或者演员自己的看法,但却是一路陪伴过来的观众们共同生长出来的期待。

中式VUP,诞生于日式的VTuber。

但它们之中的A-SOUL,开始走上了完全不同的一条道路。

 

A-SOUL有机会创作出一部动画,一部生长于中国的王道热血动画。

一部可以在中国动画史上留下浓墨重彩一笔的直播动画。

 

「虚拟直播」是一项技术,它为「直播行业」带来了一种新的直播方式,于是诞生了《A-SOUL》。

但《A-SOUL》的出现,其实是为中国的「动画行业」带来了一种新的作品形式。

 

大部分人并未意识到,我们这个时代依托于技术进步,多了一种动画形式,叫「直播动画」,它拥有半开放式的剧情走向。

也多了一类演员,叫「动画演员」,他们为角色赋予「自由意志」。

那么A-SOUL的商业逻辑就完全不同了,这是一条全新的赛道。

 

 

 

于是此时,A-SOUL的成员就成为了真正的「演员」,而不再是无法证明自己的「偶像」,抑或是讨一口饭吃的「主播」。

【1】演员【2】歌手【3】艺人【4】偶像【5】主播

 

而既然A-SOUL已经摸到「演员」的门槛了,那就没有必要再退回去走「偶像」路线了,更不需要去做「主播」。

想做这些,其实随时都可以,但反过来则不行。

 

像「演员」蔡明想要当「虚拟主播」菜菜子,是一件非常容易的事情。

但一个「虚拟主播」想要成长为「演员」,却是登天之路。

 

不过虽然A-SOUL制作团队本质上是一个「动画剧组」,成员的实际工作是「动画演员」。

但在A-SOUL的官方正统叙事里,成员的目标仍然是「成为偶像」,那么她们就需要扮演好这一角色。

那些孱弱的唱跳能力和舞台技能就需要被不断提高,要用一个堂堂正正的方式站上舞台,前往永远抵达不了的鸟巢。

 

而「直播动画」和「传统动画」不同,并没有一个上帝视角的编剧可以为角色「机械降神」,并不存在一句「多年之后」的黑场白字幕就能让所有人自动变强,所有的努力和时间都需要被真实走过。【轻音少女】

 

所有的这些元素就构成了《A-SOUL》这部连载动画的观感。

它有一条很清晰的主线,成员都围绕着一个目标而努力着。

 

日程表里的那些「声乐训练」和「舞蹈训练」才是她们的主业,因为她们要去更大的舞台。

像「生日会」这样的重要演出是她们交作业的时刻。

而平时的直播节目反而变成了一种主线之外的日常剧情。

 

这种「主线+日常」的剧情节奏非常好,会让人想要一直追下去。

虽然鸟巢太远,A-SOUL太弱小,但是观众可以陪着故事里的角色成长。

这不仅仅是A-SOUL的成长,还有观众的成长。

这是这类「直播动画」和「传统动画」不一样的地方,剧情是半开放式的。

 

 

【4-2】五月事变

 

2022年5月10日,A-SOUL官方突然宣布成团之一的「珈乐」将要毕业。

粉丝们眼睁睁地看着那些曾经热血的梦想被残酷的现实撕开一条裂缝。

随后事情开始发酵,在5月14日,A-SOUL相关话题被粉丝冲上了微博热搜的榜一。

A-SOUL以一种我并不乐于见到的方式完成了破圈。

 

如果从商业角度来看,A-SOUL终于是向母公司字节证明了自己IP的流量价值。

和很多人的想法相反,A-SOUL这个企划其实会因为这场风波而活得更久,获得母公司更多的资源倾注,只是这种方式对于粉丝来说真的是太痛了。

 

那这个事件对我来说,观感仍然像是在看一部动画。

只是5月份的故事剧情似乎从「王道热血漫」,硬生生变成了致郁神作《魔法少女小圆》和《Fate/Zero》的展开。

所有的希望都会等价变为绝望,所有的愿望最后都变成诅咒。

曾经信誓旦旦的梦想,似乎永远都无法再提起。

A-SOUL粉丝在此之前有多快乐,那么在5月份就会感到有多痛苦。

而「鸟巢」从约定之地,变成了一个诅咒。

 

那段时间我有一个朋友在他的时间线上刷到了A-SOUL的事情。

他知道我有在看这个,所以过来问我到底是怎么回事。

但其实我短时间内很难给他一个明确的回复。

因为「虚拟直播」的特性,导致了它有非常多台面下的鱼龙混杂的信息。

 

要么你就只看台面上的公开消息。

要么就尽可能地去「开盒冲塔」,去了解尽可能多的信息。

而任何的一知半解都会导致判断出错。

 

但如果你想要了解这些台面下的东西,就不得不在粉丝的各种攻击和谩骂之中去挖掘那些蛛丝马迹,在一堆负能量之中去提取和甄别有用的信息,而做这样的事情会让人感到痛苦。

 

 

在我的价值观里,人需要有自己的判断能力,也需要为自己的生活负责,不应该成为巨婴。

并且,一个人也应该尊重另一个人的「自由意志」,不应该把别人当作巨婴。

 

而「偶像」与「演员/歌手」的区别就在于,「偶像」最重要的作品就是他的人生故事。

因此这种「偶像-粉丝」的互动关系中,偶像反而丧失了对于自己人生的把控,需要接受来自粉丝喜好的干预。

 

于是「偶像-粉丝」的私人边界被模糊掉了,一群人理直气壮地去干预另一群人的生活,最终让所有人都表现得像巨婴。

而「虚拟偶像」原本是可以避免这种现实中存在的问题的。

 

虽然我并不排斥去听一个「人生故事」,但是我排斥这种随意打破个人边界的做法。

我既不喜欢干预别人的生活,也不喜欢自己的生活被别人干预。

 

我喜欢看新垣结衣的电视剧,但对影视作品之外的那个人的事情,其实没有兴趣。

我喜欢看A-SOUL的节目,但我对演员的真实生活也没有什么兴趣。

因为本质上,我是一个观看动画作品的观众,而不是追逐偶像的粉丝。

 

因此我从一开始就不是「偶像故事」商业模式的受众,我对「作品」感兴趣,作品背后的作者/演员的故事也可以去了解,但却不会是我在意的重点。

周杰伦把他的专辑拿出来就行,他的生活不需要我来关心。

 

我觉得2022年5月份的那段时间里,自己的生活质量非常低,我被卷入了一些我原本不想关心的事情里。

那段时间里我又不得不表现得像一个「饭圈粉丝」,因为我想对整个事件有比较完整的记录。

 

可是哪怕你想停下来,但是基于B站的推荐算法,所有信息都会一股脑儿地推给你,并带着一大堆令人窒息的谩骂与情绪,你需要去消化这些情绪。

但好在我一直都知道怎么管理自己接受到的信息流。

 

因此在事件稍微稳定之后,我向那个询问我A-SOUL事件的纯路人的朋友,汇报了一个脱水版的复盘。

2022年5月份的风波,它是这样的一个事件。

 

我们把A-SOUL看做是一个剧组,而「珈乐」这个角色的演员并不满意这份工作,因此没有续约新合同,那么旧合同到期之后她会退出这个剧组。

而在公布了「珈乐」将会退出的消息后,A-SOUL 制作团队受到了各方面的压力,最终提前把和「珈乐」演员的旧合同解约了。

 

以上就是这个现实世界里真正发生的事情,一个脱水的版本。

如果你参加工作了,那么这类工作变动其实都是很常见、很普通的事情。

而员工对于公司的各种抱怨和吐槽,在现实里更是见怪不怪。

 

但这些其实也是台面之下的事情,是观众们本不该触碰到的东西。

正因为此前A-SOUL的故事讲得太好了,对于一些观众来说,在之前有多喜欢这个故事,那么在此时就会有多痛苦。

 

因为在虚拟世界里,观众得到的是完全不一样的观感。

「珈乐」的退出,并不是什么「毕业」或「休眠」,而是代表了故事里一个角色的死亡。

并且死得不合理,连象征着风光大葬的「毕业回演出」最后也没能举办。

 

而正因为在粉丝的压力之下,A-SOUL官方没能让「珈乐」这个角色走完一个完整的毕业休眠流程。

那么在这部动画之后的剧情里,「珈乐」从此成为一个在正统官方叙事里,不能再被提起的空洞。

 

这就是为什么事件发酵之后的那段时间里,选择继续走下去的4个人一如往常那般稳定演出,但是观众却出现了非常强烈的不适感。

因为故事并不完整,出现了断档。

这种割裂感对于全情投入的粉丝来说是十分悲伤和痛苦的。

 

而粉丝的这种痛苦是无法向圈外人诉说的。

因此哪怕套上了作为我国官方意识形态的「资本压迫」的叙事方式,它给圈外人的观感仍然是一场愚蠢至极的偶像饭圈的粉丝狂热。

 

我本人是有A-SOUL的粉丝滤镜,但我也是一个10年的微博重度用户。

在我看来,这点事情它并没有资格去占用「微博热搜榜一」这样稀缺的公共政治资源。

 

说到底5月份的风波,它的现实版本其实是非常贫瘠且乏味的。

但是正因为此前A-SOUL的这个故事讲得太好了,因此面对剧中某个角色的死去,观众体会到了非常沉重的痛苦和悲伤。

这其实是一次小型的「群体心理危机」。

 

这样的情绪是很难被消化的,现实生活里的人们常常需要花费非常多的时间和努力,才能走出类似的一段记忆。

很多成年人都处理不好这种情绪,更别说A-SOUL的粉丝群体多为学生党。

不知不觉间,A-SOUL拥有了超过它商业价值的「社会影响力」。

 

但是,有一种方式是可以让粉丝快速消解这些所有的痛苦和悲伤,那就是将其转变为「愤怒」。

而至于你想对何种事物产生愤怒,那取决于你所相信的叙事方式。

 

它可以是对A-SOUL运营方的愤怒,对更宏大叙事的「资本」的愤怒,也可以是对某个演员的愤怒,对意见不同的粉丝的愤怒,甚至对过去相信这个故事的自己的愤怒。

是谁都无所谓,只要你找到了那个你所认为的,制造了所有悲伤和痛苦的罪魁祸首,并将所有的「愤怒」都集中到这个对象上。

那么你就可以不用再感到那么痛苦和悲伤,你会好受许多。

 

我觉得这种做法其实没有什么问题,你可以选择保持自己的愤怒。

但是「愤怒」对我来说,是一种成本很高的情绪。

我确实很喜欢《A-SOUL》,但它还远不值得我去对什么东西感到愤怒。

 

那么我最终选择去忘掉「珈乐」这个角色,这个决定给我带来了短暂的痛苦。

《A-SOUL》的故事因此留下了一个黑洞,但也从此变得更加厚重与深刻。

我不想停留在过去,我还很期待未来。

「人生有梦,各自精彩」这句话其实就是「自由意志」的最终解。

 

 

 

【4-3】重新出发

到6月份7月份的时候,风波趋于稳定,向晚和贝拉各自的生日会都顺利开完了,一些观众也慢慢消化了这些事情。

而我抽空看直播的时间也变长了,因为你突然发现A-SOUL是可以被毁掉的,那么它反而变得更加珍贵了。

你并不知道这部动画什么时候会完结,因此会格外珍惜那些仍有演出的日子。

 

只是确实有些事情发生了变化,有些东西成了我的遗憾。

向晚学会了藏起自己的心思,话到嘴边的「鸟巢」,成了要小心翼翼去回避的不可言说之物。

似乎姑娘们连追逐梦想的资格都被剥夺了。

 

也许有一天,鸣人不再想当火影,路飞不再想着当海贼王,大空翼放弃了世青杯,樱木花道不再提全国冠军。

那么所有的青春,就都结束了。

 

作为一个被生活反复毒打,早已放弃了自己一个又一个梦想的人来说。

我觉得自己算是一个合格的成年人了吧,知道现实是怎么样的,知道怎么去放弃自己的想法,去与世界和解,去与自己和解。

 

说什么去鸟巢开演唱会,我当然知道这一天不会到来,这些约定在现实里没有办法实现。

A-SOUL成员的音乐和舞蹈能力其实很差,我也想象不出「动画演员」应该以何种方式站上鸟巢的舞台。

但是不知什么时候开始,我对那些本就不会存在的未来,有了一些期待。

我想在所有的故事结束之前,好好体验这些暗流涌动的情绪。

 

你想要带她去世界各地,做巡回演出。

但其实你连机票都买不起。

但是没事,她对你说,我们有摩天轮。

但你发现,连坐上摩天轮都实现不了。

但是没关系,她跟你说,我们去坐旋转木马吧。

只要坐过了旋转木马,就当作已经环游世界了。

但其实也根本没有旋转木马,女孩静静地坐在动捕房中,只有服务器在永不停歇地处理着数据。

这很可笑吗?

 

在那些年轻的、拮据的日子里,你和陪在你身边的那个人一起去逛宜家。

看着那些温馨的家具,你们忽然也很憧憬未来会有一个小小的家。

在这个人来人往、不属于你们的地方,你们拙劣地模仿着电视剧里的那些场景。

她假装为你做早饭,为你理衣裳,目送你出门工作,宛若你们真的拥有了一个小小的家。

但是你知道这些憧憬的未来并不存在。

你买不起房,留不下这座城市,你们最终无法在一起。

可是哪怕你们都不相信会有这样的一个未来,但在此刻她仍然愿意陪你演戏,和你畅想以后的日子,享受还仍在一起的所有时光。

虽然到故事最后,它确实也没有发生奇迹,是个bad ending。

但这并不可笑嘛。

 

 

Pico到手那天,我坐在这个虚拟演播室里看这支平平无奇的预告片,突然间就产生了一个小小的憧憬。

哪天算力不那么贵了,是不是我们可以在这个虚拟空间里实现一下10万人演唱会。

它似乎并不像现实世界那样遥不可及。

 

有人会说,你这是「入脑」了,其实不是,这些情绪我还分得清。

我当然很清楚自己在往A-SOUL身上投射什么样的个人情绪。

 

人何尝不都是如此,看着别人的故事,想着自己的人生。

我是在看A-SOUL吗?我其实在看自己的人生。

我在体验自己的那些,在岁月长河里早已变得支离破碎和模糊不清的情绪。

 

人是没有办法被外界说服的,人只会被自己脑海中的那个想法说服。

大家表面上看上去都是在看A-SOUL,但实际上是在看完全不同的东西。

 

我终究是被自己脑海中的东西所打动,那些记忆是我自己独有的,不会有人再拥有相同的第二份,因此我也并不期待其他人要理解我。

 

那回过神来,看着Pico空荡荡的虚拟播放厅,只有自己一个人。

环顾四周,它仍然只是一个720P显示器的体验。

这个糟糕的画质,这个虚假的星空。

A-SOUL永远无法到达鸟巢,Pico也没有能力去创造一个虚拟的10万人舞台。

 

但《灌篮高手》漫画的结尾,湘北队也没有拿到全国大赛的冠军,但这并不影响它陪伴我走过人生中一段珍贵的时光。

 

这期视频的制作周期很长,6月的VR首播之后我就开始写视频的讲稿。

稿子改完之后,7月份贝拉的生日会也过完了。

估计等到这个视频制作完成发布,8月份乃琳的生日会也过完了。

 

7月的贝拉生日会上,拉姐拿起剑,斩断由阿草扮演的「勇敢牛牛」。

这个尴尬的场景,像极学了3年动画特效的同学的课堂作业。

弹幕都在刷屏骂A-SOUL的制作团队,台本糟糕,技术拉胯。

 

这一幕确实让人出戏。

不过我回想起了很多曾经看过的动画剧情。

 

如果我和一些人一样,仍然停留在5月份的情绪里,那么它的观感其实是《Fate/Zero》。

《Fate/Zero》故事的最后,切嗣连用两道咒令,命令Saber斩断圣杯。

但随之斩断的,还有切嗣和Saber各自的梦想,从此留下的只有无尽的绝望。

我觉得《Fate/Zero》的故事也很精彩,但《A-SOUL》不应该是这样的。

 

我想起了另外一部动画的剧情。

《海贼王》的香波地群岛篇,草帽海贼团被暴君熊团灭的那一幕。

小时候看到这里的时候,那种绝望的感觉并不亚于《Fate/Zero》的结尾。

 

只是《海贼王》的故事并未在此完结,在那之后的每一话,我都在期待路飞的归来。

虽然后面随之而来的还有更加绝望的顶上战争。

但没关系,最后路飞还是做到了,剧中两年后归来,我所有的期待都是值得的。

 

这几个月来《A-SOUL》其实也失去了原来热血的「主线」。

但是「直播动画」的半开放式剧情与「传统动画」不一样,没有机械降神,没有一闪而过的黑场白字幕,所有努力的时间都被真实走过。

因此我反而需要克制自己的期望,你不能用对待传统动画角色的心理,去对待四个真实存在的自由意志。

 

那不妨换个思路吧。

目前《A-SOUL》的叙事观感仍然是非常好的,是一个非常温馨的「日常」故事。

「王道偶像故事」的核心一定是「热血」吗?

其实不是,那只是我的个人喜好,而我并不代表大众。

 

真实世界里所谓的「少女偶像团体」,是有其叙事的通关秘籍的。

日本偶像女团的叙事是「部活」,也就是「学校社团」,低开高走,慢慢养成。

韩国偶像女团的叙事是「工业」式的,标准之下,胜者为王,一将功成万骨枯。

而迄今为止可以在中国成功通关的偶像女团叙事,是「家庭」式。

 

华语少女偶像团体,真正能够被大众所认可的天团只有两个,S.H.E和Twins。

而这两个中国本土的组合,都有着非常不同于日韩女团的「家庭气息」。

 

S.H.E出道专辑就叫《女生宿舍》,三人共同生活,有着不是姐妹胜似姐妹的感情。

Twins的字面意思就是「双胞胎」,组合里的两人就像真正的姐妹一样,一起成长。

 

我们会发现,直至今日也只有这两个女团组合,能被中国的主流大众所接受,她们走出了一条中式的王道路径。

而那些生硬地去移植日韩偶像模式的女团,都会水土不服。

因此如果定位为中国式的王道偶像女团,那么最重要的其实是「家庭气息」的构建。

 

而A-SOUL如今确实有着这样的一种温馨的家庭氛围。

它是长久相处之后,自然生长出来的感情,是中国人最珍惜的东西。

 

这样的一种家庭氛围,其实也正好适合让前段时间经历了大风大雨的A-SOUL暂时停下来休息。

因为「家」本来就是在成长过程中,可以让你休息的地方。

 

现在这样也很好,这些「日常」的情节能保持着一个很温柔的观感。

只是我对于《A-SOUL》仍然还有期待,一个「主线」回归的期待。

那我希望A-SOUL能走出这段低谷,重新成为我记忆里的王道热血漫的样子。

这些热血是我青春里最珍贵的东西。

 

 

 

 

【E】结语

我的视频做得比较慢,转眼间,8月份乃琳的生日会也过完了。

有了一些新的感想,但是就不加上了。

总之,是一场很精彩的演出。

 

好了,这一期【HW君随便聊】【R6】就到这里了。

这期的话题可遇不可求,并不是我日常更新的内容,《GoneMeme》的主线故事是「哲学」。

我是HW君,我们下期再见。

 

(本讲稿完)

By HW君 @ 2022-08-22

guest
0 评论
内联反馈
查看所有评论