未来计算 The Future of Computing
David vs Goliath
最近有一篇刷屏的文章叫《移动互联网十年》,作者炒冷饭把我们熟知的移动互联网赢家TMDPKQ(头条滴滴美团拼多多快手趣头条)的故事再讲了一遍。“程维雪夜机场拦司机、张一鸣离职王兴饭否、王兴无限战争、黄铮巴菲特慈善宴”,我想大家耳朵都听出茧子了。这篇文章刷屏,标志着移动互联网浪潮的终结,这盘棋大局已定,未来机会不多了。2018年,很多朋友都很焦虑的问我,后面还有什么可以做的吗?悔恨生的太晚,入行太晚了啊!
其实,不止我们一代人这么焦虑;大公司不给创业者活路的故事一直都在上演。
1995年,Marc Andreessen来到硅谷,环顾四周,发现软件开发的机会都被前人做完了,微软已经彻底垄断,不禁哀叹一声:“I came too late. It’s all over”。他那时不曾想到的是,整个互联网浪潮才刚刚开始,Marc后面会带领网景公司成为最成功的浏览器公司,在纳斯达克顶点,骑着独角兽,登上时代杂志封面。
更早一代,乔布斯那张在IBM Logo下竖中指的著名的照片,其实也是一样的焦虑略带犬儒的嬉皮士情绪。事后回看,乔布斯并没有在IBM的传统业务上打赢,而个人电脑自动把IBM拍在了沙滩上:阳光底下本无新鲜事。
往未来看十年,我们这代人有机会吗?新世界是什么呢?我想告诉大家,其实一切才刚刚开始,我们仍处在互联网技术的启蒙早期、黄金时代(Good ‘O Days)。
在给答案之前,先看PayPal Mafia的几个引理。
引理1:
某项技术如果没有持续投入,并不会自动提高,反而会逐步退化。(Peter Thiel)
举例:埃及最后一座金字塔后几代人就忘记了修建工艺;而美国今天已经丧失了登月的能力,甚至于修铁路和地铁都不如30年前的技艺,更别提和基建狂魔中国比了。协和超音速客机因为经济原因退役,几十年后全世界居然造不出超音速民航飞机了。
引理2:
某项技术如果有巨大的经济价值和清晰的科学路线,总会有人持续投入,几乎必然实现。(Elon Musk)
举例:新能源(风/光/玉米酒精/页岩气)、电动车,随着石油越采越少,单价长期看越来越贵,新能源的投入产出比就越来越合理,必然会逐步取代。所以马斯克说,如果他不做电动车,电动车产业也会成型,他只是提前助推了一把。类似的,摩尔定律本来2011年就要宣告失效,因为巨大的经济价值和清晰的科学理解,居然又能再打十年。
引理3:
如果某需求没有科学基础,很难研发技术,最后可能会用成熟技术来“间接”解决。
1970年的时候,技术爆炸,人类刚刚成功登月,科幻小说大卖,一代作者们描绘了一个很光明的未来:人类可以登上火星(Star Trek)、城市内有飞行车(回到未来)、两栖汽车可以海地旅行、彻底治愈癌症(里根政府的计划)、基因技术克隆和新生儿无疾病、吃一粒胶囊就当一顿饭、超音速飞机(协和当年已经做出来了)、各种新材料(磁悬浮、超导、太空天梯)、超级计算机和互联网。
2018年回看,预言家们集体大错特错了!47年过去了,我们可以说距离治愈癌症更近了47年,但是并不知道未来还需要多少年真正铲除癌症。除了计算机和互联网超额完成任务,其他所有项目里,人类一败涂地。
何以悲惨如斯?真正的科技演化路线是什么模样的呢?
偏科的人类
原来,技术爆炸是偶然,不是必然。回到引理3,没有科学基础,技术进步犹如无根之木,巧妇难为无米之炊啊。实际上,人类不是一个德智体美全面发展的好学生,是个只懂电子的偏科生!对生物、化学、材料、能源的理解,并没有到一个很深刻的层面上,尤其是北美生物千老的科研,可以说是鸟枪法乱试,进展缓慢本是必然。
Benchmark Capital的大合伙人Bill Gurley经常讲Bits and Atoms的概念(电子和原子/互联网和实体),说自己早年投资电子太多、原子太少,庆幸投出Uber这一单,为原子的社会做了点贡献,以后要多投实体的项目。嘴上这么说,我想他也很清楚,哪敢大力投实体啊,发展都在电子上,Uber是一个再清楚不过的人类偏科的实例了。本来解决城市交通应该靠的是新的交通工具,飞行车、多层地铁,超级大厦,结果偏科生实体解决方案拿不出来,只好用互联网来改变传统出租车的派单方式,增加点效率罢了。
实际上,不出意外的话,人类会一路继续偏科下去,甚至于要到用计算机科学解决所有问题的地步。
人类现在最大的问题
人类从古至今最大的疾苦,就是衣食住行。如今前两项已经大体解决,多数人“衣食”无忧。但是“住行”并不轻松。
出行之苦,古已有之,甚至有史学家推断孔子“食不厌精脍不厌细”就是因为常年旅途劳顿颠簸出了肠胃炎。2017年,美国人在交通上的花费甚至高达11% 的GDP,各种出行方式又贵又慢。
住房更甚。到现在,我们仍然没能“安得广厦千万间,大庇天下寒士俱欢颜”;旧金山的无家可归者已经把整个城市的立交桥都用帐篷占领了。同期,中国社会的许多主要矛盾,如果能够居者有其屋,我相信可以解决大半。
房地产的价格反映了人们为了位置付出的代价,是为了连接其他人、事、物,不得不掏的巨大代价。相对于大城市的房价,建筑物本身的造价简直可以忽略不计。
科学技术的工作,就是提高效率和产能,解放人们为衣食住行奔波的疾苦。物质极大丰富之后,省下来的时间就终于可以投入到文学艺术的上层建筑上了。
相信你已经想到我要说的了,偏科的人类,能不能用计算机科学解决“住”和“行”呢?
能。
计算机科学如何解决“住”和“行”
先回答一个问题,互联网的本质是什么?
通信(Telecommunications)。
为什么现在手机统治了所有电子设备,手机上集成音乐播放器、相机摄像机和GPS,而不是反过来?因为通信是互联网的本质,是人类的第一级需求。这也是为什么微信和QQ是中国最大的app,而Facebook(FB messenger, WhatsApp)是美国最大的app。
然而今天的微信和Facebook,并不能通过人们通信需求里最基本的两个测试(我起名叫Max通信测试):
1. 两个本来不认识的业务负责人远程签署百万美金合同
2. 不降低工作效率的远程上班(Work from Home)
实际上,在满足这两件事情上,微信视频聊天的水平和一百年前贝尔的电话区别不算很大,都完不成。
如果能通过这两项测试,那么想象一下,人类还需要花那么多钱在机票酒店上(14%的GDP),又费那么大力气“赚钱搬到市中心”吗(超级多的GDP)?
年初在桂林看一套房,桂林山水甲天下,气候宜人、物产丰富,两室一厅一共32万人民币。那一刻,我就想,如果北京人全都可以搬到自己想去的地方,幸福指数应该高得不行吧?
可惜微信和Facebook不能通过这两项测试,要是我们能瞬间移动就好了。
计算机科学不能帮人们造出瞬间移动,但是能带来 the next best thing:VR。
斯皮尔伯格用《头号玩家》描绘了2045年的未来世界。如果交通问题解决不了,我们间接的用VR来交通吧?身子还在原地,光影声却在千里之外。家人、同事、朋友,远在天边,近在眼前。如果身临其境,真实到无法分辨,那么看到的光子来自于真实物体的反射还是来自于显示器发光,还重要吗?(If you can’t tell, does it matter? – Westworld)
VR不是凉了吗?技术进展到什么程度了?
2015年,VR行业氛围特别的火热,然并卵。热度过去,投资人们又开始去看共享充电宝、抓娃娃和区块链了(呵呵)。其实VR并没有凉,这是技术发展和投资热度的天然不匹配。
这里是Gartner的hype cycle图。每项技术都经过了被捧上神坛(Peak of Inflated Expectation)然后祛魅( Trough of Disillusionment)的过程。
可以看到,如今站在山头上最名不符实的是区块链等,而VR已经提前几年经历了站上山巅、跌落谷底,终于一步步的爬出启蒙斜率,走向生产力平原了。
我在Adobe实习的时候,导师来自科技史上很著名的施乐实验室,就是那个乔布斯参观完后立刻偷走了图形化界面(GUI)和鼠标造出Apple II的地方。上个月的Oculus Connect 5上,Oculus首席科学家Michael Abrash又提起了乔布斯是如何回忆施乐实验室的:
“十分钟之内,我就意识到,未来所有的电脑都会长这样,显而易见。显而易见啊。你可以探讨多少年之后会实现,你可以预测后期谁是赢家谁是输家。不容置喙的是这个未来的客观必然性。实在太显而易见了!”
– 连说三个Obvious的史蒂夫 乔布斯
实际上,经过了互联网发展洗礼,有科技敏锐度的先知们,甚至我这样后知后觉的从业者,在体验了VR设备之后,都自然而然的有了相同的感叹:
未来所有的电脑都会是VR的模样。
实在太显而易见了!
体感游戏、手机VR:一段弯路
全世界现在只有几百万专业级VR设备出货量(Oculus Rift、HTC Vive等)。多数普通用户对VR的初体验,是Google Cardboard和暴风魔镜级别的,需要把手机插进一个盒子里使用。尝鲜试过之后基本没有再长期使用的了。
这一代手机VR特别明显的问题:
1. Screen Door Effect 由于手机不是为VR视距设计的,可以看到明显的像素点
2. 分辨率太低 手机一般能提供单眼360p的分辨率。我们需要4K
3. 动作延迟,头晕
4. 声音从单侧扬声器传出来,哭笑不得
5. 恐怖谷(Uncanny Valley) – 高度拟真但是没到100%拟真的人形会引起怪诞和极端反感
6. 缺乏和视觉相搭配的小脑前庭反馈和触觉反馈
恐怖谷:
在我看来,这一代的手机VR,是非常破坏性的把一个不成熟的体验丢给了普罗大众,但是这没关系,90年代Apple Newton也是生不逢时,不妨碍后续iPhone iPad大放异彩。
实际上,VR要想全面产生生产力,需要在软硬件层面攻克七门功课:
光学和显示、计算机图形学、眼追踪、立体声场、手势交互(触觉反馈)、人体工学(轻便舒适)、计算机视觉。
Michael Abrash预测在四年后的未来,光学和显示、计算机图形学、眼追踪、人体工学这几项会大概率达标,而其他三项要更久一些。
计算机图形学
有卡马克(John Carmack)在全力攻这个方向,加上图形学显卡和深度学习的大幅度进步,这个方面最让人有信心。
眼追踪
人体工学
这个方向会有多方位的提升,在电池技术难有寸进的前提下,5G会带来低延迟和高带宽,5G普及使得真正的云计算变成可能。6 DoF + 无线的VR设备,AR做到社交不尴尬(70g重量,好看的眼镜,500 milli-watts耗电),都会在几年内成为可能
作为一个杂凑创业者(Scrappy Entrepreneur),在我看来,剩下几项技术(立体声场、手势交互(触觉反馈)、计算机视觉)不成熟没关系,咱们可以砍需求嘛!
未来办公:商务会议、远程办公、混合现实
顺势而为:如果我们不做体感游戏和触觉控制,只做未来办公呢?是不是就可以绕过大量的弯路了!
我们回到前文提到的引理3,如果“住”和“行”不能直接靠新的交通工具和开发更多房地产来解决,人类这个偏科生可不可以用自己的最强项:计算机科学,来解放自己呢?
再检查一下我们前文的两个基本测试(Max通信测试)
1. 两个本来不认识的业务负责人远程签署百万美金合同
2. 不降低工作效率的远程上班(Work from Home)
这两件事,在移动互联网的年代无法实现,但是如果VR按部就班的发展,五年内应该大有希望。
关键的技术节点是,4k*4k、可变焦平面、140度视角、3D结构光、人眼追踪、低延迟渲染和人脸表情数字重构。这些居然都是量产或即将量产的组件!
除了VR的IO本身,这几年最大的进步就是人工智能了,看看下图,你能分出哪边是真人,哪边是AI重建的人脸吗?
答案:右边是重构的人脸。有兴趣可以翻墙看看Oculus原视频,动态表情几乎无法分辨。
我总结每天的日常工作,一个白领的一天有三件事:
1. 对着电脑
2. 开会
3. 对着电脑开会
一般来说职级越高,后两件事的比重越大。
对着电脑伏案工作这件事已经比较彻底的解决,可以远程了,因此产品经理和设计领域有很多Digital Nomad,我有个朋友甚至去参加Remote Year边工作边环游世界了一年。
开会和对着电脑开会如果也能远程,岂不快哉?
微软2016年给出的解决方案是Surface Hub,如图所示。这个方案对于协作文档非常不错,但是无法解决远程dial-in同事的几个核心问题(来自映维网):
1. 缺乏眼神交流
在视频会议中,如果你直视某人的眼睛,他们只会觉得你再看向别处,反之亦然。所以,你必须作出选择:到底是通过注视摄像头来“假装”进行眼神交流,还是正儿八经地看他们在干什么。这是一个无法解决的问题,除非你的摄像头在你所注视的人脸后面——也就是你屏幕的正中间。而且即便你能够把摄像头移到屏幕中间(比如说使用字幕提示器),也只对一人有效。
2. 集中注意力
一个人在集体视频中无法看出别人是否在专心听讲
3. 肢体语言减少
4. 不在同一空间
5. 延迟 延迟超过1/10秒,如果不打断对方对话就很难进行。这一点我们在打电话是就深有体会(现在通话延迟比视频会议延迟还严重)。虽然新设计的摄像头可以降低延迟率,但手提电脑和台式电脑上的摄像头通常都延迟得更厉害,让人无法忍受,无论你是用Skype或是其他什么软件,就连捕捉画面都会延迟。
6. 糟糕的灯光效果
7. 你不能动 在视频会议中,你不能挪动椅子,也不能调整你在桌前的位置。不能动,不能改变视角(除非你退出)很有可能导致幽闭恐惧症,而且人们也无法决定或改变与会者的位置,这一行为本身是十分重要的。
VR的解决方案是什么呢?并不是直接把摄像头里的你发给互联网那一头,而是用3D结构光捕捉你的表情,立体声收音,最后为对面呈现的是AI重建的动态表情和眼神!
VR里的混合现实又能让你使用物理的硬件,在眼镜里看到的也是重构的键盘影像。还是这句话,如果身临其境,真实到无法分辨,那么看到的光子来自于真实物体的反射还是来自于显示器发光,还重要吗?(If you can’t tell, does it matter? – Westworld)
商业路径
我们知道在商业社会里,路径大于目标。按照引理2:
某项技术如果有巨大的经济价值和清晰的科学路线,总会有人持续投入,几乎必然实现。
根据前文的论述,通过Max通信测试的VR系统,会极大提高人们的生产力,并且解放出行买房之苦。
1. 两个本来不认识的业务负责人远程签署百万美金合同
2. 不降低工作效率的远程上班(Work from Home)
这套系统的巨大经济价值非常明显(出行需求和房价坍塌),技术组件也在四年后成熟,这种情况下整体解决方案必然会有人持续大量投入。哪个公司或组织会主导这个投入呢?
运营商、软硬件巨头和互联网巨头。
我的判断是,VR世界里最强大的杀手级应用VR Chat,有可能不是腾讯的QQ和微信。Facebook显然是嗅到了危险,就像当年腾讯在移动互联网早期如果没有拿到微信的这张船票,很可能会有灭顶之灾。扎克伯格是我们时代的收购大师和战略大师,Instagram和WhatsApp两单被华尔街誉为神作,而Oculus的20亿美金大手笔当时还有很多人看不懂,现在明确了,就是VR时代的船票,还是头等舱。
运营商有很大的动力来支持VR产业。回想07年,乔布斯发布第一代iPhone,其实商业上是需要规模化才能行得通的。运营商为了3G的普及,主动推动智能手机,AT&T补贴iPhone发布,相辅相成,才有了移动互联网盛世。
5G时代,运营商遇到了更加严重的鸡和蛋问题。没有消费级应用,4G网速用户体验足够快了,谁会为5G买单?而没有普及到足够多用户的5G,又如何吸引软硬件开发者到来呢?
扎克伯格认为,Oculus Rift平台要达到1000万用户,才能让开发者赚到钱,从而主攻VR平台,而不是像现在一样在原来游戏里加上VR模式。
中国的情况比美国要乐观,一个统一强有力的政治局势是最好的解决鸡和蛋问题的捷径,像高铁一样,移动联通电信华为中兴,以“四个意识”为先,大概率领先美国推出消费级的5G。这个过程中,他们会通过直接间接投入和扶持的方式,来培育5G的几个核心使用场景(IoT、智慧城市、无人驾驶、VR AR)。
整个生态里应用层小开发者非常重要,因为全新的体验,需要的不是高举高打的大资本投入,而是大量年轻人试错。
硬件解决方案的推进,应当先从商业会议入手,可以大一点重一点贵一点,但是企业级愿意付费。类比当年的大哥大,优先解决问题,再考虑便携性。企业高管每天的开会需求更强烈,付费意愿和能力也更高。
新技术的普及,很多时候跟随者代际交替的步伐。六年前,美国人打Uber还是一个月一单;到了今天,全世界大城市许多人每天打网约车,已经彻底变成了生活方式的一部分。Travis Kalanick给Uber定下的使命是“Transportation as Reliable as Running Water”,交通像自来水一样可靠。有了这样的交通网,年轻人就真的有越来越多选择不买车,完全靠网约车走天下了。
企业通讯也类似,从百万美金合同场景的应用,到每个普通员工日常的可靠高效应用,可能会需要一段不短的时间,但是这个可靠性一旦落实,新一代年轻人真的有可能选择不买房,甚至于住在小城市全年远程上班了!
就像乔布斯当年说的,未来所有的电脑都会长这样,显而易见。显而易见啊。你可以探讨多少年之后会实现 … 不容置喙的是这个未来的客观必然性。实在太显而易见了!
VR也是如此,我们可以探讨几年后会实现,但是我毫不怀疑这件事一定会发生,是全人类的命中注定。
年轻人能做什么?
VR世界也会迎来乔布斯的iPhone时刻,预计五年左右。(我们总是高估两年的变化而低估五年的变化。)在那之后,画卷会以这个顺序展开。
通信
o VR Chat杀手级应用
o 新的社交网络
o 新的社会组成方式
生产力
o 早期没人知道VR/AR/MR都能带来什么样的生产力提升
o 高效试错,打造最合适的工具
o 做空房地产和实体交通
娱乐
o 一茬一茬的内容平台
o 内容CP
我们知道,互联网的第一级需求是通信和生产力,其次是娱乐。逐渐就像移动互联网过去十年的发展一样,前期的应用层会是长尾的,大浪淘沙逐步凝聚到几个赢家上。中后期娱乐的需求,又会催生出几个头部的平台和大量长尾的内容生产机会。按照信息产业的自然发展规律,这互联网、移动互联网之后的第三波浪潮来之前,我们就仿佛可以预言后面要发生什么了。
做一个时空穿越者(伪),还需要担心如何发财吗?
不局限于工作和娱乐,甚至于未来的金融、货币、国家主权、战争,都会在VR里重新想象。
毛主席说得好:
世界是我们的,也是你们的,但归根结底是你们的!
世界是马云马化腾的,也是年轻人的,但归根结底是年轻人的;年轻人就是八九点钟的太阳,用不了多久就会到正午,灿烂夺目,谁与争锋!
浪潮之巅,你,准备好了吗?