TED

互联网巨头在干什么

从一个演讲说起

Posted by KinLin on April 4, 2019

前言

在国内互联网巨头中,tencent毫无疑问是霸主之一。在他手上的拥有独一无二的社交网络资源,几乎全中国人都在tencent的平台上联络、交友、娱乐、支付。在AI技术如此火热的背景下,我们确很难窥见巨头究竟投入了多少资源,试图在发掘些什么(也有可能是我这种门外汉的观感)。

在Youtube上意外看到一个tencent人所做的分享给了我一些线索。

page1

社交分享图片增强

tencent的看家本领就是社交,因此提升人们分享体验是很顺理成章的。从下面这张图可以看出,tencent基于神经网络对用户分享的图片进行优化,一方面是增强细节;另一方面是增强色彩;同时应该会进行resize。毕竟人们分享的图片size各异,需要进行一些nomalize。

page2

另一个重要的增强方向,就是提升暗光表现,从PPT上所见,主要是提升了画面的动态范围,从手机厂商的角度来说,我觉得这个优化的角度是不一样的。如第二张图,整个画面个人感觉虽然变得更亮,一些暗部细节得到体现,但是天空高亮处的层次细节变得更差了。不过对于社交分享而言,这种提升可能更讨喜。

page3

姿态估计

从图像中提取出人体姿态。不过这应该是在云端计算,当前手机性能各异,没有办法获得统一的体验 page4

给予姿态估计,Tencent在手机QQ上已经开放了一项互动跳舞的功能,应该说很有趣,但是目前看来并不是特别理想。从演讲的视频上看识别的速度并不太理想。 page5

视频吸引力分析

对于社交分享巨头而言,尤为关注当前的人们对什么感兴趣。tencent基于用户在观赏视频时进行的主动行为,比如快进、快退、弹幕等等获得人们对当前视频吸引力细分图。他们知道人们爱上哪些片段,或许以后经过大量的学习,能反过来推断、指导电视电影的拍摄(应该说已经是事实了,比如Nexflix纸牌屋,可惜最后口碑也扑街了)。

page6 page7

看图说话

没错,竟然希望通过对图像元素的分割和语义方面的研究,最终能实现用一个短句描述一张图片。比如下面的图片,最后描述为一群人在山顶行走(a group of persons walk on top of a hill)。

page8 page10

在微信小程序里的AI实验室里已经退出的智能识图已经上线,遗憾的是,我在试用的时候,发现效果并不好。不知道后台还在支持。 page9

健康产业

健康应该是社会影响力非常大的一个领域,IBM的沃森很早就开始进行病例分析,并试图消除医生水平之间差异导致的误判。从数据宣传上看目前是很理想,但是这种监督学习,我觉得离真正的应用还很远,因为完全信赖一个机器的诊断不仅仅从情感上很难接受,事实上也是很难处理各种corner case。一旦误判就完了。 page11

后记

巨头们拼的其实是未来,他们在积极探索,充分利用现有的数据集,试图让机器来揣测人性、吸引人们注意力、掌控人们的时间。这让我对于未来,一个由算法把控的世界充满警惕(比如《算法霸权》就讨论了这方面)。人们都有自己的偏好,而技术不应该有偏好,如果技术为了获取利润而充满了各种偏好,甚至主动引入各种偏见,只为了拉拢更大的群体,未来的世界会变得更加冰冷。比如微博抽奖事件,事先会排除各种所谓的不活跃用户,更偏爱主动分享,活跃的人群,那其他并不愿意花时间在这些软件上的所谓不活跃用户,他们的声音被忽略了。

AI的起点都是为了探索人类的情感和智慧,但是人性的复杂可能并不是简单的模拟、堆砌神经网络能实现的。

愿世界更美好。