互联网巨头在干什么

前言

在国内互联网巨头中，tencent毫无疑问是霸主之一。在他手上的拥有独一无二的社交网络资源，几乎全中国人都在tencent的平台上联络、交友、娱乐、支付。在AI技术如此火热的背景下，我们确很难窥见巨头究竟投入了多少资源，试图在发掘些什么(也有可能是我这种门外汉的观感)。

在Youtube上意外看到一个tencent人所做的分享给了我一些线索。

社交分享图片增强

tencent的看家本领就是社交，因此提升人们分享体验是很顺理成章的。从下面这张图可以看出，tencent基于神经网络对用户分享的图片进行优化，一方面是增强细节；另一方面是增强色彩;同时应该会进行resize。毕竟人们分享的图片size各异，需要进行一些nomalize。

另一个重要的增强方向，就是提升暗光表现，从PPT上所见，主要是提升了画面的动态范围，从手机厂商的角度来说，我觉得这个优化的角度是不一样的。如第二张图，整个画面个人感觉虽然变得更亮，一些暗部细节得到体现，但是天空高亮处的层次细节变得更差了。不过对于社交分享而言，这种提升可能更讨喜。

姿态估计

从图像中提取出人体姿态。不过这应该是在云端计算，当前手机性能各异，没有办法获得统一的体验

给予姿态估计，Tencent在手机QQ上已经开放了一项互动跳舞的功能，应该说很有趣，但是目前看来并不是特别理想。从演讲的视频上看识别的速度并不太理想。

视频吸引力分析

对于社交分享巨头而言，尤为关注当前的人们对什么感兴趣。tencent基于用户在观赏视频时进行的主动行为，比如快进、快退、弹幕等等获得人们对当前视频吸引力细分图。他们知道人们爱上哪些片段，或许以后经过大量的学习，能反过来推断、指导电视电影的拍摄(应该说已经是事实了，比如Nexflix纸牌屋，可惜最后口碑也扑街了)。

看图说话

没错，竟然希望通过对图像元素的分割和语义方面的研究，最终能实现用一个短句描述一张图片。比如下面的图片，最后描述为一群人在山顶行走(a group of persons walk on top of a hill)。

在微信小程序里的AI实验室里已经退出的智能识图已经上线，遗憾的是，我在试用的时候，发现效果并不好。不知道后台还在支持。

健康产业

健康应该是社会影响力非常大的一个领域，IBM的沃森很早就开始进行病例分析，并试图消除医生水平之间差异导致的误判。从数据宣传上看目前是很理想，但是这种监督学习，我觉得离真正的应用还很远，因为完全信赖一个机器的诊断不仅仅从情感上很难接受，事实上也是很难处理各种corner case。一旦误判就完了。

后记

巨头们拼的其实是未来，他们在积极探索，充分利用现有的数据集，试图让机器来揣测人性、吸引人们注意力、掌控人们的时间。这让我对于未来，一个由算法把控的世界充满警惕(比如《算法霸权》就讨论了这方面)。人们都有自己的偏好，而技术不应该有偏好，如果技术为了获取利润而充满了各种偏好，甚至主动引入各种偏见，只为了拉拢更大的群体，未来的世界会变得更加冰冷。比如微博抽奖事件，事先会排除各种所谓的不活跃用户，更偏爱主动分享，活跃的人群，那其他并不愿意花时间在这些软件上的所谓不活跃用户，他们的声音被忽略了。

AI的起点都是为了探索人类的情感和智慧，但是人性的复杂可能并不是简单的模拟、堆砌神经网络能实现的。

愿世界更美好。

从一个演讲说起

前言

社交分享图片增强

姿态估计

视频吸引力分析

看图说话

健康产业

后记

CATALOG

关键字

FRIENDS