关于VR直播解决方案的实践与探讨
本文针对VR视频直播新技术,提出了解决方案,将采集、处理、分发、播放等集成一体的解决方案。
一、引言
目前,虚拟现实技术VR和VR直播这两块发展火爆,特别是VR直播成为2017年VR行业的热点。VR技术催生了全新的用户体验与商业模式。移动直播的强“自媒体”属性,与VR全景技术带来的真实临场感,使得移动VR直播在体验上远远超过任何一种直播模式。移动VR直播将颠覆互联网社交模式,无论是草根网红的个人秀场,还是大牌明星的实景互动,都不可避免成为新互联网时代的巨型流量入口。
二、解决方案
直播被定义为视频行业从单向传输到实时互动的一场革命,在1.0时代,PC/平板、手机是重要的载体,用户参与互动方式主要通过礼物、打字获得短暂的和主播互动的机会,临场感的缺乏和交互方式的单一是其最大的不足。而VR直播所带来的沉浸式的体验直接把直播从1.0时代推向了2.0时代。
一个完整的VR直播解决方案一般需要采集端设备、视频编辑、推送高水平、直播管理后台、网络分发以及播放端多个环节,这些环节环环相扣,我们基于云端资源和现有的设备资源,探索了采集、处理与分发三大架构,从采集端,到云端和用户端的业务流程,实践了VR直播一整套的解决方案。
(一)VR采集端
采集主要包括视频拍摄,数据采集与输出
采集设备一般分为电影级和广播级。信号源可以是多种,VR直播一般由4-16个摄像信号构成,全方位360全景信号。采用高清信号输出,构建成4k信号。虚拟的信号设备可以使用HDMI、SDI、AV、VGA、File、IP流等信号。
1.电影级采集设备
电影级采集设备目前主要有HeadcaseVR、HypeVR、NextVR、J2VR等。
HeadcaseVR:2016年正式亮相了全新移动VR拍摄方案的HeadcaseVR团队。采用2/3英寸的CCD传感器,单分辨率1920×1080。60FPS的帧率表现。其中J2V是中国的团队,是国内最早进入全景视觉领域发展的创新型公司。J2VR也是经过几代更新的电影及VR解决方案。采用4台RedDragon分别对四个方向进行拍摄采集。最终达到24K录制100FPS的标准。
2.广播级采集设备
XONE一体化全景摄像机:支持机内实时拼接,支持双组360度全景视频同步拍摄,采用SONY 1/1.8英寸CMOS,全景录制6K/全景直播4K。支持通过RTMP协议进行串流推送、支持支持通过PC客户端或APP客户端进行预览、编码支持H264/.H265 HEVC高压缩比编码、帧率:1-30fps。
3.民用级
国内民用级的全景摄像机较多,例暴风魔眼、Insta 360、Theta、Wipet、360fly等,在拼接畸变、流畅性、色彩还原、矫正等多个方面不会很成熟,适合自拍旅游等场景使用。
4.核心算法
VR直播采集设备完成的不止是采集内容这一步。设备里面一般会配套搭载的软件和算法才是核心技术。在VR直播中,所有的拼接都是直接即刻完成的,例如缝合、映射、美颜、编码、特效)白平衡,曝光等)。即将多镜头拍摄的画面进行亮度色彩调整、对齐、畸变矫正、投影到球面等一系列处理后,基于图像特征control points控制点,合成为一幅完整画面的过程。
核心图像处理算法,直接影响系统资源占有率,直接影响码流、带宽和存储。核心算法的好坏直接影像图像边缘弯曲的矫正,场景的分割,虚拟PTZ、转动、放大,这些都是由核心算法带动的。
现在业内的产品,针对图像矫正,有两种处理方式,一种是前端摄像机内置软件处理,另外一种是后端软件处理,其都是对图像边缘像素和水平展开进行矫正,图像矫正的关键在于图像边缘像素的还原完整度如何。前种方法节省了后端和网络资源,避免了带宽和存储的压力,即在前端就完成了对图像进行矫正处理压缩,最终将一个水平展开的图像传输到后端平台,使用者可根据需求选择全景画面或四画面显示,图像很具实时性。而后一种将图像矫正做到后端电脑上,其优势是借助电脑硬件快速的处理能力和软件的完备性,其能很完美地实现全景图像展开和四画面显示,从处理能力来说无疑后端机更具突出表现,效果或更要好一些,但也缺实时性。
图像校正算法被嵌入到摄像机内是当前技术市场的主流,其更符合用户即插即用的使用习惯,借助PC机的产品功能虽会很完美但未必会被用户接受。
(二)VR云端处理
VR云端处理包括视频数据处理、实时同步、视频编辑、合成、数据推送、云存储与云端转码等,我们利用了现有的推流设备、利用了阿里视频云资源实现了上述功能。
1.推流
从VR采集的视频流,我们使用了NSCaster推送至云端服务器,NSCaster整机采用便携化设计,设备高度集成化,内置主机、17.3寸全高清显示屏、PC键盘、鼠标触摸板、导播操作键盘、摄像机云台操作杆、视频输入输出接口封装、专业音频输入输出、调音台、蓝牙无线通话、TALLY输出、热插拔数据硬盘、DVD刻录机等。支持总共12路输入,其中四路SDI/HD-SDI/3G-SDI摄像机输入、一路全接口(SDI/HDMI/DVI/VGA/分量)输入,一路网络输入、两路DDR(视频素材)输入、四路虚拟场景输入。
网络输入可用于通过网络接入电脑桌面、Android设备、iOS设备;也可以接入网络流信号,支持RTMP/ RTSP/MMS/VJVGA/VJTeacher/HTTP TS/UDP TS协议,支持IP摄像机输入;也可以用于远程访谈连线。
两路DDR,用于播放本地视音频和图片素材,支持绝大部分常用视音频和图片文件;支持单文件播放和列表播放,支持循环播放;支持播放进度调整,支持播放倍率调整,支持播放时间倒数;支持与切换配合自动播放。支持MMS推流/拉流、FLASH/RTMP推流、UDP TS单播/组播网络直播。
2.视频云处理平台比较
具备快速部署视频服务、顺畅运营、集成方便、开发快速上线,并且运维简单等产品特性,重点对国内主要的四家视频云服务商进行了比较和分析)详见表2-1)。
表2-1 关于视频云平台整体比较
项目 | 腾讯云视频 | 网易视频云 | 七牛直播云 | 金山视频云 |
服务 | 直播、点播、互动直播 | 直播、点播、互动直播 | 直播 | 直播、点播 |
推流sdk | Android、iOS及OBS(第三方) | Window、Web、Android、iOS及OBS(第三) | Android、iOS及OBS(第三方) | Android、iOS及OBS(第三方) |
播放器sdk | iOS、Android, Web | Window、iOS、Android、Web | iOS、Android、 H5、PC | iOS、Android、H5、PC |
转码 | 10,000+分布式转码集群,2000并发转发 | 10,000+分布式转码集群 | 无点播产品形态 | 分布式转码,采用软硬件混合转码技术,支持H264,H265编码 |
CDN | 全球400+ | 全球500+ | 全球300+ | 进千个节点 |
直播录制 | 支持 | 支持 | 支持 | 不详 |
安全 | 防盗链、黑白名单 | 防盗链、回源鉴权 | 防盗链、播放地址加密、黑白名单 | DRM、防盗链 |
美颜 | 美颜+美白 | 滤镜+美颜 | 美颜 | 不详 |
鉴黄 | 内测 | 支持 | 支持 | 未知 |
并发量 | 千万级 | 千万级 | 百万级 | 千万级 |
腾讯云视频互动直播方案比较成熟,与腾讯云通信(IM)结合紧密,业务集成度较高,目前台内新麦是很好的案例。七牛直播云沿袭七牛云的精品路线,侧重于直播,开放云端 API 实现透明播控管理,CDN节点相对要少一些。金山视频云提供了点播数据挖掘、H.265编码其特色(当然H.265需要视频源高清而且终端性能强劲才有明显效果),客户端SDK集中在移动端,直播还支持OTT播放盒、超级电视等多屏播放,在VR直播方面已经在GITHUB开放了部分SDK。网易视频云功能相对完善,同时支持实时互动直播,而且具有各种场景的完整解决方案,拥有千万级并发量,SDK也非常全面。接入方便,新手也只需一天就可以为APP接入音视频功能。
(1)稳定性比较
近期云计算的宕机现象再次发生,云服务的稳定性变成了影响用户抉择的重要因素之一。当然,对于视频云服务来说,稳定性不止于数据中心层,更需要考虑视频流链路的稳定,包括对弱网环境的处理,对卡顿、延迟现象有极地的容忍度。
表2-2 关于视频云平台稳定性比较
腾讯云视频 | 网易视频云 | 七牛直播云 | 金山视频云 | |
机房 | 自建机房 异地多机房 多机房架构设计 | 自建机房 异地多机房 多机房架构设计 | 托管云机房 | 有自建机房 |
传输 | 传输加密 存储加密 | 传输加密 存储加密 | 传输加密 存储加密 | 传输加密 存储未知 |
Qos | 未提及 | 有 | 无 | 无 |
从一定程度上说,自建机房意味着具备专业的运维团队、更强的突发事件应对能力、更高效的突发事件响应速度,而这些因素恰恰是提供稳定服务的关键。此外,传输机制保证了数据的安全性,网络QoS策略则能够保障复杂网络下的流畅直播体验。而服务模式决定了是否能够快速响应客户的技术、服务诉求。
(2)技术服务
企业级云服务和消费级产品最大的不同,就是对技术服务的需求更甚于对资费的敏感,刚刚发展起来的云服务尤其如此。对于视频云服务,因为复杂的场景、冗长的链路背后是复杂的技术,而视频服务商还需要快速为自己的用户解决问题,让这些最终用户满意,所以技术支持必不可少。
表2-3 关于视频云平台技术服务比较
腾讯云视频 | 网易视频云 | 七牛直播云 | 金山视频云 | |
开发文档/ 技术课程 | 简单的开发文档 | 详细完整的开发文档 | 详细完整的开发文档 | 官网产品文档和API文档均尚未找到视频云资料 |
技术支持 | 7x24小时服务、QQ大群讨论、1V1大客户服务 | 7x24小时服务、 1V1专家支持 | 1对1 QQ群支持 | 不详、官网没提到 |
故障承诺 | 100倍故障赔偿、5天无理由退款 | 100倍故障赔偿 | 100倍故障赔偿 | 不详、官网没提到 |
3.金山云的优势
云平台VR具体技术参数与一般的视频并无区别,比较大的亮点,就是各家H.265的技术。例如金山公司的H.265生态链打通后,H.265和VR结合具备了画质和带宽的优势。
限制VR直播的问题在于码流。因为VR视频内容在映射后,肉眼可视的分辨率会下降很多。所以对原始视频的画质要求就比较高,一般都要求在4K或者8K,4K分辨率下,码流接近20M。如果H.265能够在采集端得到大范围的推广,可以大幅降低此处的带宽压力。华为公司拥有最多的核心专利,是标准的主导者,但是H.265受限于专利费,目前看来大幅应用于采集端还有很长的路要走。
具体优势体现在上行码率自适应,窄带高清转码,截图,录制,时移等功能和服务;具备较低带宽直播时延,能保证直播的实时交互;千万级直播并发能力,可动态扩展的直播技术架构。提供URL加密,视频加密、防盗链多种安全防护,减少盗播,录播风险。
(三)用户端开发
用户端主要包括全平台播放器部署、同时支持PC、手机、VR头显方式呈现。
全平台播放器部署采用了KSYMediaPlayer SDK的SDK包进行开发,重点实践了APP端的体验。KSYMediaPlayer SDK是金山云播放内核官方推出的iOS和Android平台上使用的软件开发工具包(SDK),为iOS和Android开发者提供简单、快捷的接口,帮助开发者实现iOS和Android平台上的多媒体播放应用。
1.KSYMediaPlayer SDK的快速集成
金山云播放内核涵盖Android、iOS、Flash和浏览器插件四个平台,基于FFmpeg自主研发音视频媒体播放内核,作为一款全平台兼容的软件播放方案,金山云播放内核提供了跨终端平台的播放器SDK,以及开放的音视频播放、控制接口和完整的开源调用示例,不仅极大降低开发门槛,同时支持客户快速在多个平台发布产品。
(1)KSYMediaPlayer SDK 功能
与系统播放器MPMoviePlayerController接口一致,可以无缝快速切换至KSYMediaPlayer;
本地全媒体格式支持, 并对主流的媒体格式(mp4, avi, wmv, flv, mkv, mov, rmvb 等 )进行优化;
支持广泛的流式视频格式, HLS, RTMP, HTTP Rseudo-Streaming 等;
低延时直播体验,配合金山云推流sdk,可以达到全程直播稳定的4秒内延时;
实现快速满屏播放,为用户带来更快捷优质的播放体验;
支持画面旋转,音量调节等各种功能;
版本适配支持iOS 7.0以上版本;
业内一流的H.265解码;
2M大小的超轻量级直播sdk;
支持bitcode
提供了支持直播和点播两个静态库,相比直播,点播支持了更丰富的封装格式和音视频编解码格式,二者支持的具体功能如下:
表3-1 点播和直播支持协议
直播 | 点播 | |
流协议 | HLS, RTMP, HTTP, FILE | HLS, RTMP, HTTP, FILE, RTSP, HTTPS |
封装格式 | FLV, TS, MPEG, MOV, M4V, MP3, GIF | FLV, TS, MPEG, MOV, M4V, MP3, GIF, AVI, ASF, MKV, WAV, WEBM, RM |
视频编码格式 | H264, H265, MPEG4, MJPEG | H263, H264, H265, MPEG2, MPEG4, MJPEG, VC-1, WMV, RV40 |
音频编码格式 | AAC, MP3, NELLYMOSER | AAC, MP3, AC3, AMR, APE, DTS, EAC3, FLAC, PCM, OGG, WMA, COOK, NELLYMOSER |
(2)运行环境
KSY MediaPlayer iOS SDK可运行于 iPhone/iPod Touch/iPad,支持 iOS 7.0 及以上版本; 支持 armv7/arm64以及虚拟机运行。
(3)快速集成
Step1 集成framework
将金山云SDK解压后,将framework目录下KSYMediaPlayer.framework复制到项目下,选择需要集成的target,在target->Build Phases->Link Binary With Libraries下,将KSYMediaPlayer.framework添加进去,然后添加另外四个系统库:
l VideoToolbox.framework
l libstdc++.6.tbd 或者libstdc++.6.dylib
l libbz2.tbd 或者 libbz2.dylib
l libz.tbd 或者 libz.dylib
Step2调用
打开需要集成播放视频功能的视图源码,把如下代码复制并粘贴到你将播放视频的位置,例如到播放/停止按钮的方法中。
1.导入头文件
#import <KSYMediaPlayer/KSYMediaPlayer.h>
2.初始化player
l 准备需要视频播放的UIView;
l 新建player;
l 设置url;
l 调用prepareToPlay开始播放。由于已经设置shouldAutoplay为TRUE,则prepare完成后立即开始播放。
三、结束语
通过上述的采集、处理、分发、播放等集成一体的VR直播解决方案,达到了稳定输出的效果,可以在APP和VR眼镜进行观看直播。
随着直播的不断演化发展,直播对于各行各业的影响也在逐渐深入,并逐渐开始从个人走向企业,已经成了一个标配,成为大家传递信息的一种新方式。VR将是信息传递的下一个方式。VR直播将扮演非常重要的一个角色。它会深入到生活的方方面面,深入到各个行业里面去,也会慢慢成为标配,未来3到5年,VR直播行业将会有大发展,会成为大家日常生活当中获取知识并与亲朋好友交流的一种标准方式。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了
- 职称话题| 为什么党校更认可省市级党报?是否有什么说据?还有哪些机构认可党报?
- 《农业经济》论文投稿解析,难度指数四颗星,附好发选题!
- 期刊知识:学位论文完成后是否可以拆分成期刊论文发表?
- 号外!出书的人注意啦:近期专著书号有空缺!!
- 汇总!已知这些省份都认可报纸文章(上)