1. 概述
OpenAI 发布了新一代旗舰生成模型 GPT-4o,这是一款真正的多模态大模型,可以「实时对音频、视觉和文本进行推理」。 支持与 AI 实时语音对话,且响应时间达到毫秒级;交互中可识别人类情绪并以相应的情感做出回应;多语言能力的提升,WebRTC 成为大模型关键能力。
视频会议平台 (Video Conference Platform) 是一种在线视频会议工具,它允许用户通过互联网进行实时视频会议。视频会议平台通常提供了多种功能,如视频通话、语音通话、屏幕共享、文档共享等,使得用户可以在不同地点进行高效的沟通和协作。视频会议平台可以用于企业内部的会议、远程教育、远程医疗等应用场景。
WebRTC 是一种开源的实时通信技术,它允许在网页浏览器中进行实时音视频通信和数据共享。WebRTC 使用了 JavaScript API 和浏览器内置的多媒体功能,使得开发人员可以在网页中实现实时音视频通信和数据共享,而无需安装额外的插件或软件。WebRTC 支持多种通信协议,如 UDP、TCP、HTTP 等,并提供了多种编解码技术,以适应不同的网络环境和设备。WebRTC 被广泛应用于实时视频会议、在线教育、远程医疗等领域。
2. 相关产品
2.1. BigBlueButton
官网地址:https://bigbluebutton.org
架构:SFU+MCU(mcu仅混了音频),视频流是基于kurento开发,混音用的是fs(mcu仅混了音频),
协议:webrtc,不支持多协议
录存:录像效果不是很好,简单图像拼好(基于kurento),比较占资源
优点:BigBlueButton 功能很全,老牌会议,多用的教学会议,
缺点:架构复杂,性能不是太好,一般安装都有一定难度,二开困难,商用困难。
2.2. mediasoup
官网地址:https://mediasoup.org/
架构:SFU,基于C++的webrtc会议框架
协议:webrtc,不支持多协议
录存:没有录像功能,录存用ffmpeg,视频会议录存很麻烦。
优点:架构清晰,很多视频云服务基于此项目开发,性能好。
缺点:只实现了核心功能,很多功能需要二开,对webrtc技术要求较高掌控
2.3. Jitsi Meet
官网地址:https://jitsi.org
架构:SFU,基于java开发
协议:webrtc
录存:录像要安装插件模块,是基于虚拟chorme一个客户端接入,录屏,性能极差
优点:界面很漂亮,会议功能完整。
缺点:性能差,外国人做的,二开改造麻烦
2.4. OpenMeetings
官网地址:https://openmeetings.apache.org
架构:SFU,基于java开发,流基于kurento开发
协议:webrtc
录存:录像可以基于kurento调整,简漏
优点:apache支持
缺点:性能较差,界面和功能都比较不适合国情,二开麻烦。
2.5. OvMeet
官网地址:https://github.com/ccallcn/ovmeet
架构: MCU-VOIP
协议:webrtc,sip,rtmp,rtsp
录存:MCU混流录存,功能强大,旁路直播
优点:多协议接入,VOIP接入传统硬件,录存方便,文档白板,硬件融合会议,api,二开方便,
缺点:商用要收费
2.6. OvMedia
官网地址:https://github.com/ccallcn/ovsyunlive
架构: SFU/MCU融合架构,
协议:webrtc,sip,rtmp,rtsp
录存:MCU混流录存,单通道录存,直播
优点:多协议接入,流处理接入功能强大,功能远整,录存方便,文档白板,api,二开方便,
缺点:商用要收费
2.6. OpenVidu
官网地址:https://openvidu.io
架构:SFU,kurento的应用范例
协议:webrtc
录存:录像可以基于kurento调整,简漏
优点:有官网整理的api接入,接口清晰,二开较方便
缺点:性能较差,功能简单,很多功能和小问题要自已处理,较高开发量和技术要求。