0 引言
Directshow应用框架完成了流媒体处理的底层工作,使得编程者无需关心数据如何输入,以及处理完后如何输出,而只需关心如何对输入数据进行处理。H.264视频编解码标准具有高压缩比和优良的网络亲和性,被普遍认为是最有影响力的流媒体视频压缩标准。将Direct-show和H.264两种相结合的流媒体播放器无疑将具有非常优秀的性能。
1 Directshow技术和H.264视频压缩标准简介
Directshow是微软公司提供的一套流媒体开发软件包,为在windows平台上处理各种格式的媒体文件的回放、音视频采集的高性能要求的多媒体应用,提供了完整的解决方案。
Directshow是一套完全基于COM的应用系统,该系统位于应用层中,它使用Filter Graph的模型来管理整个数据流的处理过程;参与数据处理的各个功能模块叫Filter;各个Filter在Filter Graph中按照一定的顺序连接成一条“流水线”协同工作。Filter是一个COM组件,其功能可以由用户自行实现,DirectShow SDK也为用户提供了一些标准的Filter供用户使用。各个Filter在Filter Graph中按一定顺序通过Pin互相连接起来,Pin也是一个COM对象。
H.264是由ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准。H.264/AVC视频编码标准在编码质量和压缩比上比原有的视频编码标准都有了明显的提高。在相同的视觉感知质量上,编码效率比H.263,MPEG-2和MPEG-4提高了50%左右。H.264不仅具有优异的压缩性能,而且具有良好的网络亲和性。因此,H.264被普遍认为是最有影响力的流媒体视频压缩标准。
2 系统设计框架
本系统基于Direotshow应用框架和H.264视频压缩标准,实现了从网络接收流媒体数据,并在客户端实时播放的功能。流媒体文件是采用H.264编码的AVI文件,由于directshow提供了AVI Splitter Filter、Audio Decoder和标准的Video/Audio Renderer,因此,本系统只需设计自定义的网络源Filter、H.264解码Filter。
多媒体流式传输实际上牵涉到两个方面的技术。其一就是服务器与客户端的通信技术,包括多媒体数据的传输、命令控制等;其二就是客户端对接收到的多媒体流实时解码后播放的技术。显然,网络通信可以使用windows socket技术,多媒体流的解码播放可以使用direct-show技术。本文采用direetshow应用框架,设计了网络源filter和h.264解码filter,并通过Filter Graph构建了流媒体播放器。
0 引言
Directshow应用框架完成了流媒体处理的底层工作,使得编程者无需关心数据如何输入,以及处理完后如何输出,而只需关心如何对输入数据进行处理。H.264视频编解码标准具有高压缩比和优良的网络亲和性,被普遍认为是最有影响力的流媒体视频压缩标准。将Direct-show和H.264两种相结合的流媒体播放器无疑将具有非常优秀的性能。
1 Directshow技术和H.264视频压缩标准简介
Directshow是微软公司提供的一套流媒体开发软件包,为在windows平台上处理各种格式的媒体文件的回放、音视频采集的高性能要求的多媒体应用,提供了完整的解决方案。
Directshow是一套完全基于COM的应用系统,该系统位于应用层中,它使用Filter Graph的模型来管理整个数据流的处理过程;参与数据处理的各个功能模块叫Filter;各个Filter在Filter Graph中按照一定的顺序连接成一条“流水线”协同工作。Filter是一个COM组件,其功能可以由用户自行实现,DirectShow SDK也为用户提供了一些标准的Filter供用户使用。各个Filter在Filter Graph中按一定顺序通过Pin互相连接起来,Pin也是一个COM对象。
H.264是由ITU-T和ISO/IEC的联合开发组共同开发的最新国际视频编码标准。H.264/AVC视频编码标准在编码质量和压缩比上比原有的视频编码标准都有了明显的提高。在相同的视觉感知质量上,编码效率比H.263,MPEG-2和MPEG-4提高了50%左右。H.264不仅具有优异的压缩性能,而且具有良好的网络亲和性。因此,H.264被普遍认为是最有影响力的流媒体视频压缩标准。
2 系统设计框架
本系统基于Direotshow应用框架和H.264视频压缩标准,实现了从网络接收流媒体数据,并在客户端实时播放的功能。流媒体文件是采用H.264编码的AVI文件,由于directshow提供了AVI Splitter Filter、Audio Decoder和标准的Video/Audio Renderer,因此,本系统只需设计自定义的网络源Filter、H.264解码Filter。
多媒体流式传输实际上牵涉到两个方面的技术。其一就是服务器与客户端的通信技术,包括多媒体数据的传输、命令控制等;其二就是客户端对接收到的多媒体流实时解码后播放的技术。显然,网络通信可以使用windows socket技术,多媒体流的解码播放可以使用direct-show技术。本文采用direetshow应用框架,设计了网络源filter和h.264解码filter,并通过Filter Graph构建了流媒体播放器。
在服务器端首先将连续的H.264流分成一块一块小包的负载数据,并且加上一个信息头一起使用TCP协议发送;在客户端根据信息头描述,将小包的负载数据进行拼装,然后进行H.264的解码播放。Socket数据传送结构为:负载类型(8 bit)、负载数据长度(16 bit)和负载数据包(2324Byte)。
客户端的实现可以参考SDK中的MEMFile Filter,直接从SDK例子将asyncrdr.cpp、asyncrdr.h、asyncio.cpp、asyneio.h四个文件拷贝过来,然后在MemFilter.h文件中从CAsyncStream派生流处理类CMemStream,定制数据源并进行数据的读取操作;从CAsyncReader派生滤波器类CMemReader,实现含1个输出PIN的Source Filter框架,完成与Splitter Filter的连接。
网络源滤波器类间数据流程如图2,下一级Filter“拉”线程数据流程如图3。其中:CAsyneStream用以标示数据流;CAsyneRequest标示输入与输出请求;CAsyncIo实现数据输入和输出的控制。编程主要实现CMemStream:Read()函数以实现从特定的数据源读取数据到下一级Filter的Sample中。
3.3 H.264解码Filter的设计
该滤波器工作于Splitter和Renderer filter之间,包含一个输入和一个输出,且输入和输出pin上的媒体类型不一致,故选择CTrans-form Filter作为基类,派生子类CX264Decode。
ffmpeg是一个集录制、转换、音/视频编码解码功能为一体的完整的开源解决方案。利用ffmpeg中的Libavformat和libavcodec库访问大多数视频文件格式是一个很好的方法。将ffmpeg中关于h.264解码的操作封装为C++类,供H.264解码Filter调用以实现解码功能。
子类CX264Decode必须要实现的纯虚函数有:CheckInputType()实现输入Pin上的媒体类型检查;CheckTransform()检查是否支持从该输入pin到输出pin的变换操作;DecideBufferSize()决定Samlple内存的大小;GetMediaType():提供输出Pin上的首选媒体类型;Transform():实现解码变换。
子类CX264Decode可选的重写虚函数有:初始化和反初始化流:StartStreaming()和StopStreaming();响应质量通告消息:AlterQuali-ty();获取媒体类型被实际设置的时间:SetMediaType();连接时获取额外的接口:CheckConnect()、BreakConnect()和CompleteConneet();定制变换过程:Receive();标准化设置输出Sample:InitializeOutputSample()。
本Filter设计主要流程如下:
(1)Filter注册信息
定义类工厂模板,填写Filter的注册信息;同时实现DLL文件所必须实现的注册和反注册函数:DLLRegisterServer和DLLUnregisterSe-rver。
(2)框架函数的实现
实现函数CreateInstanee,用于创建Filter对象实例;实现函数CheeklnputType,用于对输入Pin上的媒体类型检查;实现函数Transfo-rm,用于H.264的解码操作;实现函数NonDelegafingQueryIntefface,用于暴露Filter支持的自定义接口,使应用程序可以设置解码器的参数;实现函数CompleteConnect,可以在输入Pin成功连接后取得媒体类型描述,并将输入数据的格式设置给应用逻辑控制对象;实现函数St-artStreaming和StopStreaming,可以分别调用应用控制逻辑对象的相应函数,进行流处理的初始化和反初始化操作。
(3)逻辑控制类的实现
逻辑控制类是本Filter设计的核心,框架函数和自定义接口函数的相关操作都是委托给逻辑控制类来实现的。该类实现了H.264.的解码参数的设置与解码操作,主要调用封装了H.264解码的C++类来实现。
利用ffmpeg库进行H.264解码时,需要自定义两个关键函数:open_net_file()和read_buffer_frame()。其中,open_net_file()函数完成与流媒体服务器的连接,接收指定流媒体文件的流相关信息,并返回类型为AVFormatContext结构体的值。read_buffer_frame()函数从bu-ffer缓冲中读取一帧数据,并交由库函数avcodec_decode_video()解码。
(4)自定义接口的实现
将Filter类从自定义接口类派生,并声明自定义接口的所有接口方法;然后在Filter类的实现文件中实现这些接口法,其实大都是调用应用逻辑控制类的相应函数;最后在函数NonDelegatingQueryInterface中暴露我们的自定义接口。
3.4 播放器的设计
播放器采用Directshow应用框架,采取界面、控制逻辑和数据分离的三层程序设计方法。界面类直接从标准的对话框类CDialog派生,在界面类中定义两个自定义类:数据封装类和逻辑控制类。界面类表达一种用户操作逻辑;数据封装类集中管理各种参数;逻辑控制类具体实现业务应用逻辑。采取Directshow应用框架,不必关心数据如何输入和输出,这些问题都由Filter框架负责,只需更多的关注数据处理的算法实现、效率优化等问题。采取界面、控制逻辑和数据分离的设计结构,不仅使程序框架清晰、容易被人理解,而且具有良好的移植性和扩展性。
播放器基于Filter Graph Manager构建包含网络源Filter和H.264解码Filter的Filter Graph,即可实现网络流媒体的播放。界面类实现视频显示界面与用户的操作交互,控制逻辑可以控制视频的播放、暂停、停止、解码参数设置等,数据类实现对数据的操作管理。
4 结束语
本流媒体播放器系统采用了Directshow应用框架和H.264视频编解码标准,能很好的实现网络流媒体视频的播放,具有结构清晰、良好的可扩展性与可移植性。由于WINCE系统是微软提供的嵌入式实时操作系统,提供了对Directshow的应用支持,故本系统也可以很好的移植到win-ce的嵌入式应用平台,实现嵌入式端的流媒体视频播放。同时,本流媒体播放系统也可很好地移植到视频点播系统中,因其采用高压缩比、低码率的H.264视频编解码标准。能有效减少网络负载、减小带宽,从而减轻网络对流媒体传输中所存在的丢包、抖动、延时等影响。