m3u8 文件格式详解
简介
M3U8 是 Unicode 版本的 M3U,用 UTF-8 编码。"M3U" 和 "M3U8" 文件都是苹果公司使用的 HTTP Live Streaming(HLS) 协议格式的基础,这种协议格式可以在 iPhone 和 Macbook 等设备播放。
上述文字定义来自于维基百科。可以看到,m3u8 文件其实是 HTTP Live Streaming(缩写为 HLS) 协议的部分内容,而 HLS 是一个由苹果公司提出的基于 HTTP 的流媒体网络传输协议。
HLS 的工作原理是把整个流分成一个个小的基于 HTTP 的文件来下载,每次只下载一些。当媒体流正在播放时,客户端可以选择从许多不同的备用源中以不同的速率下载同样的资源,允许流媒体会话适应不同的数据速率。在开始一个流媒体会话时,客户端会下载一个包含元数据的 extended M3U (m3u8) playlist文件,用于寻找可用的媒体流。
HLS 只请求基本的 HTTP 报文,与实时传输协议(RTP)不同,HLS 可以穿过任何允许 HTTP 数据通过的防火墙或者代理服务器。它也很容易使用内容分发网络来传输媒体流。
简而言之,HLS 是新一代流媒体传输协议,其基本实现原理为将一个大的媒体文件进行分片,将该分片文件资源路径记录于 m3u8 文件(即 playlist)内,其中附带一些额外描述(比如该资源的多带宽信息···)用于提供给客户端。客户端依据该 m3u8 文件即可获取对应的媒体资源,进行播放。
因此,客户端获取 HLS 流文件,主要就是对 m3u8 文件进行解析操作。
那么,下面就简单介绍下 m3u8 文件。
M3U8 文件简介
m3u8 文件实质是一个播放列表(playlist),其可能是一个媒体播放列表(Media Playlist),或者是一个主列表(Master Playlist)。但无论是哪种播放列表,其内部文字使用的都是 utf-8 编码。
当 m3u8 文件作为媒体播放列表(Meida Playlist)时,其内部信息记录的是一系列媒体片段资源,顺序播放该片段资源,即可完整展示多媒体资源。其格式如下所示:
#EXTM3U
#EXT-X-STREAM-INF:BANDWIDTH=150000,RESOLUTION=416x234,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/low/index.m3u8
#EXT-X-STREAM-INF:BANDWIDTH=240000,RESOLUTION=416x234,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/lo_mid/index.m3u8
#EXT-X-STREAM-INF:BANDWIDTH=440000,RESOLUTION=416x234,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/hi_mid/index.m3u8
#EXT-X-STREAM-INF:BANDWIDTH=640000,RESOLUTION=640x360,CODECS="avc1.42e00a,mp4a.40.2"
http://example.com/high/index.m3u8
#EXT-X-STREAM-INF:BANDWIDTH=64000,CODECS="mp4a.40.5"
http://example.com/audio/index.m3u8
该备用流资源指定了多种不同码率,不同格式的媒体播放列表,并且,该备用流资源也可同时提供不同版本的资源内容,比如不同语言的音频文件,不同角度拍摄的视屏文件等等。客户可以根据不同的网络状态选取合适码流的资源,并且最好根据用户喜好选择合适的资源内容。
更多详细内容,可查看:
- Creating a Master Playlist
- Adding Alternate Media to a Playlist
以上,就是 m3u8 文件的大概内容。下面,我们就对 m3u8 内容格式进行讲解。
m3u8 文件格式简解
m3u8 的文件格式主要包含三方面内容:
- 文件播放列表格式定义:播放列表(Playlist,也即 m3u8 文件) 内容需严格满足规范定义所提要求。下面罗列一些主要遵循的条件:
-
m3u8 文件必须以 utf-8 进行编码,不能使用 Byte Order Mark(BOM)字节序, 不能包含 utf-8 控制字符(U+0000 ~ U_001F 和 U+007F ~ u+009F)。
-
m3u8 文件的每一行要么是一个 URI,要么是空行,要么就是以 # 开头的字符串。不能出现空白字符,除了显示声明的元素。
-
m3u8 文件中以 # 开头的字符串要么是注释,要么就是标签。标签以 #EXT 开头,大小写敏感。
- 属性列表(Attribute Lists):某些特定的标签的值为属性列表。标签后面的属性列表以 逗号 作为分隔符,分离出多组不带空格的 属性/值 对。
属性/值 对的语法格式如下:
#EXTINF:,[]
其中:
duration
:可以为十进制的整型或者浮点型,其值必须小于或等于 EXT-X-TARGETDURATION 指定的值。
注:建议始终使用浮点型指定时长,这可以让客户端在定位流时,减少四舍五入错误。但是如果兼容版本号 EXT-X-VERSION 小于 3,那么必须使用整型。
EXT-X-BYTERANGE:该标签表示接下来的切片资源是其后 URI 指定的媒体片段资源的局部范围(即截取 URI 媒体资源部分内容作为下一个切片)。该标签只对其后一个 URI 起作用。其格式为:
#EXT-X-DISCONTINUITY
当以下任一情况变化时,必须使用该标签:
- 文件格式(file format)
- 数字(number),类型(type),媒体标识符(identifiers of tracks)
- 时间戳序列(timestamp sequence)
当以下任一情况变化时,应当使用该标签:
- 编码参数(encoding parameters)
- 编码序列(encoding sequence)
注:EXT-X-DISCONTINUITY 的一个经典使用场景就是在视屏流中插入广告,由于视屏流与广告视屏流不是同一份资源,因此在这两种流切换时使用 EXT-X-DISCONTINUITY 进行指明,客户端看到该标签后,就会处理这种切换中断问题,让体验更佳。
更多详细内容,请查看:Incorporating Ads into a Playlist
EXT-X-KEY:媒体片段可以进行加密,而该标签可以指定解密方法。
该标签对所有 媒体片段 和 由标签 EXT-X-MAP 声明的围绕其间的所有 媒体初始化块(Meida Initialization Section) 都起作用,直到遇到下一个 EXT-X-KEY(若 m3u8 文件只有一个 EXT-X-KEY 标签,则其作用于所有媒体片段)。
多个 EXT-X-KEY 标签如果最终生成的是同样的秘钥,则他们都可作用于同一个媒体片段。
该标签使用格式为:
#EXT-X-MAP:
其属性列表取值范围如下:
-
URI:由引号包裹的字符串,指定了包含媒体初始化块的资源的路径。该属性为必选参数。
-
BYTERANGE:由引号包裹的字符串,指定了媒体初始化块在 URI 指定的资源的位置(片段)。
该属性指定的范围应当只包含媒体初始化块。
该属性为可选参数,如果未指定,则表示 URI 指定的资源就是全部的媒体初始化块。
EXT-X-PROGRAM-DATE-TIME:该标签使用一个绝对日期/时间表明第一个样本片段的取样时间。
其格式为:
#EXT-X-DATERANGE:
其属性列表取值如下:
-
ID:双引号包裹的唯一指明日期范围的标识。
该属性为必选参数。 -
CLASS:双引号包裹的由客户定义的一系列属性与与之对应的语意值。
所有拥有同一 CLASS 属性的日期范围必须遵守对应的语意。
该属性为可选参数。 -
START-DATE:双引号包裹的日期范围起始值。
该属性为必选参数。 -
END-DATE:双引号包裹的日期范围结束值。
该属性值必须大于或等于 START-DATE。
该属性为可选参数。 -
DURATION:日期范围的持续时间是一个十进制浮点型数值类型(单位:秒)。
该属性值不能为负数。
当表达立即时间时,将该属性值设为 0 即可。
该属性为可选参数。 -
PLANNED-DURATION:该属性为日期范围的期望持续时长。
其值为一个十进制浮点数值类型(单位:秒)。
该属性值不能为负数。
在预先无法得知真实持续时长的情况下,可使用该属性作为日期范围的期望预估时长。
该属性为可选参数。
X-X-
前缀是预留给客户端自定义属性的命名空间。
客户端自定义属性名时,应当使用反向 DNS(reverse-DNS)语法来避免冲突。
自定义属性值必须是使用双引号包裹的字符串,或者是十六进制序列,或者是十进制浮点数,比如:X-COM-EXAMPLE-AD-ID="XYZ123"
。
该属性为可选参数。
SCTE35-CMD, SCTE35-OUT, SCTE35-IN:用于携带 SCET-35 数据。
该属性为可选参数。
END-ON-NEXT:该属性值为一个可枚举字符串,其值必须为YES
。
该属性表明达到该范围末尾,也即等于后续范围的起始位置 START-DATE。后续范围是指具有相同 CLASS 的,在该标签 START-DATE 之后的具有最早 START-DATE 值的日期范围。
该属性时可选参数。
媒体播放列表类型标签:媒体播放列表标签为 m3u8 文件的全局参数信息。
这些标签只能在 m3u8 文件中至多出现一次。
媒体播放列表(Media Playlist)标签不能出现在主播放列表(Master Playlist)中。
媒体播放列表具体标签如下所示:
-
EXT-X-TARGETDURATION:表示每个视频分段最大的时长(单位秒)。
该标签为必选标签。
其格式为:#EXT-X-MEDIA-SEQUENCE:
其中:参数
number
即为切片序列号。 -
EXT-X-DISCONTINUITY-SEQUENCE:该标签使能同步相同流的不同 Rendition 和 具备 EXT-X-DISCONTINUITY 标签的不同备份流。
其格式为:#EXT-X-ENDLIST
-
EXT-X-PLAYLIST-TYPE:表明流媒体类型。全局生效。
该标签为可选标签。
其格式为:#EXT-X-I-FRAMES-ONLY
如果播放列表设置了 EXT-X-I-FRAMES-ONLY,那么切片的时长(EXTINF 标签的值)即为当前切片 I-frame 帧开始到下一个 I-frame 帧出现的时长。
媒体资源如果包含 I-frame 切片,那么必须提供媒体初始化块或者通过 EXT-X-MAP 标签提供媒体初始化块的获取途径,这样客户端就能通过这些 I-frame 切片以任意顺序进行加载和解码。
如果 I-frame 切片设置了 EXT-BYTERANGE,那么就绝对不能提供媒体初始化块。
使用 EXT-X-I-FRAMES-ONLY 要求的兼容版本号 EXT-X-VERSION 大于等于 4。
主播放列表类型标签:主播放列表(Master Playlist)定义了备份流,多语言翻译流和其他全局参数。
主播放列表标签绝不能出现在媒体播放列表(Media Playlist)中。
其具体标签如下:
-
EXT-X-MEDIA:用于指定相同内容的可替换的多语言翻译播放媒体列表资源。
比如,通过三个 EXT-X-MEIDA 标签,可以提供包含英文,法语和西班牙语版本的相同内容的音频资源,或者通过两个 EXT-X-MEDIA 提供两个不同拍摄角度的视屏资源。
其格式为:#EXT-X-STREAM-INF:
其中:
-
URI 指定的媒体播放列表携带了该标签指定的翻译备份源。
URI 为必选参数。 -
EXT-X-STREAM-INF 标签的参数属性列表有如下选项:
-
BANDWIDTH:该属性为每秒传输的比特数,也即带宽。代表该备份流的巅峰速率。
该属性为必选参数。 -
AVERAGE-BANDWIDTH:该属性为备份流的平均切片传输速率。
该属性为可选参数。 -
CODECS:双引号包裹的包含由逗号分隔的格式列表组成的字符串。
每个 EXT-X-STREAM-INF 标签都应当携带 CODECS 属性。 -
RESOLUTION:该属性描述备份流视屏源的最佳像素方案。
该属性为可选参数,但对于包含视屏源的备份流建议增加该属性设置。 -
FRAME-RATE:该属性用一个十进制浮点型数值作为描述备份流所有视屏最大帧率。
对于备份流中任意视屏源帧数超过每秒 30 帧的,应当增加该属性设置。
该属性为可选参数,但对于包含视屏源的备份流建议增加该属性设置。 -
HDCP-LEVEL:该属性值为一个可枚举字符串。
其有效值为TYPE-0
或NONE
。
值为TYPE-0
表示该备份流可能会播放失败,除非输出被高带宽数字内容保护(HDCP)。
值为NONE
表示流内容无需输出拷贝保护。
使用不同程度的 HDCP 加密备份流应当使用不同的媒体加密密钥。
该属性为可选参数。在缺乏 HDCP 可能存在播放失败的情况下,应当提供该属性。 -
AUDIO:属性值由双引号包裹,其值必须与定义在主播放列表某处的设置了 TYPE 属性值为 AUDIO 的 EXT-X-MEDIA 标签的 GROUP-ID 属性值相匹配。
该属性为可选参数。 -
VIDEO:属性值由双引号包裹,其值必须与定义在主播放列表某处的设置了 TYPE 属性值为 VIDEO 的 EXT-X-MEDIA 标签的 GROUP-ID 属性值相匹配。
该属性为可选参数。 -
SUBTITLES:属性值由双引号包裹,其值必须与定义在主播放列表某处的设置了 TYPE 属性值为 SUBTITLES 的 EXT-X-MEDIA 标签的 GROUP-ID 属性值相匹配。
该属性为可选参数。 -
CLOSED-CAPTIONS:该属性值可以是一个双引号包裹的字符串或
NONE
。
如果其值为一个字符串,则必须与定义在主播放列表某处的设置了 TYPE 属性值为 CLOSED-CAPTIONS 的 EXT-X-MEDIA 标签的 GROUP-ID 属性值相匹配。
如果其值为NONE
,则所有的 ext-x-stream-inf 标签必须同样将该属性设置NONE
,表示主播放列表备份流均没有关闭的标题。对于某个备份流具备关闭标题,另一个备份流不具备关闭标题可能会触发播放中断。
该属性为可选参数。
-
-
-
EXT-X-I-FRAME-STREAM-INF:该标签表明媒体播放列表文件包含多种媒体资源的 I-frame 帧。
其格式为:#EXT-X-SESSION-DATA:
其中,其参数属性列表值如下可选项:
-
DATA-ID:由双引号包裹的字符串,代表一个特定的数据值。
该属性应当使用反向 DNS 进行命名,如"com.example.movie.title"
。然而,由于没有中央注册机构,所以可能出现冲突情况。
该属性为必选参数。 -
VALUE:该属性值为一个双引号包裹的字符串,其包含 DATA-ID 指定的值。
如果设置了 LANGUAGE,则 VALUE 应当包含一个用该语言书写的可读字符串。 -
URI:由双引号包裹的 URI 字符串。由该 URI 指示的资源必选使用 JSON 格式,否则,客户端可能会解析失败。
-
LANGUAGE:由双引号包裹的,包含一个语言标签的字符串。指示了 VALUE 所使用的语言。
-
- EXT-X-SESSION-KEY:该标签允许主播放列表(Master Playlist)指定媒体播放列表(Meida Playlist)的加密密钥。这使得客户端可以预先加载这些密钥,而无需从媒体播放列表中获取。
该标签为可选参数。
其格式为:#EXT-X-INDEPENDENT-SEGMENTS
如果该标签出现在主播放列表中,则其对所有媒体播放列表的所有媒体片段都生效。
-
EXT-X-START:该标签表示播放列表播放起始位置。
默认情况下,客户端开启一个播放会话时,应当使用该标签指定的位置进行播放。
该标签为可选标签。
其格式为:#EXTINF:10.0, http://example.com/movie1/fileSequenceA.ts
这样,获取资源片段的路径就是 m3u8 文件内指定的路径,即:
http://example.com/movie1/fileSequenceA.ts
- m3u8 文件中,媒体片段还可以使用相对路径表示。如下所示:
#EXTINF:10.0, fileSequenceA.ts
这表示片段文件的路径是相对于 m3u8 文件路径的,即假设当前 m3u8 的路径为:
https://127.0.0.1/hls/m3u8
,那么,片段文件 fileSequenceA.ts 的路径即为:https://127.0.0.1/hls/fileSequenceA.ts
尽管可以在 m3u8 文件中使用绝对路径指定媒体片段资源路径,但是更好的选择是使用相对路径。相对路径相较于绝对路径更轻便,同时是相对于 m3u8 文件的 URL。相比之下,绝对路径增加了 m3u8 文件内容(更多字符),增大了文件内容,同时也增大了网络传输量。
其余一些注意事项
-
有两种请求 m3u8 播放列表的方法:一是通过 m3u8 的 URI 进行请求,则该文件必须以 .m3u8 或 .m3u 结尾;
二是通过 HTTP 进行请求,则请求头Content-Type
必须设置为application/vnd.apple.mpegurl
或者audio/mpegurl
。 -
空行和注释行在解析时都忽略。
-
媒体播放列表(Media Playlist)的流资源总时长就是各切片资源的时长之和。
-
每个切片的码率(bit rate)就是切片的大小除以它对应的时长(EXTINF 指定的时长)。
-
一个标签的属性列表的同一个属性
AttributeName
只能出现一次。 -
EXT-X-TARGETDURATION 指定的时长绝对不能进行更改。通常该值指定的时长为 10 秒。
-
对于指定了 EXT-X-I-FRAMES-ONLY 且 第一个媒体片段(或者第一个尾随 EXT-X-DISCONTINUITY 的片段)其资源没有立即携带媒体初始化块的切片,应当增加使用标签 EXT-X-MAP 指定媒体初始化块获取途径。
-
使用 EXT-X-MAP 标签内含标签 EXT-X-I-FRAMES-ONLY 要求的兼容版本号 EXT-X-VERSION 要大于等于 5;只使用 EXT-X-MAP 要求的兼容版本号要大于等于 6。
-
由标签 EXT-X-MAP 声明的媒体初始化块可使用 AES-128 方法进行加密,此时,作用于 EXT-X-MAP 标签的 EXT-X-KEY 标签必须设置 IV 属性。
-
带有属性 END-ON-NEXT=YES 的标签 EXT-X-DATERANGE 必须携带 CLASS 属性,但不能携带 DURATION 和 END-DATE 属性。其余带有相同 CLASS 的标签 EXT-X-DATERANGE 不能指定重叠的日期范围。
-
日期范围如果未指明 DURATION,END_DATE,END-ON-NEXT=YES 属性时,则其时长(duration)未知,即使其设置了 PLANNED-DURATION 属性。
-
如果播放列表设置了 EXT-X-DATERANGE 标签,则必须同时设置 EXT-X-PROGRAM-DATE-TIME 标签。
-
如果播放列表设置了拥有相同 ID 属性值的两个 EXT-X-DATERANGE 标签,则对于相同的属性名,在这两个 EXT-X-DATERANGE 中对应的值必须一致。
-
如果 EXT-X-DATERANGE 同时设置了 DURATION 和 END-DATE 属性,则 END-DATE 属性值必须等于 START-DATE 属性值加上 DURATION 属性值。
-
EXT-X-MEDIA-SEQUENCE 标签必须出现在播放列表第一个切片之前。
-
EXT-X-DISCONTINUITY-DEQUENCE 标签必须出现在播放列表第一个切片之前。
-
EXT-X-DISCONTINUITY-DEQUENCE 标签必须出现在任意 EXT-X-DISCONTINUITY 标签之前。
-
m3u8 文件如果没有设置 EXT-X-PLAYLIST-TYPE 标签,那么播放列表可以随时进行更改。比如,可以更新或删除播放列表中的媒体片段。
-
每个 EXT-X-I-FRAME-STREAM-INF 标签必须包含一个 BANDWIDTH 和 URI 属性。
-
每个 EXT-X-SESSION-DATA 标签都必须包含一个 VALUE 或 URI 属性,但不能同时包含两者。
-
一个播放列表可以包含多个携带相同 DATA-ID 属性的 EXT-X-SESSION-DATA 标签。但是不能包含多个携带相同 DATA-ID 和相同 LANGUAGE 属性的 EXT-X-SESSION-DATA 标签。
-
如果设置了 EXT-X-SESSION-KEY,那么其 METHOD,KEYFORMAT 和 KEYFORMATVERSIONS 属性值必须与任意相同 URI 的 EXT-X-KEY 标签值相同。
-
如果多份备用流或者多语言流使用相同的加密密钥和格式,则应当设置 EXT-X-SESSION-KEY 标签。
-
主播放列表必须不能设置多个具有相同 METHOD,URI,IV,KEYFORMAT 和 KEYFORMATVERSIONS 属性值得 EXT-X-SESSION-KEY 标签。
附录
-
苹果官方文档
-
HTTP Live Streaming - rfc8216
-
视频内容加密封装技术研究
- https://www.jianshu.com/p/e97f6555a070