Знакомство с форматом h264 avc1 в файлах mp4
Знакомство с форматом h264 avc1 в файлах mp4

Перепечатано с: http://www.mworkbox.com/wp/work/314.html.

Существует два формата инкапсуляции видео MP4 H264: h264 и avc1. Эту деталь легко упустить из виду. Автор также столкнулся с этой проблемой при адаптации потокового мультимедиа LIVE555 и добавлении поддержки типа файлов mp4.

(1) Во-первых, давайте поймем принципиальную разницу между этими двумя форматами: AVC1 Описание: H.264 bitstream without start Как правило, видео, созданные с помощью перекодирования ffmpeg, не имеют начального кода 0×00000001. H264 Описание: H.264 bitstream with start Обычно формат сжатия фильмов, таких как HDVD, имеет начальный код 0×00000001. Исходный документ:http://msdn.microsoft.com/zh-cn/library/dd757808(v=vs.85).aspx (2) Во-вторых, вы можете просмотреть конкретный формат через проигрыватель VLC. После открытия видео вы можете просмотреть конкретный формат [Кодек] через меню [Инструменты]/[Информация о кодеке]. Например, информация о кодеке следующая: кодирование: H264 – MPEG-4 AVC (part 10) (avc1) кодирование: H264 – MPEG-4 AVC (part 10) (h264)

(3) Наконец, поделитесь опытом и методом преобразования видеопотока в поток h264 ES, который может быть напрямую использован live555 после демультиплексного MP4-файла ffmpeg: Для (avc1) после av_read_frame возьмите первые четыре байта в качестве длины и напрямую замените первые четыре байта на 0×00, 0×00, 0×00, 0×01, но обратите внимание, что каждый кадр может иметь несколько NAUL. :

AVPacket pkt ; AVPacket * packet = &pkt ; av_init_packet (packet ) ; av_read_frame (ctx , packet ) ; if (packet ->stream_index == 0 ) { //is video stream const char start_code [ 4 ] = { 0 , 0 , 0 , 1 } ; if (is_avc_ || memcmp (start_code , packet ->data , 4 ) != 0 ) { //is avc1 code, have no start code of H264 int len = 0 ; uint8_t *p = packet ->data ; is_avc_ = True ; do { //add start_code for each NAL, one frame may have multi NALs. len = ntohl ( * ( ( long * )p ) ) ; memcpy (p , start_code , 4 ) ; p += 4 ; p += len ; if (p >= packet ->data + packet ->size ) { break ; } } while ( 1 ) ; } }

Для другого формата (h264) просто вызовите av_bitstream_filter_filter непосредственно для каждого пакета для обработки каждого пакета:

bsfc_ = av_bitstream_filter_init ( “h264_mp4toannexb” ) ; if (pkt ->stream_index == 0 ) { //is video stream AVBitStreamFilterContext * bsfc = bsfc_ ; int a ; while (bsfc ) { AVPacket new_pkt = *pkt ; a = av_bitstream_filter_filter (bsfc , encode_ctx_ , NULL , &new_pkt. data , &new_pkt. size , pkt ->data , pkt ->size , pkt ->flags & AV_PKT_FLAG_KEY ) ; if (a == 0 && new_pkt. data != pkt ->data && new_pkt. destruct ) { uint8_t *t = ( uint8_t * ) (new_pkt. size + FF_INPUT_BUFFER_PADDING_SIZE ) ; //the new should be a subset of the old so cannot overflow if (t ) { memcpy (t , new_pkt. data , new_pkt. size ) ; memset (t + new_pkt. size , 0 , FF_INPUT_BUFFER_PADDING_SIZE ) ; new_pkt. data = t ; a = 1 ; } else a = AVERROR (ENOMEM ) ; } if (a > 0 && pkt ->data != new_pkt. data ) { av_free_packet (pkt ) ; new_pkt. destruct = av_destruct_packet ; } else if (a < 0 ) { envir ( ) << “!!!!!!!!!!av_bitstream_filter_filter failed” << “,res=” << a << “\n“ ; } *pkt = new_pkt ; bsfc = bsfc ->next ; } }

Классификация:Технические статьи | Этикетка: поток кода h264MP4 demuxmp4 ffmpeg demuxРазница между двумя форматами файлов MP4: AVC1 и H264 | Количество чтений: 2,184

Меня всегда удивляло, почему некоторые видео при декодировании отображают формат: H264, а большинство — AVC1. Я нашел это в MSDN Microsoft при поиске информации о программировании: Исходный текст: http://msdn.microsoft.com/en-us/library/dd757808(v=vs.85).aspx. FOURCC:AVC1 Описание: H.264 bitstream without start codes. FOURCC:H264 Описание: H.264 bitstream with start codes. H.264 Bitstream with Start Codes H.264 bitstreams that are transmitted over the air, or contained in MPEG-2 program or transport streams, or recorded on HD-DVD, are formatted as described in Annex B of ITU-T Rec. H.264. According to this specification, the bitstream consists of a sequence of network abstraction layer units (NALUs), each of which is prefixed with a start code equal to 0x000001 or 0x00000001. Общий смысл этого параграфа таков: Видео H.264 со стартовым кодом обычно используется для беспроводной передачи, кабельного вещания или HD-DVD. Начало этих потоков данных имеет стартовый код: 0x000001. или 0x00000001. H.264 Bitstream Without Start Codes The MP4 Container format stores H.264 data without start codes. Instead, each NALU is prefixed by a length field, which gives the length of the NALU in bytes. The size of the length field can vary, but is typically 1, 2, or 4 bytes. Общий смысл этого отрывка таков: видео H.264 без стартовых кодов в основном хранятся в файлах формата MP4. Начало его потока данных составляет 1, 2 и 4 байта, представляющие данные о длине.

«NALU» в исходном тексте — это просто базовая единица формата H.264, представляющая собой пакет данных.

http://www.mysilu.com/archiver/?tid-721741.html

Следующее воспроизведено из: https://msdn.microsoft.com/zh-cn/library/dd757808(v=vs.85).aspx.

EN

Этот контент недоступен на вашем языке, но доступен на английском языке.

H.264 Video Types

The following media subtypes are defined for H.264 video.

Subtype

FOURCC

Description

MEDIASUBTYPE_AVC1

‘AVC1’

H.264 bitstream without start codes.

MEDIASUBTYPE_H264

‘H264’

H.264 bitstream with start codes.

MEDIASUBTYPE_h264

‘h264’

Equivalent to MEDIASUBTYPE_H264, with a different FOURCC.

MEDIASUBTYPE_X264

‘X264’

Equivalent to MEDIASUBTYPE_H264, with a different FOURCC.

MEDIASUBTYPE_x264

‘x264’

Equivalent to MEDIASUBTYPE_H264, with a different FOURCC.

These subtype GUIDs are declared in wmcodecdsp.h.

The main difference between these media types is the presence of start codes in the bitstream. If the subtype is MEDIASUBTYPE_AVC1, the bitstream does not contain start codes.

H.264 Bitstream with Start Codes

H.264 bitstreams that are transmitted over the air, or contained in MPEG-2 program or transport streams, or recorded on HD-DVD, are formatted as described in Annex B of ITU-T Rec. H.264. According to this specification, the bitstream consists of a sequence of network abstraction layer units (NALUs), each of which is prefixed with a start code equal to 0x000001 or 0x00000001.

When start codes are present in the bitstream, the following media type is used:

Major type

MEDIATYPE_Video

Subtypes

MEDIASUBTYPE_H264, MEDIASUBTYPE_h264, MEDIASUBTYPE_X264, or MEDIASUBTYPE_x264

Format type

FORMAT_VideoInfo, FORMAT_VideoInfo2, FORMAT_MPEG2Video, or GUID_NULL

If the format type is GUID_NULL, no format structure is present.

When the bitstream contains start codes, any of the format types listed here is sufficient, because the decoder does not require any additional information to parse the stream. The bitstream already contains all of the information needed by the decoder, and the start codes enable the decoder to locate the start of each NALU.

The following subtypes are equivalent:

H.264 Bitstream Without Start Codes

The MP4 container format stores H.264 data without start codes. Instead, each NALU is prefixed by a length field, which gives the length of the NALU in bytes. The size of the length field can vary, but is typically 1, 2, or 4 bytes.

When start codes are not present in the bitstream, the following media type is used.

Major type

MEDIATYPE_Video

Subtype

MEDIASUBTYPE_AVC1

Format type

FORMAT_MPEG2Video

The format block is an MPEG2VIDEOINFO structure. This structure should be filled in as follows:

  • hdr: A VIDEOINFOHEADER2 structure that describes the bitstream. No color table is present after the BITMAPINFOHEADERportion of the structure, and biClrUsed must be zero.
  • dwStartTimeCode: Not used. Set to zero.
  • cbSequenceHeader: The length of the dwSequenceHeader array in bytes.
  • dwProfile: Specifies the H.264 profile.
  • dwLevel: Specifies the H.264 level.
  • dwFlags: The number of bytes used for the length field that appears before each NALU. The length field indicates the size of the following NALU in bytes. For example, if dwFlags is 4, each NALU is preceded by a 4-byte length field. The valid values are 1, 2, and 4.
  • dwSequenceHeader: A byte array that may contain sequence parameter set (SPS) and picture parameter set (PPS) NALUs.

The MP4 container might contain sequence parameter sets (SPS) or picture parameter sets (PPS) as special NAL units in file headers or in a separate stream (distinct from the video stream). When the format is established, the media type can specify SPS and PPS NAL units in the dwSequenceHeader array. If cbSequenceHeader is greater than zero, dwSequenceHeader is the start of a byte array containing SPS and PPS NALUs, delimited by 2-byte length fields, all in network byte order (big-endian). It is possible to have both SPS and PPS, only one of these types, or none. The actual type of each NALU can be determined by examining the nal_unit_type field of the NALU itself.

When this media type is used, each media sample starts at the beginning of a NALU, and NAL units do not span samples. This enables the decoder to recover from data corruption or dropped samples.

Заявление об авторских правах: Содержание этой статьи добровольно предоставлено пользователями Интернета, а мнения, выраженные в этой статье, представляют собой только точку зрения автора. Этот сайт предоставляет только услуги по хранению информации, не имеет никаких прав собственности и не принимает на себя соответствующие юридические обязательства. Если вы обнаружите на этом сайте какое-либо подозрительное нарушение авторских прав/незаконный контент, отправьте электронное письмо, чтобы сообщить. После проверки этот сайт будет немедленно удален.

Издатель: Лидер стека программистов полного стека, укажите источник для перепечатки: https://javaforall.cn/181112.html Исходная ссылка: https://javaforall.cn

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose