В этой статье рассказывается история автора об использовании FFmpeg для сжатия видео. Путем тестирования различных параметров -ctf видеофайл размером более 200 МБ был сжат до размера менее 10 МБ без какого-либо значительного снижения качества изображения. Исходный текст следующий:
Вчера друг поставил мне непростую задачу: у него на руках было видео, 1080Р, 49 секунд, больше 200 МБ, он потребовал сжать файл до размера менее 10М с сохранением качества. Что это за концепция? Рассчитанная на основе размера файла 10 Мбит/с, скорость кода составляет: 10x 8/49 = 1,6 Мбит/с. Это немного лучше, чем качество VCD (примечание: стандартная скорость передачи данных VCD составляет 1150 Кбит/с). Как говорить об «обеспечении качества»? Миссия невыполнима! Давайте будем реалистами. Не теряя существенно качества изображения, давайте посмотрим, насколько может помочь использование FFmpeg. Снимал на айфон видео 1920х1080, 33 секунды, 46,3Мб, формат кодировки H.264. Учитывая, что H.264 по-прежнему является основным форматом видео, для совместимости воспроизведения мы также выбираем H.264 при использовании FFmpeg для перекодирования.
Параметры командной строки -crf
Когда обеспечение качества изображения является приоритетом (и не слишком заботится о времени перекодирования), более уместно использовать параметр -crf для управления перекодированием. Диапазон значений этого параметра — 0–51, где 0 — режим без потерь. Чем больше значение, тем хуже качество изображения, но тем меньше размер создаваемого файла. Субъективно 18-28 — разумный диапазон. 18 считается визуально без потерь (технически, конечно, все еще с потерями), и качество выходного видео сопоставимо с входным видео.
Наша стратегия состоит в том, чтобы выбрать наибольшее значение crf, обеспечивая при этом приемлемое качество видео: если качество выходного видео хорошее, попробуйте большее значение, если оно выглядит плохо, затем попробуйте меньшее значение;
Давайте сначала выполним следующую команду:
ffmpeg -i D:\src.mov -c:v libx264 -preset veryslow -crf 18 -c:acopy D:\dest1.mp4
Это значит: перекодировать исходный файл src.mov диска D в формат H.264 на «очень медленной» скорости и сохранить его как D:\dest1.mp4. Среди них: чем медленнее скорость кодирования, указанная в параметре -preset, тем выше получаемая эффективность сжатия. И что означает -c:acopy? Поскольку битрейт звука обычно относительно небольшой, мы не будем с этим беспокоиться. Более того, перекодирование после декодирования также повредит качеству звука. Поэтому просто скопируйте аудиоданные из исходного файла непосредственно в целевой файл. исходный формат кодирования.
Совет: Хотите знать, как заполнить значение параметра после -c:v? Или какие форматы кодирования аудио и видео поддерживает FFmpeg? Запустите ffmpeg–encoders и посмотрите. Дополнительно выполните:
ffmpeg -i D:\src.mov -c:v libx264 -preset -tuneD:\dummy.mp4
Вы можете увидеть диапазон значений параметра -preset.
У меня небольшой вопрос: поскольку время ожидания нас не волнует, почему бы не указать самое медленное плацебо для -preset? Это потому, что: По сравнению с VerySlow, плацебо дает улучшение качества видео только примерно на 1% за счет чрезвычайно длительного времени кодирования. Это принцип убывающей отдачи: медленный увеличивается на 5% до 10% по сравнению со средним, медленный увеличивается на 5% по сравнению с очень медленным, увеличивается на 3% по сравнению с медленным;
Кроме того, для определенных типов исходного контента (например, фильмов, анимации и т. д.) вы также можете использовать параметр -tune для специальной оптимизации. Но если вы не уверены, какой вариант использовать, просто игнорируйте этот параметр.
Контрастный эффект
После выполнения команды перекодирования измените значение параметра -crf на 19, 20, 28 и 51 соответственно и повторно перекодируйте выходные данные в другие файлы MP4. Запишите данные и сравните их следующим образом:
Коэффициент уменьшения размера исходного файла
crf = 18 46.3 21%
crf = 19 36.7 33%
crf = 20 31.2 43%
crf = 28 26.5 83%
crf = 51 1.25 97%
Попробуйте воспроизвести эти файлы. Было обнаружено, что качество изображения файлов, сгенерированных при значении crf 18-28, не имеет очевидной разницы, тогда как качество изображения видео, сгенерированного с помощью -crf51, уже ужасно! В реальных приложениях попробуйте несколько значений crf и найдите приемлемую для вас точку баланса между качеством изображения и степенью сжатия.