вторник, 17 марта 2009 г.

Аудио и видео форматы

Аудио и видео форматы

Проблема "упаковки" видеопрограмм сопровождала все этапы развития цифровых систем передачи данных. Пропускная способность коммуникационных сетей, емкость цифровых носителей всегда отставали от желания, как самих вещателей, так и потребителей

Создание стандартов видео и аудио информации.

В 1998 г. группа специалистов международной организации по стандартизации (ISO) приступила к разработке международных стандартов кодирования и сжатия видео- и аудиоинформации.

В основу правил сжатия видеоданных была заложена идея поиска и устранения избыточной информации, не влияющей на конечное восприятие качества изображения. В первую очередь, был учтен "человеческий фактор" - психофизиологическая модель восприятия человеком видеоизображений (HVS - Human Visual Sense); в частности, тот факт, что градации яркости воспринимаются зрительным аппаратом человека значительно тоньше, чем градации цвета. Это означает, что цветовую информацию можно "загрубить" по сравнению с яркостной, при этом в субъективном восприятии качество изображения не ухудшится. То есть первоочередным направлением в построении алгоритмов всех стандартов MPEG становится отыскание и устранение информации, избыточной с точки зрения субъективного восприятия.


Аудиоформаты файлов

  • AA - закрытый формат для хранения аудиоданных, предложенный одноимённой компанией. Применяется, в основном, для записи аудиокниг, которые продаются через интернет-магазины Audible.com, iTunes Store.

    Преимущества:

  1. При прослушивании данных файлов есть возможность изменять скорость их воспроизведения, то есть земедлять или ускорять процесс прослушивания этих файлов.

  2. Есть возможность оставлять закладки при прослушивании файлов.

  3. Формат имеет средства защиты при доставке звуковых записей человеческой речи через сеть Интернет.

    Недостатки

  1. Закрытость формата

  2. Меньшая распространённость по сравнению в форматом .mp3

  • Dolby Digital (AC3) - система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.

Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.

В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных.

  • AAC - собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).

Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является наиболее качественным сжатием с потерями, который поддерживает большинство современного оборудования, в том числе портативного.

На 2008 год распространён несколько меньше, чем MP3 и другие альтернативные решения.

AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

  • AIFF

  • APE

  • AUD

  • DMF

  • DTS - формат звука, созданный Digital Theater System, конкурирующий, но схожий с Dolby Digital. Формат DTS использует меньший уровень сжатия, чем Dolby, так что теоретически он звучит лучше, что доказывают на практике диски, на которых записаны дорожки и в DD, и в DTS. Формат DTS Stereo практически идентичен Dolby Surround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. Также называется DTS Surround Sound.

DTS в домашних театрах допускает полный битрейт full bitrate (1,536 kbit/s) при этом эксперты отмечают большую прозрачность и естественность звука, чем у AC-3 (Dolby Digital).

DTS — алгоритм кодирования, изначально предназначенный исключительно для многоканального звука в формате 5.1. В отличие от Dolby Digital, где в потоке некоторые каналы могут отсутствовать вообще, в потоке DTS место для всех шести каналов всегда зарезервировано, и, при отсутствии реальной информации в них, это место просто пропадает. То есть при одинаковом битрейте в DTS запись 4.0 будет того же объема, как и 5.1.

  • FLAC (англ. Free Lossless Audio Codecсвободный аудио-кодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высокачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

  • MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов) — стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

  • MOD - формат файлов, разработанный для создания, хранения и воспроизведения музыкальных композиций на ПК Amiga. Своё название получил от того, что стал первым форматом, хранящим свои фрагменты (например, сэмплы) в других файлах (принцип модульности). Файлы этого формата имеют, как правило, расширение «.mod». Расхожее мнение о том, что на Amiga файлы имеют расширение «mod.» в начале имени, в корне не верно. В среде композиторов на Amiga существует такая традиция, но дело в том, что в AmigaOS расширения файлов абсолютно не используются, поэтому как раз на Amiga расширения (любого) может и не быть вовсе.

  • MP1 - один из трёх форматов сжатия звука, определённых в стандарте MPEG-1 [1]. Хотя MP1 поддерживается большинством современных медиаплееров, этот формат считается устаревшим. Вместо него в основном используются форматы MP2 и MP3.

Для обозначения файлов, в которых содержится только аудиоинформация формата MP1, используется расширение .mp1.

Технология сжатия MP1 использует сравнительно простую схему полосного кодирования с 32 поддиапазонами.

  • MP2

  • MP3 - ретий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.

На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

  • TTA - это свободный и бесплатный, аудио кодек, осуществляющий сжатие аудиофайлов без потерь, способный работать в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает такими же или лучшими характеристиками, как и большинство современных кодер/декодеров без потерь.
  • VQF - формат записи звука, основывается на технологии TwinVQ (Transform-domain Weighted Interleave Vector Quanization — векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Labolatories

VQF-файлы примерно на 30-35 % меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также на 30 % выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы.

  • VOX

  • VOC

  • WAV - формат записи (стерео- или моно-) звука без сжатия. Так всего одна минута стереозаписи звука сделанная с CD-качеством (частота дискретизации 44,1 КГц) содержит 60 с х 44100Гц х 2 канала = 5 292 000 отсчетов. На каждый отсчет может приходиться 8 или 16 бит. Таким образом, в варианте 8 бит на отсчет, одна минута звука займет в памяти 42 336 000 бит = 5 292 000 байт (около 5 Мб).

  • WMA

  • XM

  • ADX

Аудиоформаты без потерь
Аудиоформаты с потерями

Видео формат


Видео формат - определяет структуру видео файла, то как хранится файл на носителе информации (CD, DVD, жестком диске или канале связи). Обычно разные форматы имеют различные расширения файла (*.avi, *. mpg, *.mov и др.).

Ну прежде всего следует сказать, что главное требование к форматам для интернета - компактность. Понятно, что формат DVD не пойдет. А вот практически любой видеоролик снятый на мобильный или на цифровой фотоаппарат соответствует требованиям интернета. На такие форматы и ориентировались создатели видеохостингов.

Здесь представлены не все видео форматы, их гораздо больше. Но мы поместили главное, чтобы это по-прежнему был обзор в простом изложении, а не научный справочник.
Вообще-то, если еще короче, то есть 3 основных формата: avi, mpg и mov.

  • MPG (Moving Pictures Experts Group) - Видеофайл, в котором содержится видео, закодированные:
  1. Mpeg1 - стандарт разработан в 1992 году с учетом возможностей 2-х скоростных CD-ROM и 486 компьютеров.

  2. Mpeg2 - стандарт принят в 1994 году. Первично разрабатывался для цифровой передачи видео вещательного качества. Используется в DVD, цифровом TV и HDTV.

  3. Mpeg3 - для телевидения высокой чёткости (HDTV), но позже стал частью стандарта Mpeg2 и отдельно теперь не упоминается.

  4. Mpeg4 (распространено краткое написание MP4) - стандарт рассчитан на очень низкие потоки данных для применения в видеотелефонах, мультимедийной электронной почте, электронных информационных изданиях и т.п.

  • AVI (Audio-Video Interleaved) разработан Microsoft для хранения и воспроизведения видеороликов, представляет собой контейнер, в котором может быть что угодно, начиная от MPEG1 и заканчивая MPEG4. Он может содержать в себе потоки 4 типов - Video, Audio, MIDI, Text. Причем видеопоток может быть только один, тогда как аудио - несколько. В частности, AVI может содержать и только один поток - либо видео, либо аудио. Сам формат AVI не накладывает совершенно никаких ограничений на тип используемого кодека, ни для видео, ни для аудио - они могут быть любыми. Таким образом, в AVI файлах могут совершенно спокойно сочетаться любые видео- и аудиокодеки.
  • MOV - Формат Apple Quicktime, может содержать любой кодек, CBR или VBR. Обычно у них расширение .QT или .MOV. Заметьте, что поскольку MPEG4 Group выбрала QuickTime в качестве рекомендованного формата для MPEG4, их MOV файлы идут с расширением .MPG или .MP4 (Интересно, что видео и аудио потоки в этих файлах - настоящие MPG и AAC файлы. Вы даже можете извлечь их, используя опции -dumpvideo и -dumpaudio.).
  • RealVideo формат, созданный компанией RealNetworks. RealVideo используется для живой телевизионной трансляции в Интернете. Например, телекомпания CNN одной из первых стала вещать в Сети. Обладает небольшим размером файла и самым низким качеством, зато вы, не особенно загружая свой канал связи, сможете посмотреть последний выпуск теленовостей на сайте выбранной вами телекомпании. Расширения RM, RA, RAM.
  • ASF (Active Streaming Format) - потоковый формат от Microsoft.
    Они разработали два варианта ASF, v1.0 и v2.0. v1.0 используется их медиа средствами (Windows Media Player и Windows Media Encoder) и сильно засекречены. v2.0 опубликована и запатентована. Конечно они различаются, совсем нет никакой совместимости (это просто другая правовая игра). MPlayer поддерживает только v1.0, поскольку никто никогда не видел v2.0 файлов. Заметьте, что ASF файлы теперь появляются с расширениями .WMA или .WMV.
  • WMV (Windows Media Video) - Видеофайл, записанный в формате Windows Media.
  • DivX (Digital video express) - кодек стандарта Mpeg4. С Версии 5 стал платным (для кодирования).
  • Xvid (ранее XviD) - библиотека сжатия видео стандарта Mpeg4.
    Xvid является основным конкурентом кодека DivX Pro (Xvid это DivX наоборот). В противоположность кодеку DivX - проприетарному программному обеспечению, разработанному компанией DivX, Inc., Xvid это свободная программа, распространяемая под лицензией GNU General Public License.
  • MP4 - это короткое написание стандарта Mpeg4, рассчитан на очень низкие потоки данных для применения в видеотелефонах, мультимедийной электронной почте, электронных информационных изданиях и т.п.
  • 3gp (сокращение от англ. 3rd generation (mobile) phone - (мобильные) телефоны третьего поколения);
    видеофайлы для мобильных телефонов 3-го поколения. Некоторые современные мобильные телефоны (не обязательно 3G) имеют функции записи и просмотра аудио и видео в формате .3GP.
    Этот формат - упрощённая версия ISO 14496-1 Media Format, который похож на MOV, используемый QuickTime.
    3gp сохраняет видео как Mpeg4 или H.263. Аудио сохраняется в форматах AMR-NB или AAC-LC.
    Готовые видео ролики в формате 3gp имеют малый размер по сравнению с другими форматами видео, но к сожалению это сильно отражается на качестве (оно очень низкое).
  • FLV (Flash Video) - формат файлов, используемый для передачи видео через Интернет. Используется такими сервисами, как YouTube, Google Video, RuTube, Tube.BY, Муви, Obivu и другими. Хотя описание формата контейнера было открыто, кодеки защищены патентами, и остаются собственническими.
    Файлы в формате FLV можно просматривать в большинстве операционных систем, поскольку он использует широко распространённый Adobe Flash и плагины к большинству браузеров, а также поддерживается многими программами для воспроизведения видео, например, MPlayer, VLC media player, Media Player Classic) и другими программами, работающими с помощью DirectShow. Mpeg7 - это не логическое продолжение Mpeg4, просто разработка той же группы MPEG (Moving Picture Experts Group) для интернета. Здесь вводится специализированный язык DDL (Description Definition Language - язык описания определений).
    Основная цель применения нового стандарта - эффективный поиск мультимедийной информации аналогично тому, как сейчас мы осуществляем поиск текстов по ключевым словам или фразе. Как пример:
  • музыка - сыграв несколько нот на клавиатуре, можно получить список музыкальных произведений, которые содержат такую последовательность звуков;
  • графика - нарисовав эскиз на экране, получим набор рисунков, содержащих подобный фрагмент;
  • видео - задав соответствующий объект и его движение, получим набор видео или анимационных роликов, в которых данный объект присутствует.




Комментариев нет:

Отправить комментарий