Аудио-форматы: виды, предназначение, отличия

Аудио-форматы - это разновидности файлов, предназначенные для хранения цифровых аудиоданных в компьютерной системе. Битовая компоновка аудиоданных (за исключением метаданных) называется форматом кодирования аудио и может быть несжатой или сжатой. Сжатие используется для того, чтобы уменьшить размер файла, что часто сочетается с потерей качества звука. Звук также может быть сырым битовым потоком в формате кодирования аудио, но обычно он встраивается в формат аудиоданных с определенным слоем хранения.

аудио форматы

Что они собой представляют?

Аудиофайл - это набор информации, который состоит из данных о частоте и амплитуде звука, сохраненный для последующих воспроизведений.

Аудио-форматы могут играть роль контейнера для необработанных данных, а также использовать аудиокодеки. Зачастую эти понятия смешивают и путают.

Кодек выполняет кодирование и декодирование необработанных аудиоданных, в то время как эти закодированные данные обычно хранятся в файле-контейнере. Несмотря на то что большинство форматов звуковых файлов поддерживают только один тип данных кодирования аудио (созданных с помощью аудиокодера), формат мультимедийного контейнера (например, Matroska или AVI) может поддерживать несколько типов аудио- и видеоданных.

Разновидности по объему и качеству

Форматы аудио-файлов могут быть выделены в следующие группы:

1. Несжатые – такие как WAV, AIFF, AU или необработанные PCM без заголовков.

2. Форматы со сжатием без потерь – к примеру, FLAC, AudioMonkey's (расширение файла .ape), WavPack (расширение файла .wv), TTA, ATRAC AdvancedLossless, ALAC (расширение имени файла .m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WindowsMediaAudioLossless (WMA без потерь) и Shorten (SHN).

3. Форматы с компрессией с потерями качества – например, Opus, MP3, Vorbis, Musepack, AAC, ATRAC и Windows Media Audio Lossy (сжатые WMA).

форматы аудио файлов

Основной тип

Одним из основных несжатых аудиоформатов является LPCM. По своей сути он представляет собой разновидность PCM и подобен Digital Audio (формат аудио CD-дисков). Он является разновидностью, наиболее широко используемой низкоуровневыми API и цифроаналоговыми преобразователями. Несмотря на то что LPCM может храниться на компьютере в виде необработанного звукового формата, он обычно находится в WAV-файле в Windows или в .aiff на macOS.

WAV и AIFF

Цифровой аудиоформат AIFF основан на формате файла обмена (IFF), а WAV - на аналогичной разновидности файла обмена ресурсами (RIFF). WAV и AIFF предназначены для хранения широкого спектра аудиоформатов как без потерь качества, так и с потерями. Они просто добавляют небольшой заголовок, содержащий метаданные, перед звуковой составляющей, чтобы обозначить формат аудио (например, LPCM с конкретной частотой дискретизации, битовой глубиной, порядковыми номерами и количеством каналов). Поскольку WAV и AIFF широко поддерживаются и могут хранить LPCM, они являются подходящими файловыми форматами для хранения и архивирования оригинальной записи.

формат ogg

Новое поколение

BWF (Broadcast Wave Format) - это стандартный аудиоформат, созданный Европейским радиовещательным союзом в качестве преемника WAV. Он имеет массу улучшений, в числе которых возможность хранить более надежные метаданные в файле. Это основной формат записи, используемый во многих профессиональных рабочих станциях в телевизионной и киноиндустрии. Файлы BWF включают в себя стандартизированную метку времени, которая позволяет легко синхронизировать звук с отдельным элементом изображения. Автономные многодорожечные рекордеры AETA, Sound Devices, Zaxcom, HHB Communications Ltd, Fostex, Nagra, Aaton, и TASCAM всегда используют BWF как предпочтительный формат.

Аудиоформаты со сжатием и без

Такая разновидность сохраняет данные в меньшем объеме без потери информации. Исходные данные при этом могут быть воссозданы из такой версии.

Несжатые аудио-форматы кодируют звук и тишину с одинаковым количеством битов в единицу времени. Кодирование минуты абсолютной тишины создает файл такого же размера, как и минуты музыки. Однако в сжатом формате музыка будет занимать меньший файл, чем оригинальная запись, а тишина почти не будет занимать места.

mp3 формат

Форматы аудио-файлов такого типа включают в себя FLAC, WavPack, AudioMonkey, ALAC (Apple Lossless). Они обеспечивают коэффициент сжатия около 2:1 (то есть файлы занимают половину пространства PCM). Разработка в форматах сжатия без потерь направлена ​​на сокращение времени обработки при сохранении хорошего качества звука.

Сжатый аудиоформат с потерями

Это позволяет еще больше уменьшить размер файла, удалив часть аудиоинформации и упростив данные. Это, конечно же, приводит к тому, что качество аудио-форматов становится значительно хуже. При этом используются различные методы (чаще путем использования психоакустики), чтобы удалить части звука, которые наименее влияют на воспринимаемое качество, и минимизировать количество слышимого шума, добавленного во время процесса сжатия. Популярный MP3-формат, пожалуй, выступает самым известным примером. Кроме того, AAC, который можно найти в iTunesMusicStore, также широко распространен. Большинство форматов предлагают разный диапазон степеней сжатия, обычно измеряемый в битовой скорости. Чем ниже скорость, тем меньше файл, и тем значительнее потеря качества.

цифровой аудиоформат

Какие форматы известны в настоящее время?

.3GP - формат мультимедийного контейнера, который может содержать собственные форматы AMR, AMR-WB или AMR-WB+, а также некоторые открытые разновидности.

.AAC (Advanced Audio Coding) - основан на стандартах MPEG-2 и MPEG-4. Файлы AAC обычно представляют собой контейнеры ADTS или ADIF.

.AAX (Audible.com) - формат аудиокниги, который представляет собой файл M4B с изменяемым битрейтом (обеспечивающий высокое качество), зашифрованный с помощью DRM. MPB содержит AAC- или ALAC-кодированный звук в контейнере MPEG-4.

.AIFF - стандартный формат аудиофайла, используемый Apple. Его можно считать эквивалентом WAV.

.AMR (AMR-NB) – тип аудио, используемый в основном для записи речи.

.APE (Ashland Monkey's) – формат аудио со сжатием без потери качества.

.M4A - аудио в MPEG-4, используемый Apple для незащищенной музыки, загруженной из iTunes Music Store. Аудио в файле M4A обычно кодируется AAC, хотя ALAC также может использоваться без потерь качества.

.M4P - Apple-версия AAC с патентованным управлением цифровыми правами, разработанная Apple для использования в музыке, загруженной из iTunes Music Store.

.MMF– вид аудио от Samsung, используемый в мелодии звонка. Он был разработан Yamaha и представляет собой формат мультимедийных данных.

.MP3 -формат MPEG Layer III Audio. Это самый распространенный вид звукового файла, используемый сегодня. Также он известен как MPEG-1 или MPEG-2 и представляет собой своеобразный формат аудиокодирования для цифрового звука. Он использует форму сжатия данных с потерями для кодирования информации с применением неточных приближений и отбрасывания частичных данных. Все это выполняется с целью уменьшения размеров файлов, как правило, в 10 раз, по сравнению с компакт-диском. При этом сохраняется качество звука, сравнимое с несжатым. По сравнению с цифровым аудиокачеством CD, качество сжатия MP3 обычно достигает 75-95 % по уменьшению размера. Таким образом, файлы этот типа составляют от 1/4 до 1/20 размера исходного цифрового аудиопотока. Это важно для обеспечения передачи и хранения файлов, особенно в наши дни, когда обмен информацией распространен очень широко. Основой для такого сравнения является формат цифрового аудио CD, который требует 1411200 бит/с. Обычно используемой настройкой кодирования MP3 является CBR 128 кбит/с, в результате получается файл размером 1/11 (= 9 %) от размера исходного файла качества CD, то есть с 91 % сжатием.

Сжатие MP3 с потерей работает, уменьшая (или приближая) точность некоторых частей непрерывного звука, которые считаются недоступными для слухового разрешения большинства людей. Этот метод обычно называют перцепционным кодированием или «психоакустикой». Он использует психоакустические модели для отбрасывания или уменьшения точности компонентов, менее слышимых для человеческого слуха, а затем записывает оставшуюся информацию эффективным образом.

лучший аудио формат

.MPC (ранее известный как MPEGplus, MPEG+ или MP+) - представляет собой аудиокодек с открытым исходным кодом, специально оптимизированный для прозрачного сжатия стерео/аудио с битрейтом 160-180 Кбит/с.

Формат .OGG, .OGA, MOGG - свободный открытый контейнерный тип, поддерживающий множество других видов, самым популярным из которых является аудиоформат Vorbis. Он предлагает сжатие, подобное MP3, но менее популярное. VJGG (Multi-Track-Single-Logical-StreamOgg-Vorbis) является многоканальным или многодорожечным файловым форматом OGG.

.WAV - стандартный формат файла звукового файла, используемый в основном на ПК с ОС Windows. Обычно используется для хранения несжатых (PCM) звуковых файлов качества CD, что означает, что они могут быть большими по размеру - около 10 МБ в минуту. Эти файлы могут также содержать данные, закодированные с помощью различных кодеков, для уменьшения размера (например, перевода в формат GSM или MP3). WAV-файлы используют структуру RIFF. Этот формат наиболее хорошо сохраняет качество файлов.

.WMA - формат Microsoft Windows Media Audio. Разработан с возможностями управления цифровыми правами (DRM) для защиты от копирования. Ранее был распространен так же широко, как формат OGG или MP3.

.WV - формат, созданный для видео в формате HTML5.

Для аудиокниг

.AOT Audible.com - контейнер аудиокниги с низким битрейтом с DRM, содержащий аудио, закодированное как MP3 или ACELP-речевой кодек.

.M4B - расширение аудиокниги/подкаста с кодировкой AAC или ALAC в контейнере MPEG-4. Оба формата могут содержать метаданные, включая маркеры глав, изображения и гиперссылки. Кроме того, M4B допускает «закладки» (запоминание последнего места прослушивания), в то время как M4A этого не делает.

Разработанные для определенной цели

.ACT - это сжатый аудиоформат ADPCM до 8 кбит/с. В нем происходит запись с большинства китайских MP3- и MP4-плееров и диктофонов.

.AU - стандартный формат аудиофайла, используемый Sun, Unix и Java. Аудио в файлах AU может быть в виде PCM или же сжатым с помощью кодеков μ-law, a-law или G729.

.AWB (AMR-WB) - аудио, используемое в основном для речи, аналогично спецификации ITU-T G.722.2.

.DCT – его использует программное обеспечение NCH. Это формат переменных кодеков, предназначенных для диктовки. Он имеет информацию заголовка диктовки и может быть зашифрован (как того требуют медицинские законы конфиденциальности). Можно также сказать, что это проприетарный формат программного обеспечения NCH.

.DSS - файлы Olympus DSS являются собственными форматами Olympus. Это довольно старый и плохой кодек. GSM или MP3, как правило, предпочтительнее, если их позволяет использовать рекордер. Это дает возможность хранить дополнительные данные в заголовке файла.

.DVF - это собственный формат Sony для сжатых голосовых файлов, обычно используемый диктофонами этой компании.

.GSM - разработанный для использования в телефонии в Европе. Это лучший аудио-формат для качественного звучания голоса по телефону. Хороший компромисс между размером и качеством файла. Также стоит отметить, что WAV-файлы иногда могут быть закодированы с помощью кодека GSM.

.MSV - собственный формат Sony для сжатых голосовых файлов Memory Stick.формат аудио cd дисков

Интернет-форматы

.FLAC - формат файла для Free Lossless Audio Codec, кодек сжатия аудио без потерь качества.

.IKLAX – это многодорожечный цифровой аудиоформат, позволяющий выполнять различные действия с музыкальными данными, например, при размешивании и компоновке томов.

.IVS - проприетарная версия с Digital Rights Management, разработанная компанией 3D Solar UK Ltd для использования в музыке, загружаемой из музыкального магазина Tronme, а также для интерактивной музыки и видеоплеера.

.OPUS (Internet Engineering Task Force) - формат сжатия аудиоданных с потерями качества, разработанный рабочей группой Internet Engineering Task Force (IETF) и созданный специально для интерактивных приложений реального времени через интернет. Представлен в качестве открытого типа, стандартизованного с помощью RFC 6716, его эталонная реализация предоставляется в соответствии с лицензией BSD на 3 раздела.

.RA, .RM - формат Real Audio, предназначенный для потоковой передачи звука через интернет. При этом .RA позволяет хранить файлы в автономном режиме на компьютере со всеми аудиоданными, содержащимися в самом файле. Программы для аудио-форматов этого типа в настоящее время считаются устаревшими.

Наиболее редкие

.RAW - необработанный файл может содержать аудио в любом формате, но обычно используется с аудиоданными PCM. Он используется редко, за исключением технических испытаний.

.SLN – утвержденный линейный формат PCM, используемый Asterisk. До версии v.10, стандартными типами аудио были 16-битные Signed Linea.

.Vox- чаще всего использует кодек Dialogic ADPCM (Adaptive Differential Pulse Code Modulation). Подобно другим форматам ADPCM, он сжимает данные до 4 бит. Файлы формата Vox подобны волновым файлам, за исключением того, что они не содержат информации о самом файле, поэтому форматы воспроизведения аудио могут отличаться. Для этого понадобится сначала указать частоту дискретизации кодека и количество каналов.