Із запропонованого списку форматами аудіо файлів є. Що таке розширення AUDIO? Як виправити проблеми з відкриттям файлів AUDIO

Відразу обмовимося, що стаття говорить ТІЛЬКИ про загальні характеристики і не включатиме деякі подробиці. У майбутньому Лайфхакер проведе власне об'єктивне дослідження. А сьогодні спробуємо узагальнити вже так чи інакше відомий досвід.

Є аналог та цифра.

Аналог – добре, але недовговічно та незручно. Тому аналогові носії, незважаючи на високі продажі вінілу, не повернуться.

Аудіоцифр може бути трьох основних типів:

у форматі, що не використовує стиснення;
у форматі, який використовує стиск без втрат (lossless);
у форматі, що використовує стиск із втратами (lossy).

На графіках - хороший AudioCD, стислий OGG із змінним бітрейтом 350 кбіт/с та MP3 з використанням Lame. Чим нижче розташовується графік, тим ближче звучання до оригіналу. Виходить дуже цікава картина. Незважаючи на те, що MP3 має явно зрізані високі частоти, на відміну від OGG, в якому видно завал нижче 2 кГц.

Частотно-часовий розподіл звуку говорить про не менш цікаві речі. При постійному бітрейті 320 кбіт/с MP3 майже збігається з оригінальним записом. Здається, тепер усе стає на свої місця. Але ... Насправді все ще більше заплутується.

Навіщо взагалі користуватися lossy, коли є доступний lossless

Здоровий глузд.

Справа в тому, що більшість аналогових записів не містить тієї кількості інформації, яку необхідно було б зберігати у високоякісних форматах. Не варто забувати, що рідною частотою дискретизації для CD є 44,1 кГц, квантування – лише 16 біт.

Попередні графіки непогано демонструють високу точність передачі MP3. Адже для аудіокасети, магнітної стрічки (якщо, звичайно, це не майстер-тейп) характеристики AudioCD недосяжні. Та й для масового студійного обладнання можливість запису аналогового звуку, що відповідає AudioCD, з'явилася нещодавно. Немає жодного сенсу оцифровувати в FLAC (і тим більше в WAV) концертний запис або платівку з доцифрової епохи, особливо виготовлені з магнітних носіїв. Вони не містять тих спектрів і кількості інформації, які можуть зберігати контейнери без стиснення.

Що змінилося сьогодні

Рідкісний звукорежисер робить цифровий майстер-запис (з яким потім проводиться розмноження на фізичні носії), використовуючи сучасні технології на повну котушку. Тому шанс того, що 24-бітний трек насправді лише 16-бітний, вкрай високий.

Аналоговий високоякісний запис на високоякісному обладнанні сьогодні зустріти ще складніше – якщо лише у фанів подібного звучання. Таким, наприклад, є Джек Уайт, екс-лідер гурту White Stripes. При цьому частина його записів відноситься до варіацій lo-fi, і шукати там помірні звукові характеристики доріжки стає своєрідним задоволенням для гурманів.

Якщо уявити ідеальний вихідник, то тільки тренований слух або прослуховування на якісному аудіообладнанні дозволить знайти стислий файл. І вже спираючись на це (і), варто зробити наступний висновок:

Необхідним і достатнім для середньоцінового обладнання є AAC, без якого (і за відсутності вихідних кодів, які можна кодувати в AAC) - MP3 з постійним бітрейтом 320 кбіт/с, створений за допомогою кодека Lame 3.93 (рекомендовані ключі при декодуванні: cbr -b320 -q0 -k -ms).

Виняток становлять записи, спочатку отримані у високій якості, скажімо, записані на DVD-Audio, SACD або записи, спочатку зібрані в DSD (або аналогічному форматі) з високим бітрейтом.

Хоча деякі особливості у lossless є. І про них ми розповімо наступного разу.

На сьогоднішній день існує близько трьох десятків найпоширеніших цифрових аудіоформатів. Навіщо потрібно створювати таку кількість видів звукових файлів для зберігання одного типу контенту і як з усім цим керуватися ви дізнаєтеся з цього матеріалу.

Вступ

Напевно, багато користувачів воліють використовувати домашній комп'ютер не тільки як робочий конячок, але і як мультимедійний центр, на якому можна переглядати фільми або сімейні фотографії, а також слухати улюблену музику. Хоча, напевно, для прослуховування музичних композицій більш підходять компактні цифрові плеєри або мобільні телефони, але на відміну від них, комп'ютер вміє не тільки програвати музику.

Який би великий обсяг вбудованої пам'яті не мав ваш музичний плеєр, швидше за все, зберігати в ньому всю фонотеку навряд чи вдасться. Більше того, за допомогою ПК можна створювати, редагувати, впорядковувати та шукати музику. Також не варто забувати, що на сьогоднішній день існує близько трьох десятків поширених цифрових аудіо форматів, а більшість плеєрів далеко не всеїдні, і здатні відтворювати лише деякі з них.

То навіщо ж потрібно створювати таку кількість музичних форматів для зберігання одного типу контенту? Вся річ у тому, що звук у переважній більшості випадків зберігається у «стислому» вигляді, оскільки одна хвилина стиснутої композиції займає на жорсткому диску близько 10 Мб. З одного боку це начебто не багато, а з іншого, якщо ви меломан і ваша колекція складається з кількох сотень або навіть тисяч пісень, стає ясно, що звук необхідно стискати, для зменшення займаного ним місця на електронних носіях інформації.

Для стиснення музичних файлів використовуються різні спеціальні алгоритми, які згодом визначають структуру та особливості представлення звукових даних або так звані цифрові аудіоформатифайлів. Усі звукові формати можна розбити на три групи: аудіоформати без стиснення, зі стисненням без втрат та із застосуванням стиснення із втратами.

Без стиску

Одним із найпоширеніших форматів, що належать до цього типу, можна сміливо вважати найвідоміший WAV. Звук у файлах з таким розширенням зберігається без будь-якого стиснення та змін. Правда місця для зберігання стиснених файлів потрібно набагато більше і тому найбільш широке застосування WAV знаходить лише у професійних аудіо та відео додатках, де звук перед обробкою не повинен мати втрати як. Зберігання ж звичайних музичних композицій у вигляді є невиправданою марнотратством.

Для відтворення WAV-файлів вам не знадобиться якесь спеціальне програмне забезпечення, оскільки цей формат розуміють всі медіаплеєри, включаючи і вбудований в систему Windows штатний програвач аудіофайлів Windows Media.

Ще одним форматом, що використовується для зберігання нестиснутого аудіо, про який варто згадати, є розробка компанії Apple під назвою AIFF (Audio Interchange File Format). Як ви, напевно, вже здогадалися, найчастіше він використовується у комп'ютерах Macintosh під керуванням систем Mac OS X.

Стиснення без втрат (lossless)

Алгоритми, що здійснюють стиснення аудіофайлів без втрат, працюють за принципом звичайних архіваторів. Забезпечуючи не найвищий рівень стиснення (від 40 до 60%), при цьому практично не впливають на якість звуку. Також варто відзначити, що в цьому випадку закодовані дані можна повністю відновити до первісного вигляду. Тому використання стиснення без втрат найчастіше застосовується у випадках, коли важливо зберегти ідентичність стиснутих даних оригіналу.

Найбільш популярними аудіоформатами у цій групі є FLAC (Free Lossless Audio Codec), APE (Monkey's Audio), WMA (Windows Media Lossless) та ALAC (Apple Lossless Audio Codec). У кожного з них є свої плюси та свої мінуси. Наприклад, кодек APE дає дещо більший виграш у стиску, а FLAC є більш поширеним. Загалом же, всі справжні меломани зберігають свої музичні колекції саме в lossless-форматах, оскільки в них не видаляються жодні дані з аудіопотоку, а створені за допомогою цих кодеків файли можна прослуховувати навіть на високоякісній звуковій апаратурі.

Для відтворення стислих без втрат форматів, як правило, використовуються сторонні плеєри (крім WMA), такі як MPlayer, foobar, AIMP, Winamp, VLC та інші, тому що в них вже вбудовані всі кодеки. Іншим варіантом є окреме встановлення пакета додаткових кодеків (наприклад, K-Lite), після чого прослуховування файлів у lossless-форматі стає доступним практично з будь-якого аудіопрогравача.

Стиснення із втратами

Це найпопулярніша група алгоритмів, які забезпечують максимальний (до 10 разів і навіть більше) ступінь стиснення звуку. Щоправда на відміну від попередніх форматів, тут аудіофайл втрачає як, а наскільки сильно - безпосередньо залежить від ступеня його стиснення.

Для визначення якості оцифрованого звуку найчастіше застосовується такий показник, як бітрейт- Швидкість звукового потоку, що вийшла після стиснення і вимірювана в кілобітах в секунду (kbps). Як ми вже говорили, в середньому хвилина стисненого звуку займає близько 10 Мб, що відповідає аудіопотоку приблизно 1400 кбіт/c. Після кодування з втратами його бітрейт може знизитися до 56 кбіт/с. При цьому варто враховувати, що для збереження природного звучання швидкість потоку повинна бути не нижче 192 або 256 кбіт/c. Якщо ж бітрейт потоку становить 320 кбіт/c і більше, то різниця в звучанні більшості людей між стисненим і несжатым аудіо практично зникає.

Найпопулярнішим форматом тут однозначно вважається знаменитий і улюблений MP3, розроблений фахівцями відомої групи MPEG (Moving Picture Experts Group). Найбільш широко він використовується для кодування аудіофайлів, що розміщуються в інтернеті та різних файлообмінниках через можливість істотно зменшити розмір даних, що передаються, що при низькій швидкості підключення до мережі немаловажно.

Іншими відомими форматами цієї серії є AAC (Advanced Audio Coding) і OGG Vorbis. У цьому, будучи менш популярними, їх алгоритми стискування досконаліше, ніж в основного конкурента. Так, при однаковому розмірі файлу, вони забезпечують кращу якість звукового ряду в порівнянні з MP3. Ще одна серйозна перевага даних форматів – можливість кодування до 48 звукових каналів у AAC та 255 у OGG, проти всього двох у MP3.

Варто відзначити, що і формат WMA - власність компанії Microsoft, спочатку створювався для зберігання та трансляції аудіоінформації у стислому вигляді із втратами, а кодування без втрати якості додалося до нього нещодавно, починаючи з Windows Media Audio 9.1. Номінально цей формат забезпечує кращий ступінь стиснення, ніж MP3, що дає можливість розробникам протиставляти його як альтернативу конкуруючим алгоритмам AAC і OGG. Правда широкому поширенню WMA заважає його закритість та обмеженість застосування на багатьох платформах (операційних системах). Та й вбудована підтримка цифрової системи управління авторськими правами (DRM) не додає популярності дітищу Microsoft.

Незважаючи на те, що MP3 програє своїм конкурентам як за ефективністю стиснення, так і за якістю звучання, він досі продовжує залишатися найпопулярнішим аудіоформатом. Секретом такого успіху, напевно, можна назвати банальну інерцію мислення, оскільки за багато років до нього звикла більшість користувачів, виробників апаратури та розробників програмного забезпечення. Саме тому MP3-файли можна прослухати взагалі на всьому, що здатне програвати цифровий звук - мобільний телефон, персональний комп'ютер з будь-якою популярною операційною системою, портативний аудіоплеєр, сучасний музичний центр або DVD-програвач.

І хоча інші формати поки що такою підтримкою похвалитися не можуть, у них теж все не так уже й погано. Так AAC знайшов широку підтримку з боку компанії Apple, яка використовує його алгоритми для зберігання аудіокниг, подкаст, музичних композицій у магазині iTunes та рінгтонів. Так що для шанувальників комп'ютерів Macintosh, планшетів iPad, смартфонів iPhone та плеєрів iPod цей формат можна вважати "рідним".

Файли WMA легко відтворюються на будь-якому ПК під керуванням операційної системи Windows, яка є найпоширенішою у світі. При цьому багато виробників портативних аудіоплеєрів і стаціонарних програвачів оптичних дисків також підтримують цей формат. А ось для прослуховування файлів у форматах OGG Vorbis або AAC у Windows-системах доведеться встановити спеціальні кодеки. Хоча це не є проблемою. Встановлення вищезгаданого безкоштовного пакету кодеків K-Lite Codek Pack дозволить програвати на вашому комп'ютері за допомогою улюбленого програвача практично будь-які звукові файли.

Висновок

Насамкінець давайте подивимося, який набір програмного забезпечення вам знадобиться, щоб перетворити свій домашній комп'ютер на універсальний інструмент для роботи з аудіофайлами. Для зручності розділимо всі додатки на кілька основних груп.

Плеєри - служать для безпосереднього відтворення звукових файлів, а також часто використовуються для каталогізації та впорядкування музичних колекцій. Їх кількість настільки величезна, що й не порахувати. Але все-таки, щоб трохи полегшити вам вибір, наведемо, на наш погляд, дванадцять найпопулярніших: Windows Media Player (вбудований в систему), Winamp, KMPlayer, iTunes, GOM Player, JetAudio, VLC Media Player (VideoLAN), AIMP, BSPlayer, Real Player, WinDVD та Foobar2000.

Конвертори - Додатки, здатні здійснювати перекодування з одного формату в інший. Для цього можна використовувати більшість популярних плеєрів, не вдаючись до використання спеціальних програм. Хоча в деяких випадках без цього не обійтись.

Ріпери (грабери) - дозволяють витягувати цифрову звукову інформацію з оптичних носіїв (Audio-CD, DVD) та зберігати її у різних форматах. Незважаючи на численність усіляких грабберів, на цій ниві найбільшу популярність здобула додаток EAC (Exact Audio Copy), що дозволяє робити найточніші копії дисків. До інших популярних ріпперів відносяться: Audiograbber, Reaper, Easy CD-DA Extractor та інші.

Редактори - програми, призначені для створення, запису та редагування звукових даних. У цій групі існують досить прості програми, що дозволяють зробити елементарні операції з аудіофайлом (вирізати, обрізати, об'єднати, нормалізувати і т.д.), так і справжні монстри для професійної роботи зі звуком. Серед невеликих редакторів можна виділити додаток Nero WaveEditor за його скромний розмір і при цьому досить високу функціональність. До найпопулярніших професійних рішень обробки звуку відносяться: Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro та інші.

Звичайно, чисто теоретично всі ці необхідні функції може поєднувати в собі лише одна програма, але на практиці використовувати єдиний додаток для всіх завдань не завжди зручно. Та й добитися від однієї програми якісного виконання всіх завдань практично неможливо.

У будь-якому випадку набагато зручніше мати під рукою кілька спеціалізованих додатків, які і місця займають менше, і із своїми завданнями окремо справляються краще.

Є основним аудіо форматом для багатьох систем відтворення цифрового звуку і використовується як стандартний формат звукових файлів в персональних комп'ютерах. До того ж, він має солідний набір специфікацій, що добряче поповнився останнім часом. Його повна назва – Microsoft RIFF/WAVE – Resource Interchange File Format/Wave – формат файлів передачі ресурсів/хвильова форма, і створений він був інженерами Microsoft та Intel. У свою чергу WAV розшифровується як Waveform Audio File Format.

WavPack (розширення. WV)

WavPack також включає унікальний «гібридний» режим, який надає всі переваги стиснення без втрат з додатковим бонусом: замість створення одного файлу, в цьому режимі створюється відносно невеликий файл високої якості зі втратою (.wv), який може програватися сам собою, а також файл «корекції» (.wvc), який (у поєднанні з попереднім.wv) дозволяє повністю відновити оригінал. Для деяких користувачів це означає, що їм ніколи не доведеться вибирати між стиском без втрат і втрати якості.

Формат має дуже хорошу підтримку у програвачах. Крім, зрозуміло, плагін для Winamp з офіційного сайту кодеку http://www.wavpack.com можна закачати плагін для Adobe Audition (!) і Nero Burning Rom. Є відмінний плагін для XMMS – аналог Winamp для Linux. Крім того, існує проект з розробки DirectShow фільтрів для WavPack – це дозволить використовувати формат у будь-якій Windows-програмі, у тому числі і Windows Media Player. Завантажити останню версію можна звідси. Для WavPack існує фронтенд від сторонніх розробників. Його хитаємо тут.

З технічної точки зору також причепитися нема до чого. Підтримується багатоканальний звук, 32-бітова роздільна здатність аудіопотоку, частота семплювання – до 192 кГц (!).

Формат, як і вихідні коди програми для стиснення, є відкритими. На превеликий жаль кодер скомпільований лише для платформи Windows, проте завжди залишається можливість самостійно перекомпілювати доступні вихідні коди для своєї операційної системи.

Сайт, як і сам кодек, регулярно оновлюються, що не може не радувати.

DTS – Digital Theater System, по суті – це Dolby Digital, а точніше його конкурент. Формат DTS використовує мінімальний рівень стиснення, ніж Dolby, тому фактично він звучить краще, що доводять на практиці DVD диски, на яких записані доріжки в DTS або в DD форматі. DTS у домашніх кінотеатрах використовується максимальний бітрейт 1,536 kbps (full bitrate), такий звук якісніший, ніж AC-3 format від Dolby Digital. DTS - використовує 6 вільних аудіо доріжок і підтримує систему розподілу звуку 7.1, при такому бітрейті DTS 4.0 - звучатиме також об'ємно, як і "Долбі" 5.1.

Windows Media Audio (WMA)

Формат файлу, що ліцензується, розроблений компанією Microsoft для зберігання та трансляції аудіо-інформації.

Кодек є частиною комплекту Windows Media Audio. Він безкоштовний, проте формат, як і програма для кодування є закритими. Очевидно, версія існує тільки для платформи Windows.

В принципі, WMA Lossless підтримує всі необхідні функції: теги, високі частоти семплювання, багатоканальний звук (включаючи 7.1), трансляцію аудіо через мережу тощо. Крім того, вбудована підтримка декодера в Windows Media Player позбавляє користувача необхідності скачувати що-небудь з Інтернету для відтворення музичного файлу.

MP3 - (формат кодування звукової доріжки MPEG) - формат файлу, що ліцензується, для зберігання аудіо-інформації.

Найпопулярніший формат стиснення на сьогоднішній день. Формат МР3 (MPEG Layer 3) був розроблений після ряду проміжних форматів інститутом Фраунхофера в Німеччині. Взагалі, формат.МР3 заснований на обмані людського вуха. Після деяких досліджень з'ясувалося, що людському слуху властиво адаптуватися до появи нових звуків, що виявляється у підвищенні порога чутності. Тому одні звуки здатні маскувати (тобто робити суб'єктивно нечутними) інші. Ось і в цьому форматі частина звуків, які, як вважає відповідна теорія, робляться нечутними, просто забираються із загального звучання. Після чого «напівфабрикат», що вийшов, кодується за методом Хоффмана. Обов'язково слід враховувати те, що у форматі МР3 програми, що стискають звук з оригінального, не стандартизовані, тобто кожен грамотний програміст може реалізувати свою схему стиснення. А стандартам підкоряються лише декодери, що призводить до того, що якість відтворення формату МР3 далеко не завжди залежить від програвача, що програє цей файл. У зв'язку з різними здібностями та уподобаннями реалізаторів різних кодерів, одні з них краще справляються з симфонічною музикою, інші – з роком та металом, треті – з репом та рейвом тощо.

JointStereo, що є однією з особливостей МР3 означає, що замість кодування стерео як двох незалежних каналів проводиться кодування т.зв. центрального каналу та різниці, що відрізняє його від вихідних стереоканалів. Досить багато складових звуку в стереоканалах однакові, і їхнє кодування в загальному каналі дозволяє вивільнити додаткову смугу для більш детального кодування різниці, що призводить до деякого поліпшення якості.

Обов'язково слід згадати і про Variable Bit Rate, або VBR. Це означає, що кодер змінює ступінь стиснення на льоту, залежно від характеру звуку. Такий підхід призводить до зменшення підсумкового розміру файлу або, при збільшенні вимог до якості, при тому розмірі файлу дозволяє домогтися кращого звучання.

Кодек MP3 Pro, що з'явився в 2001 році, був створений компанією Coding Technologies спільно з Thomson Multimedia. У його основі лежить МР3. У ньому використовується технологія SBR (Spectral Band Replication), за рахунок чого кодек забезпечує високу якість на низьких бітрейтах. Однак якість кодування на середніх і високих швидкостях передачі даних поступається якістю багатьох інших кодеків. У результаті MP3 Pro застосовується більше для трансляцій в Інтернеті та демонстрацій фрагментів нових музичних композицій.

Vorbis - вільний формат стиснення звуку із втратами, що офіційно з'явився влітку 2002 року. Психоакустична модель, що використовується в Vorbis, за принципами дії близька до МР3 і подібним, проте математична обробка та практична реалізація цієї моделі суттєво відрізняються, що дозволило авторам оголосити свій формат незалежним від усіх попередників. Для зберігання аудіо даних у форматі Vorbis найчастіше застосовується медіаконтейнер Ogg, такий файл зазвичай має розширення.ogg і називається подвійним ім'ям Ogg Vorbis.

На 2006 рік поширений значно менше, ніж MP3. За всілякими оцінками є другим за популярністю форматом компресії звуку із втратами. Широко використовується в комп'ютерних іграх та файлообмінних мережах для передачі музичних творів.

Vorbis застосовує більш якісну психоакустичну модель, ніж конкуренти, що дає кращу чіткість відтворення при рівній щільності потоку.

Формат не обмежує користувача лише двома аудіоканалами (стерео – лівий та правий). Він підтримує до 255 окремих каналів із частотою дискретизації до 192 кГц і розрядністю до 32 біт (чого не дозволяє жоден інший формат стиснення зі втратами), тому Vorbis чудово підходить для кодування 6-канального звуку DVD-Audio.

До того ж, формат Vorbis – «sample accurate». Це гарантує, що звукові дані перед кодуванням та після декодування не матимуть зсувів, додаткових чи втрачених семплів. Це легко оцінити, коли ви кодуєте non-stop музику (коли один трек поступово переходить до іншого) - у результаті збережеться цілісність звуку.

Формат спочатку розроблявся із можливістю потокового мовлення. Це дає формату досить корисний побічний ефект – в одному файлі можна зберігати кілька композицій із власними тегами. При завантаженні такого файлу в плеєр повинні відобразитися всі композиції, ніби їх завантажили з різних файлів.

Формат має гнучку систему тегів. Заголовок тегів легко розширюється і дозволяє включати тексти будь-якої довжини та складності (наприклад, текст пісні), що перемежуються зображеннями (наприклад, фотографія обкладинки альбому). Текстові теги зберігаються в UTF-8, що дозволяє писати кількома мовами одночасно і виключає можливі проблеми з кодуванням.

Ogg Vorbis за замовчуванням використовує змінний бітрейт, при цьому значення останнього не обмежені якимись жорсткими значеннями, і він може змінюватись навіть на 1 kbps. При цьому варто зауважити, що формат жорстко не обмежений максимальним бітрейтом, і при максимальних налаштуваннях кодування він може варіювати від 400 kbps до 700 kbps. Таку ж гнучкість має частота дискретизації - користувачам надається будь-який вибір у межах від 2 кГц до 192 кГц.

Vorbis був розроблений спільнотою "Xiphophorus" для того, щоб замінити всі платні запатентовані аудіо формати. Незважаючи на те, що це наймолодший формат з усіх конкурентів МР3, Ogg Vorbis має повну підтримку на всіх відомих платформах (Microsoft Windows, GNU/Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS та ін.), а також велика кількість апаратних реалізацій. Популярність сьогодні значно перевершує всі альтернативні рішення.

FLAC (англ. Free Lossless Audio Codec – вільний аудіокодек без втрат) – популярний вільний кодек для стиснення аудіо. На відміну від кодеків із втратами Ogg Vorbis, MP3 та AAC, не видаляє жодної інформації з аудіопотоку та підходить як для щоденного прослуховування, так і для архівування аудіоколекції. На сьогодні формат FLAC підтримується багатьма аудіо-додатками.

FLAC є членом сімейства кодеків, які розробляють Xiph.Org. До речі, до нього входить відомий ogg vorbis – один із найкращих lossy-алгоритмів стиснення музики. Як контейнер для аудіоданих використовується, зрозуміло, OGG (файли з розширенням.ogg) та ще один open-source контейнер – Matroska (файли з розширенням.mka).

Відразу варто відзначити повну відкритість як формату, і алгоритму FLAC. Вони не патентовані, тому можуть абсолютно безкоштовно використовуватися в будь-яких програмах. Саме цим обумовлена широка підтримка FLAC у програвачах – будь-який серйозний програвач має плагін для FLAC. Крім цього є апаратні mp3-плеєри з підтримкою кодека FLAC.

FLAC підтримує теги власного формату FlacTags. Є можливість кодування багатоканального звуку – серйозна перевага, порівняно з Monkey's Audio. Формат підтримує будь-які частоти семплювання в діапазоні від 1 Гц (!) До 65,535 Гц. Розрядність аудіо від 4-х (!) До 32-х біт.

Вважається, що в порівнянні з рештою lossless-кодеків FLAC найбільш ефективно витрачає ресурси системи при розкодуванні (відтворенні) аудіо. На жаль, це досягається рахунок значного підвищення часу кодування (стиснення).

Сайт FLAC регулярно оновлюється, виходять нові версії кодеку. Загалом, за активністю розвитку FLAC безумовно лідирує. Цілком можливо, що в майбутньому це зробить його основним форматом.

AAC (англ. Advanced Audio Coding) - формат аудіо-файлу з меншою втратою якості при кодуванні, ніж MP3 за однакових розмірів. Формат також дозволяє стискати без втрати якості вихідного коду (профіль ALAC AAC).

AAC спочатку створювався як наступник MP3 з покращеною якістю кодування. Формат AAC, офіційно відомий як ISO/IEC 13818-7, побачив світ у 1997 як нова, сьома, частина сім'ї MPEG-2. Існує також формат AAC відомий як MPEG-4 Частина 3.

Цей тип файлів є стандартним для систем Apple Macintosh та систем обробки звуку, побудованих на його основі. Apple AIFF розшифровується як Audio Interchange File Format - формат файлу обміну звуком, він у чомусь схожий на WAV. Його особливістю є те, що він дозволяє розміщувати разом зі звуковою хвилею додаткову інформацію, зокрема сампли WaveTable (приклади звучання інструментів разом із параметрами синтезатора), що покращує якість підсумкового результату. Хоча зараз комп'ютери Apple здатні відтворювати файли практично будь-яких форматів, у тому числі і МР3.

Іноді компанії створюють свої пропрієтарні формати, які підтримують лише їхні плеєри. Apple Lossless був створений однойменною компанією для плеєра iPod як альтернатива FLAC, що використовується на інших плеєрах. Якщо ви не використовуєте iPod, можете ніколи не зіткнутися з цим форматом.

Monkey's Audio (APE)

Monkey's Audio або APE (від англійської ape - Мавпа) – популярний формат кодування цифрового звуку без втрат. Розповсюджується безкоштовно разом із відкритим вихідним кодом та набором програмного забезпечення для кодування та відтворення, а також плагінами до популярних плеєрів. Файли Monkey's Audio використовують такі розширення: .ape для зберігання аудіо та .apl для зберігання метаданих. Незважаючи на відкритий вихідний код, Monkey's Audio не є вільним, оскільки його ліцензія накладає значні обмеження використання.

Середній бітрейт в аудіофайлі складає 600-700 кбіт/с; порівняйте з 128 кбіт/с MP3. Середній стиск складає 40-50 % залежно від жанру музики: якщо класичні чи джазові твори стискуються найкращим чином, то композиції в стилі trash-metal або щось подібне до «електронно шумового» покаже найгірший результат. Для кодеків із втратами при прийнятній якості стиск становить близько 80%.

Існують чотири ступені стиснення. Максимальна компресія може здатися єдиним правильним рішенням, навіть незважаючи на досить великий час стиснення. Однак потрібно враховувати ще й витрати ресурсів системи, що відтворює файл, – для максимально стисненого файлу він відносно високий.

Формат.APE забезпечує підтримку тегів для пошуку композицій у музичній колекції. Ще одним плюсом є перевірка цілісності файлу під час розкодування. Підтримується відновлення оригінального wav-файлу зі стисненого.APE.

Monkey's Audio має графічний фронтенд під Windows, інакше кажучи зручну віконну програму для керування процесом кодування. Інші кодеки вимагають використання командного рядка чи фронтендів сторонніх розробників. Найприємніше, що фронтенд Monkey's Audio можна використовувати і з іншими кодеками – Rkau, Wavpack, Shorten та навіть lossy-кодеками mp3 та ogg vorbis.

Трохи про недоліки. Кодек Monkey's Audio існує лише під Windows. Однак на сайті написано, що "версії під Mac і Linux вже розробляються". До речі, сам сайт не оновлювався досить давно, що не є гарною ознакою. Також відсутня підтримка серед виробників апаратних плеєрів.

MIDI (англ. Musical Instrument Digital Interface – цифровий інтерфейс музичних інструментів) – стандарт на апаратуру та програмне забезпечення, що дозволяє відтворювати (і записувати) музику шляхом виконання/запису спеціальних команд, а також формат файлів, що містять такі команди. Пристрій або програма, що відтворює, називається синтезатором (секвенсором) MIDI і фактично є автоматичним музичним інструментом.

На відміну від інших форматів, зберігає не оцифрований звук, а набори команд (ноти, що програються, посилання на інструменти, що програються, значення змінюваних параметрів звуку), які можуть відтворюватися по-різному залежно від пристрою відтворення. Зручність формату MIDI як формату представлення даних дозволяє реалізовувати пристрої, що виробляють автоматичне аранжування за заданими акордами, а також програми 3D візуалізації звуку. Крім того, такі файли зазвичай мають на кілька порядків менший розмір, ніж оцифрований звук порівнянної якості.

Стаття взята із сайту cjcity.fdstar.ru

Ми розглянемо різні формати звукових файлів:

WAVE (.wav)- Найбільш поширений звуковий формат. Використовується в Windows OC для зберігання звукових файлів. У його основі лежить формат RIFF (Resource Interchange File Format), що дозволяє зберігати довільні дані у структурованому вигляді. Для запису звуку використовуються різні способи стиснення, оскільки звукові файли мають великий обсяг. Найпростіший спосіб стиснення - імпульсно-кодова модуляція (Pulse Code Modulation, PCM), але не забезпечує достатньо хорошого стиснення.

AU (.au,.snd)- Формат звукових файлів, що використовується на робочих станціях фірми Sun (.au) та в операційній системі NeXT (.snd). Набув широкого поширення мережі Internet, на ранній стадії розвитку якої грав роль стандартного формату для звукової інформації.

MPEG-3 (.mp3)- формат звукових файлів, один із найбільш популярних на сьогоднішній день. Був розроблений для збереження звуків, відмінних від людської мови. Використовується для оцифрування музичних записів. Попередні версії формату: MP1 та MP2. При кодуванні застосовується психоакустична компресія, коли з мелодії видаляються звуки, погано сприйняті людським вухом. Ранні версії забезпечують найгіршу компресію, але менш вимогливі до ресурсів комп'ютера під час відтворення. Характеристики процесора безпосередньо впливають на якість звучання - чим слабший процесор, тим більше спотворення звуку.

MIDI (.mid)- Цифровий інтерфейс музичних інструментів (Musical Instrument Digital Interface). Цей стандарт розроблено на початку 80-х років для електронних музичних інструментів та комп'ютерів. MIDI визначає обмін даними між музичними та звуковими синтезаторами різних виробників. Інтерфейс MIDI є протоколом передачі музичних нот і мелодій. Але дані MIDI не є цифровим звуком – це скорочена форма запису музики у числовій формі. MIDI-файл є послідовністю команд, якими записані дії, наприклад, натискання клавіші на піаніно або поворот регулятора. Ці команди, що посилаються на пристрій відтворення MIDI-файлів, керують звучанням, невелике MIDI-повідомлення може викликати відтворення звуку або послідовності звуків на музичному інструменті або синтезаторі, тому MIDI-файли займають менший об'єм (одиниця звукового звучання в секунду), ніж звуку.

MOD (.mod)- музичний формат, в ньому зберігаються зразки оцифрованого звуку, які можна використовувати як шаблони для індивідуальних нот. Файли в цьому форматі починаються з набору зразків звуку, за якими йдуть ноти та інформація про тривалість. Кожна нота відтворюється за допомогою одного із наведених на початку звукових шаблонів. Такий файл відносно невеликий і має структуру, що базується на нотах. Це полегшує його редагування за допомогою програм, що імітують традиційний музичний запис. Він на відміну від MIDI-файлу повністю задає звук, що дозволяє відтворювати його на будь-якій комп'ютерній платформі.

IFF (.iff)- Interchange File Format – формат, спочатку розроблений для комп'ютерної платформи Amiga. Наразі також використовується на компакт-дисках у формі CD-I. Його структура дуже схожа структуру формату RIFF.

AIFF (.aiff) - Audio Interchange File Format – формат для обміну звуковими даними, використовується на комп'ютерних платформах Silicon Graphics та Mac. Багато в чому нагадує формат Wave, проте, на відміну від нього, дозволяє використовувати оцифрований звук і шаблони. Багато програм здатні відкривати файли у цьому форматі.

RealAudio (.ra, .ram)- Формат, розроблений для відтворення звуку в Internet у реальному часі. Розроблено фірмою Real Networks (www.real.com). Якість, що виходить, у кращому випадку відповідає посередній аудіокасеті, для якісного запису музичних творів використання формату mp3 більш переважно.

У світі музики існує безліч музичних форматів їх модифікацій та версій, створених гігантами музичної індустрії та невеликими компаніями, які отримали суспільне визнання в електронному світі.

Для цих цілей були розроблені різні фізичні методи зберігання аудіоданих, наприклад: вінілові пластинки, магнітна стрічка, компакт-диски, DAT, MD (мінідиск), DVD або перетворення нот у музичних форматах (MIDI), таким самим чином з'явилося безліч різних комп'ютерних методів зберігання аудіоданих – digital: OGG, MP3, Flac, Wav форматів.

Неможливо розглянути та обговорити всі звукові формати, кодеки їх переваги та недоліки, тому у своїй статті постараюся розповісти про найбільш популярні розширення audio files, з якими Ви стикаєтеся.

Чому ми не можемо використовувати якийсь універсальний формат кодування аудіо-файлів? Тому, що для реалізації різних функцій потрібний свій формат. Наприклад: для відтворення CD в дисководі компакт-дисків, для запису музики або звукових ефектів у відеоіграх, для запису доріжки фільму або відеокліпу, для програвання в мобільних телефонах або передачі файлів через Інтернет, крім того, існує ряд операційних систем, що отримали найбільше поширення у світі . До них входять: Amiga, Macintosh, NEXT та персональні комп'ютери з операційною системою Windows.

Крім того робота dj, звукорежисера, cj, відеоінженера або простого любителя музики досить сильно відрізняються за своєю суттю. Для цього може знадобитися, щоб Ваші аудіодані були збережені своїм способом. Наприклад, звук для компакт-диска має бути збережений з використанням розрядності 16 біт та частоти семплювання 44,1 кГц. Проте завантаження звуку через Інтернет нам краще використовувати іншу розрядність і частоту семплювання, оскільки кожна хвилина 16-бітного, 44-килогерцевого звуку займає приблизно 10 Мбайт, тобто. середній трек тривалістю 5 хвилин становитиме 50 "метрів" - це занадто великий обсяг даних для середнього користувача. У цій статті представлена коротка інформація про найпопулярніші музичні формати.

AA(Audible Audio Book File) - Формат є закритим, розроблений компанією Audible. Застосовується для запису аудіокниг, які продаються через сервіси Audible та iTunes. Існує можливість уповільнювати або прискорювати швидкість прослуховування файлів - digital pitch, можливість залишати закладки при прослуховуванні аудіо книг, захист файлів, при доставці звукових записів за допомогою Інтернету.

AAC(Advanced Audio Coding) – формат аудіо-файлу з меншою втратою якості при кодуванні, ніж MP3 за однакових розмірів. Кодування музики без втрат оригіналу за допомогою профілю ALAC. AAC – сімейство алгоритмів аудіо кодування MPEG4. На відміну від гібридного набору фільтрів mp3, AAC використовує MDST технологію (модифіковане косинусне перетворення) - це означає, що слухач отримує кращу якість звуку, ніж при MP3 кодуванні з таким же або меншим бітрейтом. Можливі розширення файлів AAC: [.m4a], [ .m4b ], [ .m4p ].

Також AAC - це широкосмуговий алгоритм кодування аудіо, який використовує два основних принципи кодування для сильного зменшення кількості даних, необхідних передачі високоякісного цифрового аудіо. Даний формат є одним з найбільш якісних, що використовують стиск із втратами, що підтримується більшістю сучасного обладнання, у тому числі портативного.

На 2009 рік поширений значно менше, ніж MP3 та інші альтернативні рішення. AAC (Advanced Audio Coding) спочатку створювався як наступник MP3 з покращеною якістю кодування. Формат AAC, офіційно відомий як ISO/IEC 13818-7, побачив світ у 1997 як нова, сьома, частина сім'ї MPEG-2. Існує також формат AAC відомий як MPEG-4 Частина 3.

Переваги AAC перед MP3:

- До 48 звукових каналів;

- більша ефективність кодування як при постійному, так і при змінному бітрейті;

- Частоти дискретизації від 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);

- Гнучкіший режим Joint stereo.

ADX– заснований на АДІКМ пропрієтарний формат стиснення із втратами та зберігання звукозапису, розроблений CRI Middleware спеціально для використання у відеоіграх. Найбільш характерна особливість - можливість зациклити звукозапис, що робить застосування формату зручним для використання як фонову музику в різних іграх, що підтримують цей медіаконтейнер. Його підтримують безліч ігор SEGA Dreamcast деякі ігри для PlayStation 2 і GameCube.

На відміну від MP3, у ньому не застосовується психоакустична модель зменшення обсягу даних про звук (зменшення його складності). Натомість модель ADPCM використовує для збереження зразків запис даних щодо помилки функції передбачення, що означає більшу безпеку вихідного сигналу після кодування; по суті, стиснення ADPCM замість використання повних перерозміряних зразків звукозапису надає зразки відхилення сигналу від попереднього значення, які мають набагато менший розмір, зазвичай - 4 біти. Для людського вуха таке відхилення знаходиться на рівні шуму, що робить втрату якості ледь помітною.

AIFF– це стандартний формат файлів для збереження аудіоданих на платформі Macintosh. Якщо вам потрібно буде пересилати аудіофайли між персональним комп'ютером і комп'ютером Macintosh, використовуйте саме цей формат. Він підтримує 8- та 16-бітові монофонічні та стереофонічні аудіодані. Файли цього формату можуть містити заголовок Mac-Binary, а можуть не мати його. Якщо файл цього типу не містить заголовка Mac-Binary, він, швидше за все, має розширення aif. Якщо файл даного типу містить заголовок Mac-Binary, Sound Forge відкриє його, але ідентифікує як файл формату Macintosh Resource (див. наступний розділ). У цьому випадку файл, швидше за все, має розширення snd. Примітка При збереженні файлів на комп'ютерах Macintosh до них додається так званий заголовок Mac-Binary. Це маленький фрагмент інформації, що записується на початку файлу, що ідентифікує тип файлу для операційної системи Mac OS та інших програм. У такий спосіб комп'ютери Macintosh повідомляють, що містить файл: текст, графіку або, наприклад, аудіодані.

AMR(Adaptive multi rate) [ . amr] - адаптивне кодування зі змінною швидкістю. Стандарт кодування звукових файлів спеціально призначений для стиснення сигналу в мовному діапазоні частот. Стандартизований ETSI (European Telecommunications Standards Institute). Використання AMR дозволяє забезпечити високу ємність мережі з одночасно високою якістю передачі мовлення. AMR володіє широким набором швидкостей кодування/декодування мови і дозволяє гнучко перемикатися на різні режими в залежності від навколишніх умов або завантаження мережі, за будь-яких умов забезпечуючи кришталево чисту передачу голосу.

APE– (Monkey ‘ s Audio ) [ . ape] – розробник Метью Т. Ешланд – формат цифрового звуку без втрат якості ( lossless ). Кодек Monkey's Audio випускається тільки для платформи Microsoft Windows, хоча існує низка неофіційних кодеків для MacOS, Linux, BeOS. Файли Monkey's Audio використовують такі розширення: .ape – для зберігання аудіо та .apl – для зберігання метаданих. Цей формат перестав бути вільним, т.к. ліцензія нею серйозно обмежує поширення.

AppleLossless[. m4 a] – це аудіо кодек, розроблений Apple Inc, для стиснення цифрової музики без втрат даних. Apple Lossless дані зберігаються в контейнері MP4 з розширенням. m4a. Хоча Apple Lossless має таке ж розширення файлу, як AAC, це не AAC, кодек схожий з іншими Lossless кодеками, такими як FLAC та ін. Він не використовує жодного управління цифровими правами (DRM), але, з урахуванням характеру контейнера, вважається, що DRM може застосовуватися до ALAC.

Тести показали, що стислі в ALAC файли виходять приблизно від 40% до 60% розміру оригіналів залежно від виду музики, подібно до інших Lossless форматів. Крім того, швидкість, з якою він може бути декодований, робить його корисним для пристроїв з обмеженою продуктивністю, таких як iPod.

Apple Lossless Encoder був представлений як один з компонентів QuickTime 6.5.1 28 квітня 2004 року і як функція iTunes 4.5. Кодек використовується також в AirPort Express AirTunes здійснення.

Декодер для Apple Lossless формату тепер є у відкритих джерелах бібліотеки libavcodec. Це означає, що будь-який мультимедійний програвач на основі цієї бібліотеки, включаючи мультимедіа VLC та MPlayer, може мати можливість грати Apple Lossless файли.

CDDA(Compact Disc Digital Audio) - звуковий компакт-диск, міжнародний стандарт зберігання оцифрованого звуку на компакт-дисках, представлений фірмами Philips та Sony. Звукова інформація представлена імпульсно-кодової модуляції з частотою дискретизації 44,1 кГц і бітрейтом 1411,2 кбіт/с, 16 біт стерео.

Зпецифікація аудіо в стандарті Red Book:

- Максимальний час усіх записів складає 79,8 хвилин;

- Мінімальний час треку - 4 секунди (включаючи 2-секундну паузу);

– максимальна кількість треків – 99;

- Максимальна кількість точок відліку (розділів треку) - 99 без обмежень за часом;

– повинен бути присутнім International Standard Recording Code (ISRC).

DTS– (Digital Theater System), по суті – це Dolby Digital , А точніше його конкурент. Формат DTS використовує мінімальний рівень стиску, ніж Dolby , так що фактично він звучить краще, що доводять на практиці DVD диски, на яких записані доріжки в DTS або у DD форматі.

DTS це цифрова театральна система – сімейство систем цифрового багатоканального звукозапису, створене компанією «Діджітал Тіетер Систем» для демонстрації цифрових фонограм у кінотеатрах синхронно з прокатними фільмокопіями. Крім супроводу плівкових фільмокопій, обидві системи ( DTS та Dolby Digital ) у спрощеному вигляді використовуються на оптичних відеодисках для домашнього перегляду. DTS використовує менший рівень стиску, ніж Dolby Але абсолютної переваги немає в жодній із систем. Спори про переваги DTS або Dolby Digital не припиняються до цього дня. Формат DTS Stereo практично ідентичний Dolby Surround. DTS підтримує як 5.1-канальний, так і 7.1-канальний варіант звуку. DTS у домашніх театрах допускає повний бітрейт (1509,75 кбіт/с).

FLAC(Вільний кодек з проекту Ogg)[.flac] – (англ. Free Lossless Audio Codec – вільний аудіо-кодек без втрат) – популярний вільний кодек для стиснення аудіо. На відміну від кодеків із втратами Ogg Vorbis, MP3 та AAC, FLAC не видаляє жодної інформації з аудіопотоку та підходить як для прослуховування музики на високоякісній звуковостворювальній апаратурі, так і для архівування аудіоколекції. На сьогодні формат FLAC підтримується багатьма аудіо-додатками. Щоб зберігати основні типи метаданих, базовий декодер використовує теги ID 3 v 1 та ID 3 v 2, тому їх можна вільно додавати та редагувати.

MIDI(Musical Instrument Digital Interface) - Цифровий інтерфейс музичних інструментів. Це стандарт цифрового звукозапису формат обміну даними між електронними музичними інструментами.

Інтерфейс дозволяє однаково кодувати в цифровій формі такі дані, як натискання клавіш, налаштування гучності та інших акустичних параметрів, вибір тембру, темпу, тональності та ін, з точною прив'язкою в часі. У системі кодувань є безліч вільних команд, які виробники, програмісти та користувачі можуть використовувати на свій розсуд. Тому інтерфейс MIDI дозволяє, окрім виконання музики, синхронізувати керування іншим обладнанням, наприклад, освітлювальним, піротехнічним тощо.

Послідовність MIDI-команд може бути записана будь-який цифровий носій у вигляді файлу, передана по будь-яким каналам зв'язку. Пристрій або програма, що відтворює, називається синтезатором (секвенсором) MIDI і фактично є автоматичним музичним інструментом.

MP2 (MPEG-1 Audio Layer II або Musicam) [ . mp2 ] – один із трьох форматів (рівень 2) стиснення звуку із втратами, визначеними у стандарті MPEG-1. Застосовується в цифровому радіомовленні DAB та застарілому стандарті Video CD, який у 90-ті роки використовувався для розповсюдження фільмів на оптичних компакт-дисках і існував до поширення DVD.

Кодер MPEG-1 Audio Layer 2 розвинувся з аудіокодека MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing - універсальне смугове кодування та мультиплексування з адаптацією до шаблону маскування), розробленого CCETT, Philips та IRT в 1989 як частина досліджень EUREKA 1 для систем цифрового радіомовлення для стаціонарних, портативних та мобільних приймальних пристроїв. Основні параметри MPEG-1 Audio були успадковані з MUSICAM, включаючи банк фільтрів, обробку у часовій області, розмір аудіокадра тощо. Однак після додаткового вдосконалення алгоритм MUSICAM не був використаний у фінальній версії стандарту MPEG-1 Layer II.

MP3 (MPEG Layer 3) [ . mp3 ] – третій формат кодування звукової доріжки MPEG - формат файлу, що ліцензується для зберігання аудіо-інформації. На даний момент MP3 є найвідомішим і популярним з поширених форматів цифрового кодування звукової інформації з втратами. Він широко використовується у файлообмінних мережах для оцінної передачі музичних творів. Формат може програватися практично в будь-якій популярній операційній системі, практично на будь-якому портативному аудіо-плеєрі, а також підтримується всіма сучасними моделями музичних центрів і DVD-плеєрів.

У форматі MP3 використовується алгоритм стиснення із втратами, розроблений для суттєвого зменшення розміру даних, необхідних для відтворення запису та забезпечення якості відтворення дуже близького до оригінального (на думку більшості слухачів), хоча меломани говорять про відчутну відмінність. При створенні MP3 із середнім бітрейтом 128 кбіт/с у результаті виходить файл, розмір якого приблизно дорівнює 1/10 від оригінального файлу з аудіо CD. MP3-файли можуть створюватися з високим або низьким бітрейтом, який впливає на якість файлу-результату. Принцип стиснення полягає у зниженні точності деяких частин звукового потоку, що практично невиразне для слуху більшості людей. Цей метод називають кодуванням сприйняття. При цьому на першому етапі будується діаграма звуку у вигляді послідовності коротких проміжків часу, потім на ній видаляється інформація не помітна людським вухом, а інформація, що залишилася, зберігається в компактному вигляді. Цей підхід схожий на метод стиснення, який використовується при стисканні картинок у формат JPEG. Багато музичних гурманів, воліють стискати музику з максимальною якістю – 320 kbps , або переходити на інші формати, наприклад FLAC де бітрейт в середньому ~1000 kbps.

MusePack[. mpc] – неліцензований формат файлу для зберігання аудіоінформації, що поширюється GNU General Public License.

У Musepack'і застосовується розбиття на смуги частот, тому він відноситься до так званих subband-кодеків. Основна особливість - точне налаштування психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звуку закодованої музики.

У сучасних форматах, таких як: MP3, Vorbis, AAC, AC3, WMA виробляється друге dct-перетворення, що дозволяє їм досягти кращої якості на середніх та низьких бітрейтах, але не дозволяє досягти високих результатів на більш високих. MusePack не здійснює другого dct-перетворення, що дозволяє досягти неперевершеної якості на бітрейтах вище 180.

Так само як в AAC і деяких інших сучасних форматах, Musepack виробляється спарювання каналів по смугах частот, що незначно відбивається на якості, але дозволяє сильно заощадити на розмірі. У MP3 парування каналів проводиться не по смугах частот, а для всієї смуги повністю, розбиваючи сигнал на частотні підсмуги, потім робить розкладання сигналу в ряд косінусів (MDCT - окремий випадок перетворення Фур'є) і записує округлені (квантовані) значення отриманих після перетворення коефіцієнтів (квантування) відбувається відповідно до проведеного психоакустичного аналізу). MPC після розбиття сигналу на частотні підсмуги просто проводить переквантування (спираючись на психоакустику) амплітудного сигналу в кожній підсмузі і отримані округлені (квантовані) значення записує у вихідний потік. Цим самим фактом пояснюється і велика швидкість компресії та декомпресії MPC.

MOD- Формат розроблений для платформи Amiga. Кожен файл MOD містить оцифровані записи real звучання інструментів, звані семплы, чимось схожий структуру MIDI. Cj або композитор, що пише у форматі MOD, застосовує програму, звану трекером, в якій вказує, який саме інструмент, в який час, якою нотою і октавою повинен прозвучати - ця послідовність нот записується в список - трек, а кілька треків, що паралельно звучать, утворюють блок , званий патерном. Сукупність патернів утворює модуль - файл у форматі MOD, з розширенням. Одна лінійка трекера відповідає одному реальному каналу, в якому може програти або відредагувати пронумеровані ноти. Нотам можуть призначатися різні "орнаменти" - наприклад: тремоло, гліссандо і т.д.

OGG [.ogv], [.oga], [.ogx], [.ogg] – відкритий стандарт формату мультимедіа контейнера, який є основним файловим та потоковим форматом для мультимедіа кодеків фонду Xiph.Org, а також назва проекту, що займається розробкою цього формату та кодеків для нього. Як і всі технології, що розробляються під егідою Xiph.Org, формат Ogg є відкритим та вільним стандартом, який не має патентних чи ліцензійних обмежень.

Ogg є лише контейнером. Музика або відео стискаються кодеками, а результат обробки зберігається у таких контейнерах. Контейнери Ogg можуть зберігати потоки, закодовані кількома кодеками. Наприклад, файл із відео та звуком може містити дані, закодовані аудіо та відео кодеками.

У контейнері Ogg можна зберігати звук та відео у різних форматах (таких як MPEG-4, Dirac, MP3 та інші).

RealAudio[. ra],[. ram] – Пропіарний стандарт на потокове мовлення та формат медіафайлів, що належить фірмі « RealNetworks Products and Services». RealAudio вперше представлений у складі пакету RealAudio 10, кодек для стиснення звуку без втрати якості.

Серед плюсів даного кодека – підтримка потокового мовлення, дуже швидке декодування. До мінусів відносять закритість коду та відсутність багатоканальності. Доступний для Microsoft Windows, Macintosh та GNU/Linux.

RKAU[.rka] – Серед усіх аудіокодеків RKAU займає особливе місце. По-перше це – найменший (всього 25kB!) та найшвидший кодер. По-друге, крім того, що він є програмою стиснення звуку без втрат (lossless), в ньому передбачені режими стиснення з втратами, що забезпечують більшу, ніж усі відомі lossless-алгоритми, ступінь стиснення. Однак завдяки особливостям алгоритму, що лежить в основі rkau спотворення, кодеком, що вносяться, лежать не в спектральній (як у випадку психоакустичних моделей кодерів MP3, MP+, AAC та інших), а в реальній області. Тобто мають, власне кажучи, нелінійну природу, як і спотворення більшості трактів. При цьому не відбувається втрати дрібних деталей та мікропланів фонограми. Однак якщо "перестаратися" в цьому відношенні, то звук може стати зовсім незручним: у звучанні з'являться жорсткі шумоподібні артефакти, а саме звучання набуде яскраво виражене фарбування.

В ієрархії аудіокодеків програма rkau стоїть повністю окремо. Вона настільки оригінальна, що немає аналогів серед інших алгоритмів стиснення аудіоданих. Малий розмір програми-кодера (25kB) і висока швидкість роботи при подібних до інших lossless-алгрітмами ступенях стиснення виводять rkau в безумовні лідери. І хоча найефективнішим lossless-кодером можна вважати OptimFROG, розглянутий у попередній частині статті, rkau лише ненабагато відстає від нього за ефективністю. Однак при активації режиму стиснення "з втратами", rkau навіть у режимі найвищої якості залишає далеко позаду всі lossless-алгоритми, наближаючись ефективності до програм, заснованих на психоакустичній моделі (MP3, MP+, AAC, VQF та інші). При цьому не відбувається характерної для MPEG-подібних алгоритмів втрати мікропланів і нюансів вихідного аудіоматеріалу, а артефакти, що неминуче виникають при цьому, можна помітити тільки на дуже якісній апаратурі при багаторазовому порівняльному прослуховуванні.

Shorten[.shn] – це формат, який використовується для стиснення аудіоданих. Ця форма стиснення файлів використовується для стиснення CD-якості, tp gjnthm аудіо файлів (44,1 кГц, 16 біт, стерео PCM ). Цей формат досі використовується деякими людьми, тому що за законом продаються концертні записи, які кодуються як Shorten файли.

Speex [. spx] - це вільний кодек для стиснення мовного сигналу, який може використовуватися в додатках "голос-через-інтернет" ( VoIP ). З високою ймовірністю він не має жодних патентних обмежень та ліцензований під останньою версією ліцензії BSD (без третьої статті). Стиснуті кодеком Speex дані можна зберігати або у форматі зберігання звукових даних Ogg , або передавати безпосередньо за допомогою пакетів UDP/RTP.

Розробники протиставляють свою розробку іншим відкритим кодекам, наприклад кодеку Vorbis , стверджуючи, що саме кодек Speex найкраще підходить для передачі голосу через мережу з ненадійною доставкою пакетів даних. При цьому автори розробки спеціально підкреслюють, що кодек підходить для використання в мережах з ненадійною передачею пакетів, тобто пакет прийшов, або ні.

Speex відноситься до класу так званих Code Excited Linear Prediction (CELP )-кодеків, тобто кодеків, побудованих на основі так званого Лінійного Передбачуваного кодування ЛПК. ЛПК використовує для апроксимації відрізка мовного сигналу цифровий фільтр тільки зі зворотними зв'язками (т.зв. «авторегресійний фільтр»). Коефіцієнти цього фільтра "підганяються" під відрізок сигналу за допомогою процедури Левінсона (у західній літературі - Левінсона-Дурбіна). CELP -модифікація ЛПК передбачає наявність т. зв. «кодової книги», яка містить певні набори збуджуючих ЛПК-фільтр поодиноких імпульсів.

Мовний сигнал у кодеці Speex розбивається на відрізки, що не перекриваються, тривалістю 20 мс (160 відліків при 8 КГц). При цьому для оцінки збудливого набору вищевказаний відрізок розбивається на чотири підвідрізки тривалістю 5 мс відповідно. На кожному з підвідрізків знаходяться збуджуючі набори імпульсів як поточного підвідрізка (з кодової книги), так і двох попередніх підвідрізків. На відміну від інших кодеків, щоб уникнути патентних обмежень, Speex не використовує кодування алгебри, а тільки векторне. Порушення двох попередніх підвідрізків складаються зі змінними вагами, на відміну від інших кодеків, де використовуються змінні положення за часом.

За заявою розробників, Speex оптимізовано для отримання високоякісного мовного сигналу при низьких швидкостях. Кодек Speex також дозволяє використовувати змінну ступінь стиснення сигналу та підтримує сигнали з різною шириною смуги: надширокосмуговий (частота дискретизації 32 кГц), широкосмуговий (16 кГц) та вузькосмуговий (8 кГц).

TAK(Tom ' s lossless Audio Kompressor) [ . так] – Аудіокодек та формат стиснення цифрового звуку без втрат. Відрізняється високим ступенем стиснення та швидкістю кодування та декодування. Розповсюджується безкоштовно разом з набором програмного забезпечення для кодування та відтворення, а також плагінами до популярних плеєрів: Winamp, foobar2000 та ін. Першу фінальну версію 1.0 було опубліковано 26 січня 2007 року.

Формат продовжує активно розвиватися (остання версія 1.1.1) і в даний час, згідно з проведеним опитуванням на форумі hydrogenaudio.org, входить до трьох найбільш популярних форматів аудіостискання без втрат (після FLAC і WavPack)

TTA(True Audio) - Безкоштовний, аудіо кодек, що здійснює стиснення музичних файлів без втрат в режимі реального часу. Кодек заснований на адаптивних передбачувальних фільтрах і має всі покращені характеристики, як і більшість сучасних кодерів. Стиснутий розмір файлів буде на 30% - 70% меншим, ніж original music file. TTA формат підтримує теги ID3v1 та ID3v2. Використовуючи True Audio кодек, можна розмістити до 20 audio CD на одному DVD-R диску.

TwinVQ(Transform – domain Weighted Interleave Vector Quanization) - Векторне квантування з трансформованими доменами і зваженим чергуванням), розробленої в Японії в лабораторії NTT Human Interface Labolatories.

VQF файли приблизно на 30-35 % менше, ніж MP3, при однаковій якості звуку. Потоку 128 Кбіт/с файлів MP3 відповідає потік 80 Кбіт/с файлів VQF. Ці переваги мають і зворотний бік. При декодуванні завантаження процесора також на 30% вище, ніж декодування MP3. Це визначає підвищені вимоги до комп'ютера, де планується програвати такі файли.

Тести показують перевагу VQF за всіма параметрами на нижніх частотах і менше спотворення форми сигналу з великим динамічним діапазоном (реальна музика). Однак за завалом верхніх частот звукового спектру VQF на 2-3 дБ поступається MP3 на частотах вище 15 кГц. Це легко компенсується налаштуванням еквалайзера плеєра, що об'єктивно ставить VQF на щабель вище за якістю звуку в порівнянні з MP3.

VQF(Interleave Vector Quanization)– розроблений у Японії та ґрунтується на технології TwinVQ. Якщо порівняти VQF і MP3, то перший формат на 30-50% буде більш "компактним", при однаковій якості звуку. Це дає VQF – значну перевагу перед форматом MP3. Але процес при кодуванні, декодуванні (decoder) VQF займає приблизно на 30% більше ресурсів процесора PC, ніж MP3 аудіо.

Тести показують перевагу TwinVQ за всіма параметрами на нижніх частотах і менше спотворення форми сигналу з великим динамічним діапазоном (реальна музика). Однак за завалом верхніх частот звукового спектру TwinVQ на 2-3 дБ поступається MP3 на частотах вище 15 кГц. Це легко компенсується налаштуванням еквалайзера плеєра, що об'єктивно ставить TwinVQ на щабель вище за якістю звуку в порівнянні з MP3.

Vorbis [. ogg] – вільний формат стиснення звуку із втратами, що офіційно з'явився влітку 2002 року. За функціональністю та якістю аналогічний таким кодекам як AAC, AC3 і VQF, що перевершують MP3. Психоакустична модель, що використовується в Vorbis, за принципами дії близька до MP3 і подібним, проте математична обробка та практична реалізація цієї моделі суттєво відрізняються, що дозволило авторам оголосити свій формат абсолютно незалежним від усіх попередників.

Ogg Vorbis за замовчуванням використовує змінний бітрейт, при цьому значення останнього не обмежені якимись жорсткими значеннями, і він може змінюватись навіть на 1 kbps. При цьому варто зауважити, що формат жорстко не обмежений максимальним бітрейтом, і при максимальних налаштуваннях кодування він може варіювати від 500 до 1000 кбіт/с. Таку ж гнучкість має частота дискретизації - користувачам надається будь-який вибір у межах від 2 до 192 кГц.

Vorbis був розроблений спільнотою "Xiphophorus" для того, щоб замінити всі платні запатентовані аудіо формати. Незважаючи на те, що це наймолодший формат із усіх конкурентів MP3, Ogg Vorbis має повну підтримку на всіх популярних платформах (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS та ін.), а також велика кількість апаратних реалізацій. Однак, незважаючи на всі свої переваги перед конкурентами, популярність цього формату поки невелика.

WAV(Waveform audio format) [ . wav], [. wave] – розроблено спільно з IBM . Формат запису (стерео- чи моно-) звуку без стиснення. Так всього одна хвилина стереозапису звуку зроблена з CD-якістю (частота дискретизації 44,1 КГц) містить 60 с х 44100Гц х 2 каналу = 5292000 відліків. На кожен відлік може бути 8 або 16 біт. Таким чином, у варіанті 8 біт на відлік, одна хвилина звуку займе в пам'яті 42336000 біт = 5292000 байт (близько 5 Мб).

WavPack[.wv], [.wvс] – Безкоштовний аудіокодек з відкритим кодом для стиснення аудіо без втрати якості. Розроблений Девідом Бріантом.

WavPack формат дозволяє стискати (і відновлювати) 8-, 16-, 24- та 32-бітові аудіофайли в.WAV форматі. Він також підтримує потоки звук навколо та високі частоти дискретизації (sampling rate). Як у інших способів компресії без втрати якості, ефективність стиснення залежить від вихідних даних, але зазвичай вона лежить у діапазоні між 30% і 70% для звичайної популярної музики, трохи вище для класичної музики та інших джерел з більш широким динамічним діапазоном.

WavPack також включає унікальний «гібридний» режим, який надає всі переваги стиснення без втрат з додатковим бонусом: замість створення одного файлу, у цьому режимі створюється відносно невеликий файл високої (точніше, вказаної при кодуванні) якості зі втратою (.WV), який може програватиметься сам по собі, а також файл «корекції» (.WVC), який (у комбінації з попереднім.WV) дозволяє повністю відновити оригінал. Для деяких користувачів це означає, що їм ніколи не доведеться вибирати між стиском без втрат і втрати якості.

WMA(Windows Media Audio) [ . wma] – формат файлу, що ліцензується, розроблений компанією Microsoft для зберігання та трансляції аудіо-інформації. Спочатку формат WMA позиціонувався як альтернатива MP3, але на сьогоднішній день Microsoft протиставляє йому формат AAC (використовується в популярному онлайновому музичному магазині iTunes).

Номінально формат WMA характеризується гарною здатністю стиснення, що дозволяє йому «обминати» формат MP3 та конкурувати за параметрами з форматами Ogg Vorbis та AAC. Але як було показано незалежними тестами, а також при суб'єктивній оцінці якість форматів все ж таки не є однозначно еквівалентною, а перевага навіть перед MP3 однозначною, як це стверджується компанією Microsoft. Особливо варто відзначити, що ранні версії формату (або його реалізації) мали проблеми на низьких швидкостях потоку. Також багато меломанів та власників цифрових плеєрів недолюблюють формат WMA за низьку стійкість до помилок. Якщо при кодуванні/передачі файлу WMA деяка частина його ушкоджується, то відтворення файлу стає неможливим, як після місця пошкодження, так і за кілька десятків секунд до нього. (Для порівняння: при пошкодженні файлу формату MP3, його все ще можна відтворити від початку до місця пошкодження, потім пропустити кілька секунд і відтворити далі до кінця; іноді помилки в кілька байт у файлі MP3 бувають на слух малопомітні або не помітні взагалі. ) Однак цей формат постійно розвивається, так що можна припускати, якість оптимізуватиметься.

Більшість портативних аудіоплеєрів підтримує формат WMA поряд із MP3. Цей формат дуже погано підтримується на альтернативних платформах (через його закритість).

Microsoft увімкнула у WMA підтримку цифрової системи управління авторськими правами (DRM) (система захисту). Основним наслідком її є неможливість прослуховувати захищені композиції інших комп'ютерах, крім того, на якому композиція була завантажена з музичного магазину.

В останніх версіях формату, починаючи з Windows Media Audio 9.1, передбачено кодування без втрати якості англ. lossless, багатоканальне кодування об'ємного звуку та кодування голосу.

Категорії

Популярне