Ростелеком

Три приложения, преобразующие мультимедийные файлы в открытые форматы. Воспроизведение мультимедийных форматов

Мультимедиа - это, в первую очередь, аудио и видео. Мультимедиа в приложении к Web-дизайну - это аудио- и видеоролики, размещенные на Web-страницах.

До недавних пор разместить на Web-странице аудио- или видеоролик можно было только с помощью громадного HTML-кода, дополнительных программ и "шаманских плясок" вокруг всего этого. Но сейчас, с появлением HTML 5 и поддерживающих его (хотя бы частично) Web-обозревателей, потребуется всего один тег. Какой? Очень простой, не сложнее уже знакомого нам тега !

Форматы файлов и форматы кодирования

Форматов мультимедийных файлов существует не меньше, чем форматов файлов графических. Как и в случае с интернет-графикой, Web-обозреватели поддерживают далеко не все мультимедийные форматы, а только немногие. (Хотелось бы автору посмотреть на Web-обозреватель, который поддерживает все форматы файлов - и на сам Web-обозреватель, и на его размеры...)

Но Web-обозревателю мало поддерживать только сам формат мультимедийных файлов . Он должен быть "знаком" и с форматом кодирования записанной в нем аудио- и (или) видеоинформации. В мире мультимедиа так - разные файлы одного формата могут хранить информацию, закодированную разными форматами. Более того, аудио- и видеодорожки мультимедийного файла практически всегда кодируются разными форматами.

Практически все форматы кодирования мультимедийных данных поддерживают их сжатие. Благодаря этому размер мультимедийных файлов значительно (иногда на несколько порядков) уменьшается, что благотворно сказывается на скорости их передачи по сети.

Перечислим и кратко опишем все форматы мультимедийных файлов , используемые в Web-дизайне и поддерживаемые Web-обозревателями.

- формат WAV (WAVe, волна) - "старожил" среди мультимедийных форматов. Был разработан Microsoft в самом начале 90-х годов прошлого века для хранения аудио-данных и применяется для этой цели до сих пор. Файлы такого формата имеют расширение wav.

- формат OGG - более новый формат . Был разработан около десяти лет назад некоммер-ческой организацией Xiph.org для хранения аудио- и видеоинформации. Файлы этого формата имеют расширения ogg (универсальное расширение), oga (аудио-файлы) и ogv (видеофайлы); последние два расширения встречаются редко.

- формат MP4 - также "новичок". Был разработан организацией Motion Picture Expert Group (Экспертная группа по вопросам движущегося изображения; также известна как MPEG) в 1998 году для хранения аудио- и видеоданных. Файлы этого формата имеют расширение mp4.

- формат QuickTime - формат очень старый, он старше даже WAV. Был разработан Apple в 1989 году для хранения аудио- и видеоданных. Файлы такого формата имеют расширение mov.
Теперь рассмотрим форматы кодирования аудио и видео, поддерживаемые современными Web-обозревателями.

- формат PCM (Pulse-Coded Modulation, импульсно-кодовая модуляция) - самый простой и самый старый формат кодирования. Он даже не поддерживает сжатие информации. Служит для кодирования аудиоданных.

- формат Vorbis - более современный формат кодирования. Был представлен организацией Xiph.org (разработчиком формата файла OGG) в 2002 году. Используется для кодирования аудиоданных.

- формат AAC (Advanced Audio Coding, развитое кодирование аудио) - не очень новый формат кодирования. Был разработан организацией Motion Picture Expert Group в 1997 году. Применяется для кодирования аудиоданных.

- формат Theora - пожалуй, самый "молодой" формат кодирования. Он также бы разработан организацией Xiph.org несколько лет назад. Используется для кодирования видеоданных.

- формат H.264 - тоже очень "молод". Был представлен организациями Motion Picture Expert Group и Video Coding Experts Group (Группа экспертов по кодированию видео) в 2003 году. Предназначен для кодирования видеоданных.

Почти все эти форматы являются открытыми. Исключения - формат файлов QuickTime, принадлежащий Apple, и формат кодирования H.264, защищенный более чем сотней патентов.

Осталось выяснить, какие сочетания форматов файлов и форматов кодирования используются в Web-дизайне и какие Web-обозреватели их поддерживают. По рывшись в Интернете и немного поэкспериментировав, автор свел эти данные в табл. 4.1.

Как видим, разные Web-обозреватели поддерживают различные форматы. Из-за этого у нас как у Web-дизайнеров могут быть проблемы...

Типы MIME

По сети передаются самые разные данные: Web-страницы, графические изображения, аудио- и видеофайлы, архивы, исполняемые файлы и пр. Эти данные предназначены разным программам. К тому же, с разными данными программа, принявшая их, может поступить по-разному. Так, Web-обозреватель при получении Web-страницы или графического изображения отобразит их на экране, а при получении архива или исполняемого файла - откроет или сохранит его на диске.

Всем передаваемым по сети данным присваивается особое обозначение, однозначно указывающее на их природу, - тип MIME (Multipurpose Internet Mail Extensions, многоцелевые расширения почты Интернета). Тип MIME присваивает данным программа, их отправляющая, например, Web-сервер. А принимающая программа (тот же Web-обозреватель) по типу MIME принятых данных определяет, поддерживает ли она эти данные, и, если поддерживает, что с ними делать.

Web-страница имеет тип MIME text/html. Графическое изображение формата GIF имеет тип MIME image/gif. Тип MIME исполняемого файла - application/ x-msdownload, а архива ZIP - application/x-zip-compressed. Свои типы MIME имеют и мультимедийные файлы .

Вот о мультимедийных файлах и их типах MIME мы и поговорим.

Ранее было сказано, что современные Web-обозреватели работают с очень ограниченным набором форматов мультимедийных файлов из нескольких десятков существующих. Более того, разные Web-обозреватели поддерживают различные форма ты. Поэтому Web-обозреватель должен определить, поддерживает ли он формат полученного файла, т. е. стоит ли его вообще загружать. Как это сделать, мы уже знаем - по типу MIME этого файла.

В табл. 4.2 перечислены типы MIME форматов мультимедийных файлов , поддерживаемых Web-обозревателями на данный момент.

Как видим, один формат файлов может иметь несколько типов MIME. Обычно выбирается самый первый из списка как самый предпочтительный.
Вооружившись необходимой теорией, приступим к практике. Сейчас мы выясним, как HTML 5 позволит нам поместить аудио или видео на Web-страницу.


Автор: Jack M. Germain
Дата публикации: November 3rd, 2010
Перевод: Н.Ромоданов
Дата перевода: ноябрь 2010 г.

Когда дело касается громадного количества форматов, используемых на цифровых носителях, у пользователя любой платформы может закружиться голова, а пользователи, которые, возможно, думают о переходе на Linux, могут решить, что на ОС с открытым кодом определенные типы файлов просто не удастся воспроизвести. В действительности этого бояться нечего - ниже описаны три приложения, с помощью которых можно преобразовать обычные и малоизвестные форматы цифровых носителей в те, которые легко воспринимаются Linux.

Одним из опасений, которое сохранятся у потенциальных пользователей Linux, это то, что, уйдя из Windows, они не смогут воспроизводить свои аудио и видео записи. Когда-то это действительно было проблемой. Но сейчас об этом не стоит больше беспокоиться.

С помощью трех сравнительно новых приложений, предназначенных для Linux, можно таким образом конвертировать звуковые и видео записи, что их можно будет воспроизводить в большинстве дистрибутивов Linux. Приложения , и могут вместе или по отдельности переместить в Linux все ваши любимые мультимедийные файлы.

Эти три приложения действительно ключевые, если вы хотите использовать Linux в качестве реальной настольной системы, альтернативной Microsoft Windows. У пользователей компьютеров появляется все больше портативных устройств, которые потребляют безумное количество аудио и видео записей. Ничего не оттолкнет новичков от Linux так быстро, как отсутствие возможности использовать звуковые или видеозаписи.

Вопросы проприетарности

Большим камнем преткновения при работе с видео и аудио файлами являются проприетарные кодеки, которые используются программами на других платформах. Преобразование форматов не предназначено для несанкционированного использования музыки или содержание видеозаписи. Просто я хочу иметь возможность воспроизводить то, что у меня уже есть, на той компьютерной платформе, которую я выберу. Приложения, осуществляющие преобразование аудио и видео, служат для этой цели.

Это означает, что у вас должна быть возможность получать файлы в проприетарных форматах, используемых на других платформах, например, Real Media, Apple Quicktime и Microsoft Windows Media Video, и быстро и легко конвертировать их для проигрывания с помощью плейеров с открытым исходным кодом.

Используем Arista

В приложении Arista Transcoder вы можете в качестве исходных видеозаписей выбирать файлы в любой кодировке и любого типа, если они доступны для чтения с помощью GStreamer. К ним относится и содержимое DVD. Вы также можете выбрать формат выходного файла.

Это приложение исключительно удобно благодаря тому, что вместе с ним поставляется огромное количество предварительных настроек, предназначенных для широкого спектра портативных устройств. Предварительные настройки избавляют пользователя от необходимости гадать о том, как выполнить преобразование, что постоянно случается в случае других программ, используемых для преобразования мультимедийных форматов.

Эти предварительные настройки позволяют избежать необходимости возиться с такими особенностями, как выбор различных видео и аудио кодеков, размеров выходного изображения, частоты смены кадров и так далее.

Рис. 1. Приложение Arista Transcoder

Бесплатный инструмент

Я до сих пор не встречал программу-конвертер, которая была бы настолько же проста, как Arista Transcoder. В панели Edit / Preferences (Редактирование / Настройки) практически ничего не нужно выбирать.

Если вы поставите отметку Search (Поиск), то приложение само найдет источник мультимедийной записи, который вы подключили к компьютеру. В противном случае, вам придется сделать выбор самостоятельно, используя для этого диалоговое окно.

С помощью быстро открывающегося меню можно выбрать тип устройства, например, оптический диск, указать устройство, например, компьютер или подключенное мобильное устройство (я полагаю, что I iPod, смартфон, Sony PSP и т.д.) и выбрать предварительную настройку.

Индикатор процесса преобразования указывает время, оставшееся до завершения преобразования. В окошке Live Preview (Предпросмотр) можно с частотой в два кадра в секунду следить за создаваемым изображением.

Предварительные настройки уменьшают проблемы

В интерфейсе вариантов выбора совсем немного. Но это неплохо. В предварительных настройках все за вас сделано, учтены возможности ввода "живого" мультимедийного сигнала, использование лицензионно чистого преобразования, а также выбора следующих уровней качества: низкий, средний и высокий.

Есть предварительные настройки для iPod, компьютера, плейра DVD, PSP, PlayStation 3 и многих других устройств. Встроена возможность автоматического обновления предварительных настроек.

Основные возможности SoundConverter

SoundConverter имеет репутацию надежного и полезного приложения. Он является лидирующим приложением для рабочего стола GNOME, предназначенным для преобразования звука.


Рис.2. Приложение для записи звука

Точно также, как и Arista Transcoder, приложению SoundCoverter нужна библиотека GStreamer. С помощью этого дуэта вы сможете прочитать все, что подадите на вход приложения.

Приложение читает следующие форматы: Ogg Vorbis, AAC, MP3, FLAC, WAV, AVI, MPEG, MOV, M4A, AC3, DTS, ALAC, MPC, Shorten, APE, SID, MOD, XM, S3M и многие другие. И записывает файлы в форматах WAV, FLAC, MP3, AAC и Ogg Vorbis./p>

Получите по следующей ссылке краткое руководство, в котором описано, как запустить приложение SoundConverter в дистрибутивах Ubuntu, Fedora, Mandriva, Gentoo и Debvian.

Быстро и используя все ресурсы

Благодаря использованию многопоточности, приложение SoundConverter работает очень быстро. Оно может "на лету" задействовать несколько ядер.

Оно также может извлекать аудиодорожки из видеозаписей. Благодаря этому скорость работы повышается.

Приложение SoundConverter построено на базе простого графического интерфейса, использующего GTK+ и предназначенного для рабочего стола GNOME.

Интерфейс в SoundConverter очень аскетичный. Все действия сделаны невидимыми для пользователя. У вас очень мало возможностей для выбора файла, создаваемого при преобразовании.

Небольшой выбор вариантов

Самое большое количество настроек приложения SoundConverter доступно в панели Edit/Preferences (Редактирование / Настройки). Здесь вы указываете, где будет размещен выходной файла, а также задаете другие выходные характеристики.

Вы можете указать либо тот директорий, где находится входной файл, либо выбрать другое место. Вы также можете прямо из панели создать поддиректорию или удалить исходный файл.

В SoundConverter также есть незначительные возможности настройки частоты дискретизации, которая зависит от других выбранных вами настроек. Например, для целевого битрейта установите значение 192kpbs. Если вы посмотрите настройки Resample, то увидите что у вас есть семь вариантов выбора настроек.

Хорошее управление

Когда дело касается приложений, преобразующих форматы, очень важна возможность управлять настройками результирующего файла. Мне нравится вариант, предлагаемый в SoundControl, так как он не встречаются в других приложениях.

В выпадающем списке вы можете задать имя выходного файла. Также можно указать номер и название дорожки, перечислить исполнителей и добавить свои собственные данные.

Вы можете указать тип формата и в выходном фильтре. Можно выбрать Vorbis (.ogg), FLAC без потерь (.flac) или MS Wave (.wav). Последний вариант, вероятно, будет более комфортным для тех, кто пришел из мира Windows.

В панели Preferences (Настройки) этого приложения есть иерархия настроек, предназначенная для задания различных уровней качества выходного файла. Вы можете выбрать один из шести уровней качества. Они варьируются от очень низкого и до безумно высокого.

Используем формат Ogg

OggConvert является утилитой Gnome и GTK, предназначенной для преобразования мультимедийных файлов в свободный от патентов формат Vorbis. Эта утилита немного более гибкая, чем другие приложения. Утилита OggConvert может работать с последними версиями формата.

Рис.3. Приложение OggConvert

Используются форматы Theora, Dirac и VP8. Не путайте утилиту OggConvert с приложением Ogg Converter. Это совершенно разные программы.

Общее, что есть в OggConvert, SoundConverter и Arista Transcoder, это то, что все они используют GStreamer для преобразования мультимедийных файлов в форматы Theora и Vorbis.

Ограничения

Преобразование форматов в OggConvert проще, чем с в других программах, которые я использовал. Единственный потенциальный недостаток этого приложения в том, что оно преобразует файлы только в форматы Ogg и Matroska.

Matroska является мультимедийным контейнером, имеющим открытый исходным код и открытый стандарт. Это, обычно, файлы с расширениями.MKV (Matroska видео), .MKA (Matroska аудио) и.MKS (субтитры). Этот формат также является основой для файлов.webm (WebM).

У меня не было возможности много работать с файлами Matroska. Но Ogg является стандартом, особенно для плейеров, используемых в Linux. Так что я считаю, что OggConvert хороший выбор, если приходится иметь дело с файлами в различных аудио и видео форматах.

Как использовать

Среди всех трех приложений-конвертеров, которые здесь обсуждались, OggConvert имеет самый скудный интерфейс. Разработчик даже обошелся без традиционных пунктов в меню — File (Файл) / Edit (Редактирование) / и т.д.

Использовать это приложение совсем несложно. Просто перейдите к месту, где у вас записаны мультимедийные файлы, и выберите файл. С помощью двух движков задайте качество аудио и качество видео.

Выберите в качестве выходного формата Ogg или Matroska и, если вы хотите, щелкните по заголовку окна и измените имя выходного файла. Укажите, где вы хотите сохранить выходной файл.

Вот и все, что нужно настроить. Просто нажмите кнопку Convert (Преобразовать) и все будет сделано.

В Библиотеке сайта вы найдете еще следующие статьи о преобразовании файлов в свободные форматы:

  • Jack Wallen, перевод: Н.Ромоданов, "Конвертирование файлов формата.mp3 в файлы форматов.wav и.ogg из командной строки"
    В этой статье вы увидите, насколько просто с помощью командной строки конвертировать друг в друга файлы этих форматов.
  • Nathan Willis, перевод А.Матвеев, "OggConvert - преобразуем видео-файлы в свободные форматы"
  • Сергей Иванов,
  • Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

    хорошую работу на сайт">

    Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

    Размещено на http://www.allbest.ru/

    Введение

    Multimedia - это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

    1. Что же такое мультимедиа?

    программный мультимедиа графика звук

    Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа - это цифровая информация, имеющая более широкие возможности, чем другие ее виды.

    ь Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.

    ь Цифровая информация может сжиматься до минимума для хранения.

    ь Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.

    ь Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.

    Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:

    o Системы воспроизведения . Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.

    o Авторские системы . (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.

    В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, - это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.

    Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98 (SE)/МЕ/NT/2 k., и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980 г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

    2. Мультимедиа и Windows 95/9 8 (SE)/МЕ/NT/2k /XP

    Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.

    ь Windows95/98 (SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.

    ь При установке Windows автоматически определяет конфигурацию мультимедиа устройств.

    ь Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук , видео, графику, диаграммы, картинки и другие элементы различных приложений.

    ь Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.

    ь Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.

    ь Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.

    ь Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR - английская аббревиатура от Video Cassette Recorder - видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.

    ь Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.

    ь Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.

    Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

    3. Системы мультимедиа

    Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты , видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.

    Ниже перечислены минимальные требования для запуска мультимедиа под Windows.

    ь Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).

    ь Шина PCI для передачи данных для контроллера диска и видеокарты.

    ь Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.

    ь CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.

    ь Звуковая карта , обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.

    ь Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.

    ь IBM-совместимый аналоговый порт джойстика.

    ь MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.

    MIDI (Musical Instrument Digital Interface - интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

    Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

    4. Типы и стандарты мультимедиа

    Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

    Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

    Визуальное медиа - это анимационные файлы и видеофайлы.

    Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.

    Видео. Video for Windows - это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

    5. О звуковой мультимедиа

    Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.

    Существует два способа звукозаписи:

    · Цифровая запись , когда реальные звуковые волны записываются и конвертируются в цифровые данные.

    · MIDI апись , вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

    6. Цифровая запись

    Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.

    Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис. 1. Амплитуда выражает высоту волны, или громкость звука. Период - это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду - это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

    Измерение звуковой волны

    Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис. 2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования - 16 Гц.

    Квантование волны при частоте квантования 16 Гц

    Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.

    Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной - числом разрядов (бит), используемым для хранения информации о квантовании.

    Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение - на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.

    Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена - она состоит из многих различных частот, которые вместе создают тембр звука. Тембр - это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.

    Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

    Реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

    Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

    на секунду

    В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка - стандартам, установленным для цифровых аудиокомпакт-дисков.

    Требования по хранению звуковых файлов

    Разрядность

    Частота квантования

    Байт для хранения

    0,66 Мбайт/мин

    1,32 Мбайт/мин

    2,646 Мбайт/мин

    5,292 Мбайт/мин

    Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

    7. Звук и типы звуковых файлов

    Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
    Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

    Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

    РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

    Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

    Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

    Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

    Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

    Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

    Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.

    AIF или AIFF

    Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

    AIFC или AIFF

    Тот же AIFF, только с заданными параметрами сжатия (компрессии).

    Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало «весят», за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры?-Law 8 кГц - моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

    Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

    Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для «обычных немузыкальных» людей потери не ощутимы явно.

    Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

    Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).

    НСОМ

    То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.

    Стандартный формат U-Law. 8 кГц, 8 бит, моно.

    Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

    Бывает двух видов. Один - это тот же AU для SUN и NeXT. Другой - это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

    Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

    8. Компрессия аудиоданных

    Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.

    Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

    Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии / декомпрессии аудиоданных.

    · TrueSpeech Сodec . Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.

    · Microsoft GSM Audio Codec . Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.

    · Microsoft CCITT G.711 A-Law and U-Law Codec . Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.

    · Microsoft ADPCM Codec . Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.

    · IMA ADPCM Codec . Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.

    · Microsoft PCM converter . Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

    9. Программное обеспечение по преобразованию цифровой записи

    Существует множество программ-кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна - сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.

    Наиболее популярные программы-кодеки приведены ниже.

    Voice

    Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
    Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

    Диалоговое окно программы Voice

    Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600 байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.

    Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.

    Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.

    Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

    Mpeg Encoder

    Диалоговое окно программы mpeg Encoder

    Один недостаток mpeg Encoder - уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того - качество не отличается от оригинала.

    Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества - стерео или моно и… вперед! Смело жмем кнопку Encode.

    LameBatch

    LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

    Диалоговое окно с параметрами программы LameBatch

    Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

    Основные фишки:

    ь Только одно окошко (без всплывающих окон непосредственно кодера).

    ь Индивидуальные настройки кодирования каждого файла.

    ь Возможность их изменения для других файлов во время кодирования одного.

    ь Всяческая информация о ходе процесса.

    ь Проверка файлов на допустимость формата.

    ь Различные варианты сортировки очереди.

    ь Незатейливое прописывание тэгов.

    ь Возможность отложить работу на неопределенный срок.

    ь Различная настройка папки для результатов.

    ь Проверка перезаписи и доступного места.

    ь Поддержка Drag and drop.

    ь Встраивается в контекстное меню Explorer.

    ь Выключение машины по окончании процедуры.

    Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

    Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

    Заключение

    Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11-14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.

    С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т.к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11-12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.

    При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т.е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4-5 часов (обычно эта цифра в 1,5-2 раза больше).

    Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11-12 раз. Так что вместо 40 Мбайт получится всего 3,8-3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество / размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

    Литература

    1. Том Шелдон. «Windows 95 проще простого» Диалектика. Киев. 1996 г.

    2. А. Чижов. «Napster - панацея для MP3-меломана» Фантазия. 1999-2000 г.

    Размещено на Allbest.ru

    ...

    Подобные документы

      Понятие мультимедиа как интерактивных систем, обеспечивающих работу с неподвижными изображениями и движущимся видео, анимированной компьютерной графикой, текстом, речью и качественным звуком. Области применения сканера, веб-камеры, лазерной клавиатуры.

      контрольная работа , добавлен 12.01.2012

      Форматы и характеристики цифрового видео: частота кадра, экранное разрешение, глубина цвета, качество изображения. Типовый технологический процесс производства видеокомпонентов для мультимедиа продуктов с использованием программы miroVIDEO Capture.

      лекция , добавлен 30.04.2009

      Описания интерактивных систем, обеспечивающих работу с изображениями, движущимся видео и анимированной компьютерной графикой. Определение основных мультимедийных ресурсов сети Интернет. Преимущества и недостатки применения мультимедиа в образовании.

      курсовая работа , добавлен 17.01.2015

      Области применения мультимедиа. Основные носители и категории мультимедиа-продуктов. Звуковые карты, CD-ROM, видеокарты. Программные средства мультимедиа. Порядок разработки, функционирования и применения средств обработки информации разных типов.

      контрольная работа , добавлен 14.01.2015

      Разработка мультимедиа-программы для прослушивания аудио-файлов и просмотров видео. Описание меню для пользователей и для администраторов проекта. Создание форм для указанного приложения при помощи Visual Foxpro 9. Листинг программы и ее результаты.

      курсовая работа , добавлен 27.07.2013

      Общее представление о мультимедиа-технологиях. Цели применения продуктов, созданных в мультимедиа-технологиях. Мультимедийные ресурсы и средства разработки мультимедиа. Аппаратные средства, видео и анимация. Процесс создания мультимедийного проекта.

      курсовая работа , добавлен 25.06.2014

      Создание информационной мультимедиа системы (медиа-плеера) для презентации аудио-видео информации о факультете КТАС, представленной в специально отснятых и смонтированных avi-файлах. Разработка модуля пользовательского интерфейса, выходные данные.

      курсовая работа , добавлен 21.11.2014

      Потоковое мультимедиа - мультимедиа, которое непрерывно получается пользователем от провайдера потокового вещания. Попытки отображения мультимедиа информации на компьютерах. Разработка сетевых протоколов потокового вещания и развитие интернет технологий.

      курсовая работа , добавлен 21.12.2010

      Проблемы информационной безопасности в современных условиях. Особенности развития средств мультимедиа. Применение информационных технологий в процессах коммуникации. Разработка защитного технического, программного обеспечения от компьютерных преступлений.

      курсовая работа , добавлен 27.03.2015

      Потенциальные возможности компьютера. Широкое применение мультимедиа технологии. Понятие и виды мультимедиа. Интересные мультимедиа устройства. 3D очки, web-камеры, сканер, динамический диапазон, мультимедийная и виртуальная лазерная клавиатура.

    Электронные документы, содержащие мультимедиа компоненты и средства их реализации (Берестова В.И.)

    Дата размещения статьи: 19.12.2014

    В настоящее время в связи с развитием новых информационных технологий в работе многих компаний и фирм используются электронные документы, содержащие не только текстовую информацию, но также графическую и звуковую. Мультимедийный документ - это электронный документ, содержащий видео- и (или) звуковую информацию . Видеоинформация и звуковая информация используются в видеоархивах. Это могут быть видеофильмы для различных применений. Мультимедиа может представлять собой интерактивную среду, т.е. пользователь может управлять процессом представления мультимедиа с помощью различных средств ввода, таких как клавиатура и манипулятор-мышь. Например, для проведения семинаров, деловых встреч, тренингов, рекламных акций и других мероприятий, чтобы информация была более насыщенной, запоминающейся и наглядной, чаще всего применяют мультимедиатехнологии. Это как аппаратные мультимедийные средства, так и пакеты прикладных программ, которые позволяют обрабатывать различные виды информации, такие как текст, графика и звук. Так, например, в текстовом редакторе Microsoft Word предусмотрена возможность включения в состав документа не только анимации в формате GIF, но также и видеофильма в формате QuickTime (QuickTime - технология, а не формат. Подразумеваемый формат, скорее всего, MOV. - Прим. корр.), видеоклипа в формате AVI, клипа мультимедиа. Существуют различные понятия мультимедиа: мультимедиа - технология, описывающая порядок разработки, функционирования и применения средств обработки информации различных видов; мультимедиа - компьютерное аппаратное обеспечение (наличие в компьютере CD-Rom Drive - устройства для чтения компакт-дисков, звуковой и видеоплаты, с помощью которых возможно воспроизведение звуковой и видеоинформации, джойстика и других специальных устройств); мультимедиа - это объединение нескольких средств представления информации в одной системе. Обычно под мультимедиа подразумевается объединение в компьютерной системе таких средств представления информации, как текст, звук, графика, мультипликация, видеоизображение и пространственное моделирование. Такое объединение средств обеспечивает качественно новый уровень восприятия информации: человек не просто пассивно созерцает, а активно участвует в происходящем. Программы с использованием средств мультимедиа многомодальны, т.е. они одновременно воздействуют на несколько органов чувств и поэтому вызывают повышенный интерес и внимание у аудитории .
    Содержание мультимедиаприложений продумывается автором еще на этапе создания сценария и конкретизируется при разработке технологического сценария. Если текст и статическая графика - традиционные средства представления информации, имеющие многовековую историю, то опыт использования мультимедиа исчисляется годами.
    Существует достаточно большое разнообразие различных технологических приемов, нацеленных на разработку качественных мультимедийных приложений, используемых в электронных документах.
    Красочно оформленное мультимедийное приложение, в котором наличие иллюстраций, таблиц и схем сопровождается элементами анимации и звуковым сопровождением, облегчает восприятие материала, способствует его пониманию и запоминанию.

    Анализ технологии создания мультимедийных приложений

    Существует достаточно большое разнообразие различных технологических приемов, нацеленных на разработку качественных мультимедийных приложений. При создании и последующем использовании этих приложений следует соблюдать несколько основных технологических рекомендаций.
    В качестве основы для создания мультимедийного приложения может стать модель содержания материала, представляющая собой способ структуризации материала, основанный на разбиении его на элементы и наглядном представлении в виде иерархии.
    На начальной стадии проектирования мультимедийного приложения модель содержания материала позволяет: четко определить содержание материала; представить содержание в наглядном и обозримом виде; определить компонентный состав мультимедийного приложения.
    Учет достижений психологии позволяет сформулировать ряд общих рекомендаций, которые следует учитывать при разработке способа визуализации информации на экране компьютера: информация на экране должна быть структурирована; визуальная информация должна периодически меняться на аудиоинформацию; периодически должны варьироваться яркость цвета и/или громкость звука; содержание визуализируемого материала не должно быть слишком простым или слишком сложным.
    При разработке формата кадра на экране и его построении рекомендуется учитывать, что существует смысл и отношение между объектами, которые определяют организацию зрительного поля. Компоновать объекты рекомендуется: близко друг от друга, так как чем ближе в зрительном поле объекты друг к другу (при прочих разных условиях), тем с большей вероятностью они организуются в единые, целостные образы; по сходству процессов, так как чем больше сходство и целостность образов, тем с большей вероятностью они организуются; с учетом свойств продолжения, так как чем больше элементы в зрительном поле оказываются в местах, соответствующих продолжению закономерной последовательности (функционируют как части знакомых контуров), тем с большей вероятностью они организуются в целостные единые образы; с учетом особенности выделения предмета и фона при выборе формы объектов, размеров букв и цифр, насыщенности цвета, расположения текста и т.п.; не перегружая визуальную информацию деталями, яркими и контрастными цветами; выделяя материал, предназначенный для запоминания цветом, подчеркиванием, размером шрифта и его стилем .
    При разработке мультимедийного приложения необходимо учитывать, что объекты, изображенные разными цветами и на разном фоне, по-разному воспринимаются человеком .
    Важную роль в организации зрительной информации играет контраст предметов по отношению к фону. Существуют две разновидности контраста: прямой и обратный. При прямом контрасте предметы и их изображения темнее, а при обратном - светлее фона. В мультимедийных приложениях обычно используются оба вида, как порознь в разных кадрах, так и вместе в рамках одной картинки. В большинстве случаев доминирует обратный контраст.
    Предпочтительной является работа мультимедиаприложений в прямом контрасте. В этих условиях увеличение яркости ведет к улучшению видимости, а при обратном - к ухудшению, но цифры, буквы и знаки, предъявляемые в обратном контрасте, опознаются точнее и быстрее, чем в прямом даже при меньших размерах. Чем больше относительные размеры частей изображения и выше его яркость, тем меньший должен быть контраст, тем лучше видимость. Комфортность восприятия информации с экрана монитора достигается при равномерном распределении яркости в поле зрения .
    Для оптимизации изучения информации на экране компьютера разработчикам мультимедийных приложений рекомендуется использование логических ударений. Логическими ударениями принято называть психолого-аппаратные приемы, направленные на привлечение внимания пользователя к определенному объекту. Психологическое действие логических ударений связано с уменьшением времени зрительного поиска и фиксации оси зрения по центру главного объекта.
    Наиболее часто используемыми приемами для создания логических ударений являются: изображение главного объекта более ярким цветом, изменение размера, яркости, расположения или выделение проблесковым свечением. Количественной оценкой логического ударения является его интенсивность. Интенсивность зависит от соотношения цвета и яркости объекта по отношению к фону, от изменения относительных размеров объекта по отношению к размерам предметов фона изображения. Наилучшим является выделение либо более ярким, либо более контрастным цветом, хуже - выделение проблесковым свечением, изменением размера или яркости .

    Классификация существующих видов мультимедиаприложений и рекомендации по технологии их создания

    Проведя обзор и анализ существующих отечественных и зарубежных систем по технологии создания мультимедийных приложений, можно предложить следующую классификацию самых распространенных мультимедиаприложений и их понятий.
    Мультимедийные приложения подразделяются на следующие виды:
    1. Презентации.
    2. Анимационные ролики.
    3. Игры.
    4. Видеоприложения.
    5. Мультимедиагалереи.
    6. Аудиоприложения (проигрыватели звуковых файлов).
    7. Приложения для Web.
    В таблице 1 представлены основные понятия мультимедийных приложений и их виды.

    Таблица 1

    Основные понятия мультимедийных приложений

    Вид мультимедийного приложения

    Презентация

    Презентация (от англ. presentation ) - способ наглядного представления информации с использованием аудиовизуальных средств. Презентация представляет собой сочетание компьютерной анимации, графики, видео, музыки и звукового ряда, которые организованы в единую среду. Как правило, презентация имеет сюжет, сценарий и структуру, организованную для удобного восприятия информации

    Анимационные ролики

    Анимация - технология мультимедиа; воспроизведение последовательности картинок, создающее впечатление движущегося изображения. Эффект движущегося изображения возникает при частоте смены видеокадров более 16 кадров в секунду

    Игра - мультимедиаприложение, направленное на удовлетворение потребностей в развлечении, удовольствии, снятие напряжения, а также на развитие определенных навыков и умений

    Видеофильмы и видеопроигрыватели

    Видеофильмы - технология разработки и демонстрации движущихся изображений.

    Видеопроигрыватели - программы управления видеофильмами

    Мультимедиагалереи

    Галереи - собрание изображений

    Проигрыватели звуковых файлов (цифровой звук)

    Проигрыватели звуковых файлов - программы, работающие с цифровым звуком. Цифровой звук - это способ представления электрического сигнала посредством дискретных численных значений его амплитуды

    Приложения для Web

    Приложения для Web - это отдельные веб-страницы, их компоненты (меню, навигация и т.п.), приложения для передачи данных, многоканальные приложения, чаты и т.д.

    В свою очередь мультимедийные приложения можно разделить на следующие подвиды. Основные понятия подвидов мультимедийных приложений представлены в таблице 2.

    Таблица 2

    Основные понятия подвидов мультимедиаприложений

    Презентация:

    1. Линейная презентация - динамичный ролик со сложной графикой, видеовставками, звуковым сопровождением и отсутствием системы навигации.

    2. Интерактивная презентация - совокупность мультимедийных компонентов, структурированных по иерархическому принципу и управляемых через специальный пользовательский интерфейс

    Анимация:

    1. Покадровая анимация - кадровая смена изображений, создающая впечатление движения картинок.

    2. Программная анимация - анимация, при которой изображения меняются с помощью запрограммированной последовательности действий (т.е. с помощью алгоритма и переменных). Рисование основных объектов происходит вручную или путем импортирования их из коллекций и галерей, после чего применяются возможности какого-либо языка программирования

    Игры:

    1. Развлекательные игры - программы, позволяющие пользователю провести свой досуг.

    2. Обучающие игры - программы, позволяющие пользователю повысить уровень своих знаний в той или иной области, представленные в легкой игровой форме

    Видеопроигрыватели:

    1. Формирование покадрового фильма - подготовка и расположение изображений, последовательности фотографий, кадров, которые создают впечатление движения.

    2. Видеопроигрыватель для потокового видео - формирование проигрывателя, в который включается потоковое видео форматов AVI, MPEG и др., после чего появляется возможность управления этим потоком (например, использование таких команд, как запуск, пауза и перемотка на начало видео фрагмента)

    Мультимедиагалереи:

    1. Кадровая смена изображений - порядок смены изображений через определенный интервал времени.

    2. Панорама - широкая и многоплановая перспектива, позволяющая свободно обозревать большое открытое пространство.

    3. Интерактивная галерея - галерея, имеющая возможность управления пользователем (навигация по изображениям)

    Звуковые проигрыватели:

    1. Проигрыватель одного звукового файла - добавление в мультимедиаприложения звукового файла форматов WAV, MP3 и др. и его воспроизведение.

    2. Проигрыватель разных звуковых файлов - аналогично проигрывателю одного звукового файла, но добавление такой возможности, как переключение между последовательностью исполнения.

    3. Виртуальные музыкальные инструменты - имитация реальных музыкальных инструментов

    Приложения для Web:

    1. Баннеры - в Интернете - графические изображения или текстовые блоки рекламного характера, являющиеся гиперссылкой на веб-страницу с расширенным описанием продукта или услуги. Баннеры размещают на веб-страницах для привлечения посетителей (потенциальных клиентов) или для формирования имиджа.

    2. Приложения для передачи данных (пример: гостевая книга)

    При изучении технологии создания мультимедийных приложений строится сценарий, в котором описывается, как они будут создаваться. В связи с этим логично предположить, что каждое мультимедийное приложение состоит из различных компонент (различных тематик). Выявляя состав мультимедийных приложений, можно разбить их на следующие компоненты: выбор темы создаваемого мультимедиаприложения, разметка рабочей области (масштабы и фоны), кадры, использование слоев, создание символов разных типов, включение переменных и написание скриптов на языке программирования, работа со звуковыми файлами, добавление текста, создание эффектов, использование и импортирование изображений, использование готовых компонент-библиотек, создание навигации, использование языков разметки текста и скриптовых языков.

    Средства для создания и воспроизведения мультимедийных документов

    Существует множество технических инструментов для создания и воспроизведения мультимедийного продукта. Создатель-разработчик должен выбрать программу-редактор, которая будет использоваться для создания, например, страниц гипертекста. Разработка мультимедиадокумента возможна с помощью интегрированной среды разработки Macromedia Dreamweaver.
    Существует целый ряд мощных сред разработки мультимедиа, позволяющих создавать полнофункциональные мультимедийные приложения. Такие пакеты, как Macromedia Director, Macromedia Flash или Authorware Professional являются высокопрофессиональными и дорогими средствами разработки, в то время как FrontPage, mPower 4.0, HyperStudio 4.0 и Web Workshop Pro являются их более простыми и дешевыми аналогами. Такие средства, как Power Point и текстовые редакторы (например, Word), также могут быть использованы для создания линейных и нелинейных мультимедийных ресурсов. Средой разработки мультимедийных приложений также является Borland Delphi.
    Перечисленные средства разработки снабжены подробной документацией, которую легко читать и воспринимать. Конечно же, существует множество других средств разработки, которые могут быть с равным успехом применены вместо названных.
    В настоящее время автоматизированных обучающих систем по технологии создания мультимедийных приложений очень мало. Подобием таких систем являются страницы в сети Интернет, на которых имеется подборка уроков, книжек и статей на данную тему. Большая часть таких сайтов нацелена на темы "Уроки Flash для создания мультимедиа элементов" или "Создание мультимедиа в Macromedia Director".
    На сайтах представлено большое количество статей и уроков по Macromedia Flash, и они разделены по следующим категориям: программирование, эффекты, анимация, навигация, звук, полезные советы, 3D, новичкам, другие.
    После полного выполнения таких шагов обучаемый может сделать такой же компонент мультимедиа, который описывается в уроке.

    Форматы файлов для хранения мультимедийного документа

    Огромное количество коллекций мультимедийных документов опубликовано в сети Интернет. Для воспроизведения мультимедийных документов на компьютерах должно быть установлено необходимое программное обеспечение, иметься графические и звуковые карты, звуковые колонки или наушники. При этом видеофайлы могут храниться в разных форматах.
    Файл типа ASF (Advanced Streaming Format - формат усовершенствованных потоков) сохраняет синхронизированные мультимедиаданные. Они могут использоваться для сохранения в сети потоков видео- и аудиоданных, изображений и команд сценария.
    Файл типа AVI (Audio Video Interleave - чередующееся аудио-видео). Этот формат файлов мультимедиа используется для сохранения звука и движущегося изображения в формате файлов обмена ресурсами корпорации "Майкрософт" (Microsoft Resource Interchange File Format, RIFF). Это один из наиболее распространенных форматов, поскольку в файлах AVI можно сохранять аудио- и видеоданные.
    Файл типа MPG или MPEG (Moving Picture Experts Group) - это набор стандартов сжатия аудио- и видеоданных, разработанный группой Moving Picture Experts.
    Файл типа WMV (Windows Media Video). В файлах этого формата аудио- и видеоданные сжимаются с помощью кодека Windows Media Video. Это сильно сжатый формат, который занимает минимум места на жестком диске компьютера.
    В заключение необходимо отметить, что мультимедиадокумент включает информацию разных типов: текстовую, графическую, видео, анимацию, звуковую. Мультимедиаприложения находят широкую сферу применения. На сегодняшний день существует достаточно средств как для создания, так и воспроизведения мультимедиадокументов.

    Список источников

    1. Технический словарь. Термины и определения, (http://cncexpert.ru/technical-glossary/multimedia-document.php).
    2. Вымятнин В.М., Демкин В.П., Можаева Г В., Руденко Т.В. Мультимедиакурсы: методология и технология разработки (http://www.ido.tsu.ru/ss/?unit=223).
    3. Григорьев С.Г., Гриншкун В.В. Мультимедиа в образовании (http://www.ido.edu.ru/open/multimedia).

    Вы, наверное, обращали свое внимание, что разные видео файлы имеют различные форматы. Почему существует большое количество различных форматов видео файлов?

    Потому что изначально эти форматы разрабатывались для различных целей. В некоторых форматах можно хранить несколько звуковых дорожек и субтитры, а в файлах другого формата нет такой возможности. Одни форматы больше подходят для трансляции, а другие форматы больше подходят для редактирования.

    В этой статье будут кратко описаны наиболее популярные форматы видео файлов.

    Стандарты видео файлов

    Прежде всего, это стандарты, которые были разработаны различными международными организациями и которыми определяются кодирование и формат хранения данных медиа файла.

    • MPEG-1 (Moving Picture Experts Group 1) - это стандарты сжатия видео и аудио. Для видео используется формат Video CD, а для аудио формат MPEG audio layer 3, или сокращенно всем известный формат MP3. Это наиболее совместимый формат для проигрывания на компьютерах с CD/DVD оптическими приводами.
    • MPEG-2 (Moving Picture Experts Group 2) - этот стандарт используется в DVD и цифровом телевидении DBV. В этом формате снимают видео в различных устройствах для съемки видео.
    • MPEG-3 (Moving Picture Experts Group 3) - этот стандарт был разработан для телевидения высокой четкости HDTV, теперь стал частью стандарта MPEG-2.
    • MPEG-4 (Moving Picture Experts Group 4) - этот стандарт используется для сжатия цифрового видео и аудио. Состоит из нескольких стандартов, включает в себя многие возможности MPEG-1 и MPEG-2. В этом стандарте используются различные кодеки: DivX, Xvid, H.264 (AVC) и другие. Формат MP4 является одной из спецификаций этого стандарта.

    Медиа файл имеет несколько характеристик, которыми определяется работа с этим файлом. Это кодек, которым закодирован этот медиа файл и тип контейнера, который определяет формат записи с использованием различной информации: видео и аудио данные, субтитры и прочая информация, помещенная в контейнер.

    • Пример кодеков - DivX, Xvid, H.264, Theora.
    • Пример контейнеров - Matroska, AVI, QuickTime, Ogg, 3GP.

    Форматы видео файлов

    А сейчас рассмотрим наиболее распространенные форматы видео файлов. После установки пакета кодеков почти все рассмотренные в статье форматы должны будут воспроизводиться стандартным плеером – Windows Media Player, установленным в операционную систему Windows. Вместе с пакетом кодеков K-Lite Codec Pack устанавливается плеер Media Player Classic Home Cinema, который также будет проигрывать почти все эти форматы видео файлов.

    • 3GP - этот контейнер был разработан для использования на мобильных телефонах, в сотовой связи третьего поколения. С помощью этого формата уменьшается размер аудио и видео файла, который используется на мобильном телефоне.

    Открывается с помощью программ: VLC media player, MPlayer, QuickTime Player, RealPlayer.

    • ASF (Advanced Systems Format File) - контейнер разработанный корпорацией Microsoft для потокового аудио и видео. При использовании этого формата не требуется установки дополнительных кодеков.

    Открывается с помощью программ: Windows Media Player, Media Player Classic Home Cinema, VLC media player.

    • AVI (Audio-Video Interleaved) - контейнер разработанный корпорацией Microsoft. Это один из самых распространенных форматов видео файлов. В этом формате можно использовать различные кодеки.

    Открывается с помощью программ: Windows Media Player (Проигрыватель Windows Media), CyberLink PowerDVD, QuickTime Player, VLC media player, Winamp.

    • FLV (Flash Video) - видео формат созданный для передачи видео через Интернет. Это самый распространенный формат в сети Интернет. Широко используется на различных видеохостингах, которые предназначены для хранения видео файлов. Основными преимуществами являются: хорошее качество картинки при низком битрейте, возможность просматривать видео до полной загрузки видео файла, использование этого формата для различных операционных систем.

    Открывается с помощью программ: браузерами с помощью Adobe Flash Player, FLV Player, VLC media player, Media Player Classic Home Cinema.

    • M2TS - видео файл формата Blu-ray.

    Открывается с помощью программ: CyberLink PowerDVD, Sony Vegas, VLC media player.

    • M4V - видео файл iTunes.

    Открывается с помощью программ: iTunes, QuickTime Player, RealPlayer, Media Player Classic Home Cinema.

    • MKV (Matroska) - контейнер, который может содержать видео, аудио, субтитры и прочее. Этот формат может содержать различные типы субтитров и поддерживает добавление нескольких звуковых дорожек в видео файл.

    Открывается с помощью программ: Windows Media Player, VLC media player, Media Player Classic Home Cinema.

    • MOV - контейнер, разработанный корпорацией Apple для QuickTime. Это формат операционной системы Mac OS X. Проигрывается в операционной системе Windows. Файлы этого формата используются для хранения фильмов и различного видео. В этом формате может содержаться несколько видео и аудио дорожек, субтитры, анимация и панорамные изображения. Этот формат удобен для редактирования.

    Открывается с помощью программ: QuickTime Player, CyberLink PowerDirector, Windows Media Player.

    • MP4 - видео файл одной из спецификаций стандарта MPEG-4. Этот формат очень близок к формату MOV и обладает почти такими же возможностями.

    Открывается с помощью программ: QuickTime Player, Windows Media Player, VLC media player.

    • MTS - видео файл AVCHD (Advanced Video Codec High Definition), который содержит видео высокой четкости HD и применяется для сохранения видео файлов в видеокамерах Sony, Panasonic и других компаний.

    Открывается с помощью программ: CyberLink PowerDVD, Sony Vegas, Corel VideoStudio, Corel WinDVD.

    • Ogg - бесплатный, универсальный и открытый формат, разработанный для хранения мультимедиа файлов, закодированных различными кодеками.

    Открывается с помощью программ: VLC media player, MPlayer.

    • RealMedia - формат, созданный компанией RealNetworks. Используется в основном для трансляции телевидения и потокового видео в Интернете. Файлы этого формата обычно имеют небольшой размер, низкий битрейт и соответственно имеют более низкое качество.

    Открывается с помощью программ: RealPlayer, VLC media player, MPlayer.

    • SWF (Shockwave Flash или Small Web Format) - видео формат для флеш-анимации, векторной графики, видео и аудио в сети Интернет. Картинка, сохраненная в этом формате масштабируется без видимых искажений, видео ролик имеет небольшой размер, происходит более быстрая загрузка видео файла и его воспроизведение.

    Открывается с помощью программ: браузерами с помощью Adobe Flash Player, VLC media player, Media Player Classic Home Cinema.

    • VOB (Versioned Object Base) - это данные с оптического диска DVD-Video, которые обычно находятся в папке VIDEO_TS. Эти файлы содержат видео в формате MPEG-2, аудио и субтитры.

    Открывается с помощью программ: Windows Media Player, VLC media player, Media Player Classic Home Cinema, CyberLink PowerDVD и многими другими программами.

    • WMV (Windows Media Video) - Windows Media, разработанный корпорацией Microsoft. Для проигрывания не требуется установка дополнительных кодеков. Видео файл может быть защищен с помощью системы защиты DRM.

    Открывается с помощью программ: Windows Media Player, CyberLink PowerDVD, MPlayer.

    • WebM - открытый формат предложенный корпорацией Google, в качестве замены стандарта H.264/MPEG4.

    Открывается с помощью программ: браузерами, VLC media player, MPlayer.

    Стандарты телевизионного изображения

    Старые аналоговые стандарты:

    • NTSC - распространен в Северной Америке, часть Южной Америки, Японии и некоторые страны Азии.
    • PAL - распространен в Европе, Азии, Австралии, в части Африки и Южной Америки.
    • SECAM - распространен во Франции, в большей части стран бывшего СССР и в части стран Африки.

    Новые цифровые стандарты:

    • ATSC - Северная Америка.
    • DBV - Европа, в том числе и Россия.
    • ISDB - Япония.

    Существует еще довольно много аналоговых и цифровых форматов видеозаписи, большая часть которых была разработана конкретными производителями для выпускаемой ими техники.