Доклад
на партнерской конференции
Передача Audio, Video и KVM по IP:
решения, опыт, истории успеха

Существующие на текущий момент способы и решения по передаче аудио-видео по IP

Санкт-Петербург - 2017
Конференция «Передача Audio, Video и KVM по IP: решения, опыт, истории успеха» транслировалась в прямом эфире. Буквально за полчаса была развернута трансляция онлайн. Это прямая иллюстрация того, что современные технологии позволяют реализовать очень быстро и дешево многие решения, которые раньше были сложны для реализации.
Павел Куделин
В своем докладе я хочу собрать разные варианты использования аудио видео по сети, которые на текущий момент доступны в России. В технические детали решений буду углубляться только чуть-чуть, и только для того, чтобы стало понятно, что сейчас в тренде, что уходит, что теоретически работает, но на практике пока не используется.

Знаю, что на конференции присутствуют не только системные интеграторы, но и конечные клиенты, потребители AV решений. Думаю, что им эта информация будет особенно полезна при выборе конкретного проекта для внедрения.

Оглавление
Передача звука по IP
На мой взгляд, важно понимать, что сейчас происходит с передачей звука потому, что очень частая задача интегратора - передавать только аудио. Например, недавно мой коллега Антон Старов решал большую серьезную задачу аудио коммутации в Сколково.

Протокол CobraNet для передачи звука


Характеристики:
  • Для использования необходимы специализированные сетевые карты;
  • Работает на любых Ethernet-коммутаторах;
  • Сетевые задержки 1 - 5,33 мс;
  • На одном сетевом интерфейсе может работать 64 х 64 аудио каналов


Некоторое время назад для передачи звука по IP использовался протокол CobraNet. Он позволяет передавать 64 аудио канала через 100 мегабитную сеть в цифровом виде и принимать их там, где разбросаны корпоративные сети. Никаких ограничений нет.

Очень много для развития CobraNet в России сделала компания Biamp потому, что долгое время ее устройства целиком и полностью работали на этом протоколе.

Объективно надо признать, что сегодня CobraNet ушел с рынка, его осталось крайне мало.

Протокол Dante для передачи звука

Характеристики:
  • Работает на любых Ethernet-коммутаторах;
  • Максимальная пропускная способность 1 000 Mbps;
  • Сетевые задержки 0.2 - 5 мс;
  • На одном сетевом интерфейсе может работать 64х64 аудио каналов



Главное преимущество этого протокола в том, что сейчас многие производители делают различные устройства сразу с Dante-интерфейсом на борту, например:

  • Усилители, в которые можно просто воткнуть "хвост" Dante через обычную витую пару (Cat-5), и устройство будет по ней получать аудио из сети.

  • Сетевые физические карты Dante. После установки такой виртуальной карты на ноутбук или компьютер, можно принимать и отправлять большое количество цифровых аудио потоков.

  • Акустические системы (хотя на текущий момент они достаточно дороги), сразу с Dante-интерфейсом на борту.

Пример построения тракта

Многие производители конференцсистем сегодня сразу выдают звук в Dante, например, Bosch и Televic. Это очень удобно потому, что таким образом достаточно в центральный блок включить витую пару и забирать через сетевой коммутатор на микшер или на аудиоплатформу столько каналов звука, сколько есть.

Схема решения, которую мы реализуем сейчас


Плюс, если необходимо, ставится конвертер, например, от компании Shure, который мы очень любим. Он позволяет свои аудио источники (микрофоны, радиомикрофоны, другие источники в зале) загнать в сеть Dante.

Полезные новинки

Сейчас компания Amphenol, которая известна в России, как производитель разных разъемов, выпускает устройство Amphenol Amphe-Dante adapter (цена в розницу 18 000 рублей). Этот адаптер позволяет с одной стороны воткнуть сеть Dante, а с другой вытащить 2 аудиоканала – не важно, поддерживает устройство Dante или нет.

Многие производители, в том числе ClearOne, сразу начали делать радио микрофоны, у которых приемный блок «запихивает» аудио в Dante.

Это просто иллюстрация того, что Dante-интерфейс сейчас очень распространен. Можно проектировать звук исключительно на Dante сети, и это оказывается очень и очень удобно.
Стандарт AES67
В свое время большой винегрет разных интерфейсов передачи по витой паре унифицировали стандартом HDBaseT. Точно так сейчас AES67 создан для того, чтобы уладить разногласия между различными интерфейсами передачи аудио по IP.

Я рассказал только про CobraNet и Dante, но на самом деле их очень много.
Стандарт AES67 позволяет совершенно нормально интегрировать разных производителей между собой внутри одной сети.
Передача видео + аудио
Протокол AVB/TSN

Характеристики:

  • Требуется сетевое оборудование c поддержкой AVB;
  • Работает на скорости от 1 Гбит/с;
  • Сетевые задержки ~1 – 2 мс;
  • На одном сетевом интерфейсе может работать 420 х 420 аудиоканалов


Исторически сложилось, что передача видео + аудио по сети в России началась с протокола AVB, когда некоторое время назад компания Biamp анонсировала, что она поддерживает протокол AVB (передача по гигабитной или 10-гигабитной сети).

Все вздохнули с облегчением – наконец-то все проблемы будут решены!
AVB (правильнее AVB/TSN) – это в большей степени инженерный протокол. То есть он относится не только к мультимедиа. С его помощью передаются различные данные, в том числе управление и синхронизация.

Я был удивлен, когда узнал, что протокол AVB используется внутри машин BMW для того, чтобы связать всю электронику и управление.
В целом все интересно потому, что можно использовать 1 гигабитную сеть на фиксированных задержках примерно в 1-2 мс (это очень мало) и получать передачу до 4К разрешения.

Единственная проблема – для работы AVB нужны специализированные коммутаторы с поддержкой AVB. Если, например, аудио протоколы CobraNet и Dante могут работать на обычных сетевых коммутаторах – включил и работаешь – то AVB требует, по сути, изменения сетевой инфраструктуры, что далеко не всегда возможно.

Производители рекомендуют коммутаторы Extreme Networks, которые заявили себя с точки зрения поддержки AVB. Для Cisco нужны отдельные прошивки, и то далеко не факт, что они заработают. Даже сам Biamp говорит о том, что это не всегда возможно. И все это стоит некоторого количества денег.

На мой взгляд, именно необходимость специализированных сетевых коммутаторов ограничивает развитие AVB.

Реализация: Biamp Tesira LUX

В России сейчас началась продажа новой мультимедийной платформы Biamp Tesira LUX для передачи аудио и видео по стандарту AVB. Это энкодер и декодер, каждый стоит 4 480 $. То есть пара приемников - почти 9 000 $. Далеко не каждый проект потянет такую цену.
Стандарт SMPTE 2022

Помимо этого есть серия стандартов SMPTE 2022, которые используются на телевидении. В студиях испокон веков применялся SDI интерфейс, но в какой-то момент начали делать SDI по IP - как раз семейство протоколов SMPTE 2022.


Реализация: Atlona Omnistream

Компания Atlona сейчас использует как раз протокол SMPTE 2022 для передачи аудио/видео по гигабитным сетям.

Характеристики:
  • Работа в сетях 1 Гбит/с;
  • Передача UHD @60;
  • Поддержка HDR формата;
  • Кодек VC-2
Здесь ценник чуть-чуть получше - 2800$ + 2800$ = 5 600$ за пару приемник/передатчик, но это примерно тот же ценовой сегмент, что и Diamp Tesira LUX.
Протокол NDI
Компания NewTek – производитель мультимедийного оборудования, в том числе пультов для бродкастинга и телевизионных студий, некоторое время назад начала распространять протокол NDI.

Характеристики:
  • Работа в сетях 10 Гбит/с;
  • Передача UHD @60 (до 4К);
  • Сетевые задержки 1-2 мс

Сам протокол подразумевает, что всю студию вещания или монтажа можно перевести на IP - на обычную гигабитную сеть. Вся инфраструктура и работа значительно упрощаются:

  • Можно использовать обычные гигабитные сетевые коммутаторы;
  • Уже нет зависимости от расстояний в 100 метров;
  • Возможность вещания в разном качестве в разные сети, в том числе включения с мест событий с телефона или планшета; интервью с экспертами по Skype.

И это все бесплатно. Точнее – условно бесплатно. Почему условно? Потому, что сама компания NewTek заинтересована в том, чтобы люди переводили все на стандарт NDI, используя ее же пульты для управления каналами внутри сети.

Но интересность заключается в том, что сейчас многие компании делают оборудование с уже интегрированным внутрь протоколом NDI. Например, в новой линейке камер для конференц-залов от Panasonic NDI уже присутствует (ключевая буковка N в названии модели). Можно поставить абсолютно бесплатное приложение себе на ноутбук, и принимать эти каналы, мониторить их.

Мне кажется, для некоторых инсталляций это может быть очень интересный вариант.

К сожалению, другие производители пока к NDI не подключились. Я нашел на текущий момент только лишь один конвертер, который позволяет SDI или HDMI интерфейс сконвертировать в NDI протокол. Это устройство стоит 1500 $, но в России я не нашел, кто бы его продавал.
Протокол RTP + кодек JPEG2000*


Характеристики:

  • Видео 4K60 4:4:4 по стандартному Gigabit Ethernet;
  • Поддержка расширенного динамического диапазона HDR

    Мы уже говорили о том, что многие производители выбирают из открытых или закрытых протоколов. На самом деле всегда хочется сделать так, чтобы видео сигнал передавался без задержек, но еще и в открытых протоколах, что далеко не всегда возможно.

    Поэтому компания Crestron совсем недавно выпустила свою новую линейку NVX DM-NVX-350. Это устройства для передачи аудио и видео по гигабитным сетям в 4К разрешении.

    Цена: 3 881$ + 3 881$ (пара приемник-передатчик). Хотя само устройство универсально – оно может работать и как приемник, и как передатчик.
    NVX DM-NVX-350 использует стандартный протокол доставки RTP, но модифицированный кодек JPEG2000. Это позволяет очень сильно снизить время задержки при передаче видео.

    Проблема в том, что ничем, кроме этого устройства, видео/аудио сигнал получить нельзя, например, с помощью VLC плеера. То есть пользователь снова оказываемся заложником оборудования, которое предлагает сам производитель.
    Протокол RTP + кодек H.264/265


    Характеристики:

    • Качество до 1080p60 Bit;
    • Rates: 100 Kbps to 25 Mbps;
    • Полоса 1000 Mbps;
    • Полностью открытый интерфейс

      Компания Matrox, известная, как производитель видеокарт для построения контроллеров видеостен, предлагает свое решение для передачи видео и аудио контента по IP. Это отдельная серия Matrox Maevex - приемники и передатчики (по сути энкодеры и декодеры) на классическом кодеке H.264. В скором будущем планируется выпуск устройства на кодеке 265.

      Здесь уже ценник более-менее внятный - 1187$ + 720$, то есть 2 000$ за пару устройств.

      Идея заключается в том, что передается только Full HD/60 кадров, но, так как это абсолютно открытый кодек H.264, то можно использовать передатчик, чтобы загнать потоки в сеть, а ловить их уже софтом, например, VCL плеером или другими декодерами. Это позволяет сделать систему открытой. Мне кажется, это интересно.

      • Минус решения – задержки.
        Так как используется открытый кодек, то сразу же увеличивается время доставки видео, что далеко не во всех приложениях возможно.
      Протокол HD over IP

      Компания TNTv выпускает модель TNT MMS-520, в которой есть доставка RTP, но с помощью своего кодека HD over IP.


      Характеристики:

      • Качество до 1080p60
      • Полоса 1000Mbps
      • Построение видеостен

        Стоимость 333$ + 333$, сейчас чуть-чуть повысилась.

        Это тоже Full HD на 60 кадрах. Пользователь здесь также ограничен использованием данного оборудования, поскольку находится внутри линейки производителя.
        Чем отличаются решения?
        Закономерный вопрос – чем отличаются друг от друга представленные решения, кроме цены?

        А они отличаются!

        Прежде, чем ответить на этот вопрос, рассмотрим 3 большие группы решений, для которых используется передача аудио и видео по IP.
        Сопровождение процессов
        Например, решение, в котором видео поддерживает выступающего, когда его не видно с последних рядов. В этом случае выступление спикера снимается на камеру и транслируется на большой экран.
        Корпоративное ТВ,
        когда контент отображается в разных точках пространства.
        Digital Signage -
        то же самое, только для клиентов.
        Главные отличия решений рассмотрим, исходя из требований этих задач. Я хочу, чтобы вы попробовали думать именно с точки зрения проектировщика потому, что в зависимости от условий задачи будут совсем разные требования к выбору оборудования.
        Задача:
        Сопровождение встреч, обсуждений



        Отличие #1:
        Задержка при передаче


            Первое важное отличие – разная задержка при передаче сигнала. Это хорошо видно на 3 разных варианта видео. Мы снимали их разными камерами, иногда на телефон, поэтому не обращайте внимание, если вдруг сама картинка будет не очень качественная.
            Мы использовали крамеровское оборудование. Оно отлично работает, но именно за счет того, что это открытый кодек H.264, здесь самая большая задержка при передаче, она визуально видна.
            Здесь уже сложно определить, где HDMI, а где передача по IP.
            Этот кодек используется в оборудовании Atlona - достаточно дорогое решение. Но здесь задержка вообще не заметна, хотя это 4К ролик. Сам производитель заявляет задержку в полкадра, которую визуально вообще не видно.
            Эти 3 видео наглядно продемонстрировали – разница есть. Каждый кодек дает разную задержку при передаче видео и это необходимо учитывать при разработке решения, в зависимости от того, какая задача реализуется.
            Например, кодек VC-2 и OmniStream от Atlona в максимальном качестве захватывает полосу в 900 Мб. По большому счету он целиком занимает гигабитный поток. Картинка Full HD хорошо видна, начиная с потока в 200-250 Мб. То есть, если говорить про небольшую задержку решения, поток, на который можно ориентироваться – это примерно 200-250 Мб/с на 1 Full HD канал.
            При использовании кодека H.264 полоса сильно меньше. Например, конференция транслировалась H.264 в прямом эфире на потоке 2 Мб. Разница существенная. Люди смотрели трансляцию с задержкой в 20-30с, и это связано не с кодеком, а с тем, что YouTube буферизирует картинку для того, чтобы транскодировать ее на разные разрешения.
            Мы тестировали разные варианты. Оптимальный вариант для H.264 (показа Full HD 30 к/с) – 5-6 Мб. Выше улучшения уже не сильно различимы глазу, ниже – задержка существенно хуже
            Святослав Кульгавый, директор по продажам компании Колан (TNTv)
            Задача: Дублировать контент на персональные устройства участников

            Задача актуальна для больших залов, в которых участникам плохо видны мелкие детали на экране. Можно транслировать презентации на мобильные устройства участников так, чтобы они могли отслеживать происходящее на своем планшете или телефоне.

            Исходя из этой задачи, существуют особые требования к передаче видео по IP, например:
            • Маленькая полоса и небольшая частота обновлений – для того, чтобы больше людей подключилось.
            • Использование стандартных кодеков - поскольку не известно, с каких устройств люди будут заходить, и вряд ли возможно им принудительно поставить всем сразу специализированное приложение или мобильный сайт.
            • Звук не важен – он не транслируется, следовательно, не важны ни синхронизация видео и звука, ни отставание звука от передаваемой картинки.
            Надеюсь, логика понятна. Есть еще одно важное отличие:

            Отличие #2:
            Возможность работать с другим оборудованием


                • В системе, закрытой саму на себя, невозможно решить задачу дублирования контента на сторонние устройства.
                Открытые протоколы (есть возможность)
                Закрытые протоколы (нет возможности)
                Обратите внимание, что у некоторых производителей есть и открытые, и закрытые (проприетарные) протоколы.

                Например, у EXTRON есть открытый кодек для H.264, и есть собственный закрытый протокол с минимальной задержкой EXTRON PURE3. У TNTv есть STREAMING H.264 для работы в VAN и LAN, а есть LAN STREAMING для работы только в LAN.

                Исходя из этого, думайте и решайте, что вам больше подходит.
                Задача: Быстро развернуть корпоративное ТВ или множество дисплеев и точек отображения

                Исходя из этой задачи, какие требования важны, а какие - нет? Важны:

                • Цена – потому, что, судя по задачке, точек много.
                • Простота – действительно, если говорить про большое количество дисплеев в аэропортах или в барах, то в случае поломки надо быстро поменять неисправное оборудование – нет времени на долгую настройку.
                • Возможность использования текущей инфраструктуры – потому, что если много разных дисплеев и они расположены, где угодно, тащить провода очень дорого.
                Поэтому в данном случае можно использовать уже не открытые кодеки, а закрытые системы. Главное, чтобы они были дешевые, удобные и позволяли использовать существующую сеть.
                Это и есть логика рассуждений.

                Отличие #3: Скорость переключения

                    Это отличие менее очевидное. Дело в том, что если аудио-видео по IP используется для переключения разных источников, то нужно обратить внимание, что эти переключения могут занимать разное время.

                    У некоторых производителей это будет 1-2 с. У других, например, Atlona – 10-15 с просто потому, что сама система спроектирована, скорее, для магистральной передачи видео. Она не предназначена для того, чтобы быстро переключать видео с одного источника на другой. После настройки магистрали система стабильно работает. Это тоже важный критерий.
                    Скриншот Virtual Matrix Management System (Atlona).
                    Здесь есть отдельный сервер управления, в котором осуществляется коммутация передаваемых потоков.
                    ОБНОВЛЕНО 28.11.2017
                    Представительство Atlona в РФ прислало нам видео демонстрации переключения оборудования после недавней прошивки. Как видно, время переключение сократилось до 3-4 секунд.
                    Комментарии от представительства Atlona
                    Демонстрация переключения оборудования Atlona на новой прошивке. Обновлено 28.11.2017 г
                    • К сожалению, надо признать, что эта информация нигде не прописана. Я не перестаю ругаться на красиво оформленные маркетинговые буклеты. В них много красивых картинок, на которых счастливые люди держат черные коробочки, но крайне мало информации, с какими проблемами я, как проектировщик, столкнусь.
                    Отличие #4: Качество и разрешение

                    Над этим отличием я предлагаю подумать. Сейчас производители очень сильно упирают на возможность передачи картинки в 4К разрешение.

                    Но кто в реальности использует 4К? Кому это действительно нужно? Где используются 4К?

                        Важный момент – если просто показывать такую картинку на обычный дисплей диагональю 46-50 и даже 60 дюймов, то чаще всего разница между Full HD и 4К не видна.

                        Действительно, 4К имеет место быть в некоторых проектах, например, в панорамном видео 360° или в видео стенах с реальным разрешением. Люди чаще всего очень хорошо понимают, когда им нужно 4 К. В остальных случаях достаточно Full HD.

                        Стоит ли гнаться за 4К всегда? На мой взгляд, в большинстве проектов 4К объективно излишен. Поэтому, несмотря на то, что это разрешение прописано, как ключевое достоинство, не стоит его рассматривать, как вау!-характеристику.

                        Я не говорю уже о том, что пойдите и найдите контент 4К!

                        Если вы его сами снимаете, это другой вопрос. Но я, например, снимая периодически контент, крайне редко использую 4К потому, что это сильно увеличивает себестоимость производства – съемка, монтаж, хранение, и т.д.
                        • Поэтому 100 раз подумайте, прежде чем использовать 4К в тех случаях, когда можно обойтись Full HD.
                        Вопросы-ответы
                        - Вы в свое время говорили о том, что до сих пор используются средства аналоговые и цифровые. Насколько Вы в своей работе перешли от одного вида к другому?
                        - Мне кажется, уже все перешли к цифре. Я вижу, что аналог остался только в 2 случаях:

                        1. Когда совсем нет бюджета, то есть когда действительно нет денег на проектирование на цифре.
                        2. Когда очень сложно модернизировать существующее решение потому, что в нем остаются аналоговые «хвосты». Не важно, какого рода – это может быть VGA интерфейс или еще и передача аналогового видео по сети через старые стандартные приемники-передатчики.

                        Мне кажется, что сейчас нет смысла проектировать на аналоге или на аналоге по IP. Мы можем встретиться с этим, когда либо нет денег, либо почему-то нельзя заменить.
                        - Насколько сейчас производители раскрывают подробности своих сетевых протоколов для IT решений? Любому рядовому сетевику важно знать сетевые параметры.
                        - Чаще не раскрывают, но не потому, что не хотят, а потому, что не могут. Например, я сталкивался с ситуацией - не буду называть фамилии - когда я спрашивал коллег из представительств производителей о каких-то данных, а их не было. Обычно это долгая история – запрос инженеров в головной офис где-нибудь за рубежом, и тогда, если повезет, что-нибудь пришлют.

                        Думаю, что если Вам это нужно, то совершенно точно спрашивать надо сильно заранее потому, что времени пройдет много, прежде чем Вам ответят.
                        - Какие видео интерфейсы наиболее перспективны сегодня? Что сейчас живет, и что будет жить?
                        - Мне кажется, что HDMI все равно никуда не уйдет, его так много, что от него избавиться уже не получится. Это совершенно точно! Дальше возникает вопрос – что будет приживаться? Я пока не вижу, честно говоря, каких-то серьезных заявок на победу. Можно говорить про DisplayPort – но нет, все-таки устройств с ним не много.

                        Есть HDBaseT, как потенциально интересный вариант. Но, например, он далеко не везде может быть использован. Дело в том, что многие сферы его совсем не любят. Например, люди, связанные с прокатом, с бродкастингом, или с шоу индустрией, увидев несчастный сосок Rg45, очень сильно пугаются.

                        Мне кажется, в какие-то сферы, возможно, придет что-то еще, например, тот же HDBaseT. Ведь HDMI родился, как консьюмерский стандарт – для обычных пользователей, для домашнего использования. А сейчас все в HDMI. Думаю, что то же самое может произойти с HDBaseT, который изначально тоже разрабатывался для дома, в том числе.

                        Тем более, уже появился HDBaseT over IP. То есть до этого был HDBaseT, как «точка-точка», а HDBaseT over IP позволяет завернуть HDBaseT в IP.

                        Не все производители используют эту фичу, но в стандарт HDBaseT 2.0 это заложено еще несколько лет назад.

                        Это действительно перспективно, поскольку позволяет еще больше унифицировать разные устройства от разных производителей.

                        Видеозапись выступления на конференции
                        Часть 1. Передача по IP звука (CobraNet, Dante, AES67) и видео + аудио (AVB/TSN, SMPTE 2022)
                        Часть 2. Протоколы NDI, RTP + кодек JPEG2000*, RTP + кодек H.264/265, HD over IP. Чем отличаются решения.
                        Часть 3
                        Чем отличаются решения (продолжение). Ответы на вопросы