آموزش, ترفندها

اتصالات دیجیتال در سیستم‌های صوتی

اتصالات دیجیتال در سیستم‌های صوتی

در حدود ده سال پیش، موضوع اتصال تجهیزات دیجیتال برای نخستین بار مطرح شد. از آن زمان تاکنون، اصول و روش‌های مورد استفاده تغییر چندانی نداشته‌اند، اما بسیاری از رابط‌های آن دوران دیگر مورد استفاده قرار نمی‌گیرند. در حال حاضر، استفاده از اتصال دیجیتال میان تجهیزات، به یکی از بخش‌های رایج و همیشگی در کارهای روزمره‌ی استودیویی تبدیل شده است.

امروزه با وجود چند تفاوت جزئی در هر دسته، در عمل تنها دو خانواده‌ی اصلی از رابط‌های اختصاصی صدای دیجیتال به‌طور گسترده مورد استفاده قرار می‌گیرند: فرمت AES3 و فرمت ADAT.
فرمت نخست عمدتاً برای برقراری اتصال‌های استریو یا دو‌کاناله طراحی شده است، در حالی که رابط ADAT قابلیت انتقال حداکثر تا هشت کانال صوتی را دارد.

انواع رابط دیجیتال

رابط AES3

در حال حاضر، یکی از پرکاربردترین و شناخته‌شده‌ترین فرمت‌های رابط در سیستم‌های صوتی دیجیتال، AES3 و نسخه‌های مشتق‌شده از آن است.
AES3  در سال ۱۹۸۵ به‌عنوان یک استاندارد باز توسط انجمن مهندسی صدا (AES) با همکاری اتحادیه‌ی پخش اروپا (EBU) معرفی شد. این رابط در ابتدا با نام AES-EBU شناخته می‌شد، اما امروزه عنوان رسمی آن AES3 (یا IEC-60958 Type I) است.
این استاندارد در طول سال‌ها چندین بار مورد بازنگری و به‌روزرسانی قرار گرفته و آخرین نسخه‌ی آن در سال ۲۰۰۳ منتشر شده است.

استاندارد AES3 استفاده از کابل زوج به‌هم‌تابیده ۱۱۰ اهم با یک شیلد محافظ کامل را الزامی می‌کند و دو سر کابل با کانکتور سه‌پین XLR متصل می‌شوند.
مانند صداهای آنالوگ متداول، سیگنال از کانکتور نری (Male) خارج و به کانکتور مادگی (Female) وارد می‌شود، و سیم‌کشی نیز به همین شکل است: شیلد در پین ۱ و سیگنال تفاضلی در پین‌های ۲ و ۳ قرار می‌گیرد.
با این حال، برخلاف صداهای آنالوگ بالانس، این رابط به قطبیت سیگنال حساس نیست. در عوض، از کدگذاری Biphase Mark استفاده می‌شود که در آن داده‌های باینری با تغییرات ولتاژ نمایش داده می‌شوند، نه با مقدار مطلق ولتاژ.

استفاده از کابل‌های XLR برای AES3 با هدف آشنا و آسان کردن رابط صورت گرفت، اما با نگاه فنی، این انتخاب چندان ایده‌آل نبوده است. داده‌های AES3 معمولاً به‌صورت موج‌های مربعی با دامنه تا ۷ ولت پیک‌تو‌پیک و فرکانس پایه حدود ۱.۵ مگاهرتز منتقل می‌شوند. واضح است که هارمونیک‌های فرد که برای حفظ شکل موج مربعی ضروری هستند، تا حدود ۱۰ مگاهرتز نیز گسترده می‌شوند و این نیاز فراتر از پهنای باند کاری اکثر کابل‌های میکروفون است.

بنابراین، برای عملکرد مطمئن—به‌ویژه در مسافت‌های طولانی—ساختار کابل نقش حیاتی دارد. استاندارد AES3 برای انتقال در حداکثر ۱۰۰ متر طراحی شده است و اگرچه با کابل‌های مناسب می‌توان مسافت بیشتری را پوشش داد، استفاده از کابل‌های معمولی میکروفن معمولاً پس از تنها ده متر، باعث از دست رفتن سیگنال AES3 می‌شود.

البته، امروزه کابل‌های ۱۱۰ اهم که به‌طور خاص برای کاربردهای AES3 طراحی شده‌اند، به‌وفور در دسترس هستند و همیشه باید از آن‌ها استفاده کرد، نه از کابل‌های معمولی میکروفون. با این حال، در بسیاری از موارد، رویکرد مهندسی بهتری استفاده از روش‌های مشابه تکنولوژی ویدئو است، زیرا فرکانس سیگنال‌ها بسیار شبیه به یکدیگر است.

رابط‌های ویدئویی معمولاً با کانکتورهای BNC و کابل‌های کواکسیال ۷۵ اهم (غیرمتعادل) انجام می‌شوند و طول کابل تا ۱۰۰۰ متر به‌راحتی قابل دستیابی است. به همین دلیل، در سال ۱۹۹۵، AES به‌روزرسانی‌ای برای رابط AES3 منتشر کرد تا امکان اتصال غیرمتعادل با استفاده از کانکتورهای BNC و کابل‌های ۷۵ اهم فراهم شود. این نسخه که با نام AES3-id شناخته می‌شود، به‌طور گسترده در حوزه‌های پخش و حرفه‌ای مورد استفاده قرار گرفته است، به‌ویژه توسط شرکت‌هایی مانند Sony و Dolby.

ولتاژ سیگنال معمولاً ۱ ولت پیک‌تو‌پیک است و حداکثر محدوده انتقال ۱ کیلومتر در نظر گرفته شده است.

کلاک مرجع (Reference Clocks)

در سیستم‌های استودیویی بزرگ، بهترین روش استفاده از یک ساعت اصلی جداگانه (Master Clock) برای کل سیستم است و همزمانی (سینک شدن) تمام تجهیزات با آن انجام می‌شود.

یک ساعت اصلی (Master Clock) ساده شامل ژنراتور ساعت با دقت و پایداری بسیار بالا است که قادر به ارائه چندین خروجی مستقل می‌باشد. معمولاً این خروجی‌ها به شکل فیدهای Word Clock مستقیم از طریق کانکتورهای BNC یا مرجع‌های AES11 بر روی کانکتورهای XLR (و در برخی موارد جک‌های فونو) ارائه می‌شوند. گاهی نیز خروجی ‘Superclock’ مشاهده می‌شود، اما این نوع خروجی عمدتاً تنها در سخت‌افزار قدیمی Pro Tools کاربرد داشته است.

Word Clock یک سیگنال ساده‌ی موج مربعی است که با نرخ نمونه‌برداری (Sample Rate) اجرا می‌شود و بیشتر دستگاه‌ها قابلیت سینک شدن به سیگنال Word Clock خارجی را دارند.

AES11 در واقع یک سیگنال استاندارد AES3 است که یک مرجع دقیق ساعت را منتقل می‌کند. معمولاً داده‌های صوتی همراه آن شامل سکوت (Silence) هستند، اما گاهی از سیگنال AES11 برای پخش Tone تنظیمی (Line-Up Tone) یا سایر سیگنال‌های صوتی مفید استفاده می‌شود.

در بسیاری از موارد، سیگنال AES11 می‌تواند برای همگام‌سازی تجهیزات از طریق ورودی‌های صوتی مورد استفاده قرار گیرد، حتی اگر ورودی Word Clock در دستگاه وجود نداشته باشد.

سیگنال AES11 به‌وضوح یک اتصال نقطه‌به‌نقطه (Point-to-Point) است: از ساعت اصلی (Master Clock) به یک دستگاه منفرد منتقل می‌شود. برای دستیابی به پایدارترین عملکرد، Word Clock نیز بهتر است به همین شکل استفاده شود، اما امکان زنجیره‌ای کردن (Daisy-Chain) اتصالات Word Clock بین چندین دستگاه با استفاده از T-Pieceهای BNC وجود دارد.

این روش کاملاً بی‌نقص نیست (برخلاف اتصال نقطه‌به‌نقطه) و نیازمند ترمینیشن ورودی قابل سوئیچ در هر دستگاه است. تنها دستگاه آخر در زنجیره باید ترمینیشن ۷۵ اهم داشته باشد و باقی دستگاه‌ها باید ورودی با امپدانس بسیار بالا ارائه دهند تا از بارگذاری خط با امپدانس تطبیق‌یافته جلوگیری شود. اگر ترمینیشن ورودی Word Clock قابلیت غیرفعال شدن نداشته باشد، نمی‌توان از روش Daisy-Chaining استفاده کرد.

برخی از ساعت‌های اصلی پیشرفته‌تر دارای ژنراتور ویدئو هستند یا قابلیت دریافت سیگنال مرجع ویدئویی خارجی را دارند. این موضوع زمانی اهمیت پیدا می‌کند که با ویدئوی دیجیتال کار می‌کنید، زیرا تمامی VTRهای دیجیتال نیازمند تعداد صحیح و کامل نمونه‌های صوتی به ازای هر فریم ویدئو در نرخ نمونه‌برداری ۴۸ کیلوهرتز هستند.

بنابراین، همگام‌سازی نرخ فریم ویدئو و نرخ نمونه‌برداری دیجیتال ضروری است و ساده‌ترین روش برای انجام این کار این است که هر دو سیگنال مرجع توسط یک دستگاه تولید شوند یا Word Clock خود به مرجع ویدئویی ارجاع داده شود.

رابط S/PDIF

نسخه داخلی رابط AES3 تحت عنوان S/PDIF (Sony/Philips Digital InterFace) شناخته می‌شود و در استاندارد IEC-60958 Type II مستندسازی شده است. از نظر الکتریکی، این رابط شباهت بالایی با فرمت AES3-id دارد، اگرچه پیش از آن معرفی شده است، و برای عملکرد صحیح به کابل‌های کواکسیال ۷۵ اهم با کانکتورهای فونو (RCA) نیاز دارد.

ولتاژ سیگنال به مقدار ۰.۵ ولت پیک‌تو‌پیک کاهش یافته و مشخصات استاندارد حداکثر طول انتقال ۱۰ متر را برای انتقال پایدار تعریف می‌کند.

بار دیگر، به دلیل استفاده از کانکتورهای آشنا و رایج، ممکن است افراد به اشتباه از هر کابل فونو به فونو معمولی برای اتصال تجهیزات دیجیتال استفاده کنند. هرچند این روش ممکن است در فواصل کوتاه کار کند، اما قابلیت اطمینان رابط کاهش یافته و دستگاه‌ها به میزان قابل‌توجهی نسبت به Jitter حساس‌تر خواهند بود (مطابق توضیحات بخش بعدی).

نسخه‌ای از S/PDIF نیز مبتنی بر فیبر نوری وجود دارد که معمولاً با نام شرکت معرفی‌کننده آن شناخته می‌شود: Toshiba Toslink. کانکتور آن به عنوان JIS F05 تعریف شده و رابط آن با استاندارد EIAJ CP340-optical مطابقت دارد.

به طور خلاصه، جریان داده‌ی استاندارد S/PDIF برای روشن و خاموش کردن یک LED قرمز در فرستنده استفاده می‌شود. در سمت گیرنده، حسگر نوری پالس‌های نور را شناسایی کرده و آن‌ها را دوباره به سیگنال الکتریکی S/PDIF تبدیل می‌کند.

بیشتر کابل‌های Toslink از فیبر نوری پلاستیکی ۱ میلی‌متری ارزان‌قیمت استفاده می‌کنند، اما نسخه‌هایی با فیبرهای باکیفیت‌تر نیز وجود دارند که گاهی چند رشته‌ای هستند تا انعطاف بیشتری داشته باشند. بهترین نوع آن‌ها از فیبر کوارتز شیشه‌ای ساخته شده است، اما این نوع بسیار گران‌قیمت و نادر است، حتی در دستگاه‌های حرفه‌ای Hi-Fi.

عدم وجود اتصال الکتریکی از طریق فیبر باعث می‌شود Loopهای زمین (Ground Loops) ایجاد نشوند، که معمولاً یک مزیت محسوب می‌شود. در تجهیزات دیجیتال، Ground Loop معمولاً باعث ایجاد صدای وزوز قابل شنیدن نمی‌شود، اما می‌تواند فرآیند دیکد کردن داده‌های صوتی را مختل کرده و باعث ایجاد کلیک‌ها یا قطع‌های کوتاه شود.

فیبرهای با کیفیت پایین رفتار مشابه کابل‌های نامطلوب دارند و باعث تضعیف قابل توجه سیگنال دیجیتال می‌شوند و Jitter افزایش یافته و قابلیت اطمینان کاهش می‌یابد.

رابط MADI

آخرین نسخه‌ی مبتنی بر AES3 که با نام MADI (Multi-channel Audio Digital Interface) شناخته می‌شود، با هدف فراهم کردن اتصال ساده بین کنسول‌های میکس دیجیتال و رکوردرهای چندکاناله طراحی شد. این رابط در سال ۱۹۹۱ تحت عنوان AES10 منتشر شد و برای انتقال ۵۶ کانال صوتی (به صورت ۲۸ جفت AES3) از طریق یک کابل کواکسیال با کانکتورهای BNC طراحی شده بود.

با این حال، نسخه‌ی بهبود یافته‌ای در سال ۲۰۰۳ با نام Extended MADI یا MADI-X معرفی شد که امکان انتقال ۶۴ کانال در نرخ نمونه‌برداری ۴۸ کیلوهرتز و ۳۲ کانال در ۹۶ کیلوهرتز را فراهم می‌کند. بسیاری از پیاده‌سازی‌ها از فیبر نوری یا کابل Cat5 به جای کابل کواکسیال استفاده می‌کنند. رابط فیبر نوری به ویژه در صداگذاری زنده و پخش خارج از استودیو مفید است، زیرا ایزولاسیون کامل الکتریکی از ایجاد Ground Loop و مشکلات احتمالی ایمنی الکتریکی جلوگیری می‌کند.

امروزه MADI به طور فزاینده‌ای برای اتصال DAWهای کامپیوتری به کنسول‌ها یا برای لینک کردن چندین دستگاه در اتاق ماشین به کنترل روم مجزا با استفاده از یک کابل یا فیبر استفاده می‌شود. چندین تولیدکننده اکنون رابط‌های MADI ارائه می‌دهند که ADI6432 از شرکت RME یکی از جامع‌ترین و نوآورانه‌ترین نمونه‌ها به شمار می‌رود.

یکی از تفاوت‌های مهم MADI با سایر رابط‌های مبتنی بر AES3 این است که سیگنال ساعت تعبیه‌شده ندارد. بنابراین، همیشه نیاز به یک سیگنال ساعت جداگانه برای همگام‌سازی دستگاه‌های مبدأ و مقصد وجود دارد.

لرزش (Jitter)

اصطلاح Jitter بسیار شنیده می‌شود، اما تعداد کمی مفهوم دقیق آن را درک می‌کنند. این واژه به عدم قطعیت در زمان‌بندی یک سیگنال دیجیتال اشاره دارد و می‌تواند به روش‌های مختلفی ایجاد شود. با این حال، معمولاً تنها در زمینه مبدل‌های A-D و D-A مشکل‌ساز است.

یک مدار ساعت با کیفیت پایین می‌تواند در صورت ناپایداری، دچار Jitter شود، اما امروزه این مشکل عمدتاً در تجهیزات دیجیتال مصرفی ارزان‌قیمت مشاهده می‌شود و در تجهیزات حرفه‌ای نادر است.

از منظر عملی، Jitter معمولاً در کابل‌ها و فیبرهای نوری ایجاد می‌شود. دلیل آن این است که کابل‌ها ذاتاً دارای ظرفیت خازنی هستند و فیبرها دچار پراکندگی نوری (Optical Dispersion) می‌شوند. در هر دو حالت، این اثر باعث تغییر و تار شدن لبه‌های پالس‌های داده می‌شود و زمان‌بندی آن‌ها نامشخص می‌گردد. هرچه کابل یا فیبر بلندتر یا کیفیت پایین‌تر باشد، مشکل شدیدتر و قابل توجه‌تر خواهد بود.

با این حال، هنگام انتقال صدای دیجیتال بین دو دستگاه — مانند یک رکوردر و DAW یا کنسول و ریورب دیجیتال — مقادیر جزئی Jitter در کابل هیچ تأثیری ندارد. رابط‌های AES3 و ADAT به‌گونه‌ای طراحی شده‌اند که مقدار بسیار زیادی تغییرات زمانی را تحمل کنند و Jitter باید به میزان فوق‌العاده‌ای بالا باشد تا مشکلی ایجاد کند.

جایی که Jitter اهمیت پیدا می‌کند، زمانی است که سیگنال بین دامنه آنالوگ و دیجیتال تبدیل می‌شود. تغییرات زمانی در این مرحله باعث می‌شوند که نمونه‌ها در زمان نادرست گرفته یا بازسازی شوند و این موضوع منجر به مدولاسیون نویز، ایجاد آرتیفکت‌های صوتی سطح پایین و ناپایداری تصویر استریو خواهد شد.

به همین دلیل، توصیه می‌شود مبدل A-D را به عنوان ساعت اصلی (Clock Master) سیستم انتخاب کنید. به این ترتیب، تبدیل A-D توسط ساعت داخلی مبدل کنترل می‌شود که معمولاً بسیار پایدار و بدون Jitter است. خروجی دیجیتال ارسالی به رکوردر یا DAW تحت تأثیر Jitter ناشی از کابل قرار نخواهد گرفت.

اگر از ساعت اصلی خارجی اختصاصی استفاده می‌کنید، یا باید آن را با مبدل A-D همگام‌سازی کنید، یا از آن برای کلاکینگ مبدل A-D با کوتاه‌ترین کابل ممکن بهره ببرید.

در حالت ایده‌آل، یک مبدل D-A باید دارای ورودی ساعت مرجع خارجی باشد تا اطمینان حاصل شود که سیگنال از یک ساعت بسیار پایدار تبدیل می‌شود، نه از ساعت تعبیه‌شده و پر از Jitter در سیگنال ورودی. با این حال، تعداد کمی از مبدل‌ها چنین ویژگی‌ای دارند.

راه‌حل بسیار مؤثر در این شرایط، جدا کردن ساعت تعبیه‌شده ورودی از ساعت تبدیل با استفاده از بافر شناور (Floating Buffer) یا مبدل نرخ نمونه‌برداری (Sample-Rate Converter) است. به عنوان مثال، شرکت Benchmark این رویکرد را در DAC1 خود به کار گرفته است و بسیاری از تولیدکنندگان دیگر نیز استراتژی‌های پیشرفته‌ای برای ایزوله کردن ساعت تبدیل از ساعت تعبیه‌شده ورودی ارائه می‌دهند.

فرمت داده AES

تمام این رابط‌ها — AES3، AES3-id، S/PDIF و MADI — داده‌های صوتی را به روش پایه‌ای یکسانی منتقل می‌کنند. داده‌ها به صورت سریالی و در قالب فریم‌های جداگانه ارسال می‌شوند و نقطه‌ی شروع هر فریم توسط یک پری‌آمبل کوتاه (Preamble) با توالی داده متمایز مشخص می‌گردد. این پری‌آمبل، Word Clock تعبیه‌شده را فراهم کرده و فریم را به عنوان یکی از 192 فریم متوالی مشخص می‌کند (که در ادامه به جزئیات آن پرداخته خواهد شد).

هر فریم شامل دو ساب‌فریم (Sub-frame) است که هر کدام قادر به انتقال تا ۲۴ بیت داده صوتی به همراه مقداری داده کنترلی (Housekeeping Data) می‌باشند. نمونه صوتی با کم‌اهمیت‌ترین بیت ابتدا (LSB first) ارسال می‌شود و بیت‌های استفاده‌نشده به صفر تنظیم می‌گردند.

پس از نمونه صوتی، چهار بیت مجزا با نام‌های V، U، C و P قرار دارند.

  • بیت P یک بررسی توازن ساده (Parity Check) است که برای شناسایی خطاهای ساده در اتصال رابط استفاده می‌شود و هیچ مکانیزم تصحیح خطا وجود ندارد.
  • بیت V نشان‌دهنده‌ی اعتبار داده (Data Validity) است و به مبدل D-A می‌گوید که آیا نمونه را تبدیل کند یا خروجی را بی‌صدا (Mute) کند. برای مثال، اگر بررسی توازن (Parity Check) شکست بخورد، بیت اعتبار روی وضعیت نمونه نامعتبر قرار می‌گیرد و D-A به جای تلاش برای بازتولید نمونه، آن را میان‌یابی (Interpolate) می‌کند.

بیت‌های User (U) و Channel Status (C) برای انتقال اطلاعات پیشرفته‌تر مربوط به برنامه (Programme-related) استفاده می‌شوند، اما واضح است که با یک بیت به ازای هر نمونه صوتی نمی‌توان کار زیادی انجام داد. به همین دلیل از ترتیب ۱۹۲ فریم که پیش‌تر اشاره شد استفاده می‌شود.

بیت Channel Status که همراه هر نمونه منتقل می‌شود، تا زمانی که تمام ۱۹۲ فریم جمع‌آوری شوند ذخیره می‌گردد (که معادل ۲۴ بایت می‌شود). سپس این داده‌ها دیکد و تفسیر شده و اطلاعات مفیدی را ارائه می‌کنند.

به‌عنوان مثال، اولین بایت اطلاعات پایه‌ای مانند نرخ نمونه‌برداری و اینکه داده‌ها نمایانگر صدای PCM خطی (Linear PCM) هستند یا خیر را منتقل می‌کند. این موضوع اهمیت زیادی دارد، زیرا رابط می‌تواند فرمت‌های فشرده داده مانند Dolby E در محیط‌های حرفه‌ای و Dolby Digital یا DTS در تجهیزات مصرفی را نیز منتقل کند و این فرمت‌ها باید قبل از خروجی‌دهی دیکد شوند. اگر این داده‌ها به‌صورت خام (Raw) پخش شوند، نتیجه صدایی شبیه نویز سفید با دامنه کامل خواهد بود که obviously نامطلوب است.

بایت‌های بعدی داده‌های Channel Status نشان می‌دهند که داده‌ها مربوط به یک کانال منفرد یا استریو هستند، طول کلمه نمونه (Sample Word Length)، شناسایی کانال در کاربردهای صداهای فراگیر (Surround Sound)، پایداری ساعت تعبیه‌شده (Embedded Clock)، کدهای ساده مبدأ و مقصد (هر کدام شامل چهار کاراکتر ASCII)، مرجع تایم‌کد (Timecode Reference) و همچنین برخی داده‌های حفاظت از خطا برای محافظت از بیت‌های Channel Status را مشخص می‌کنند.

با توجه به نیازهای متفاوت، تعجب‌آور نیست که اختلافاتی در تخصیص و تفسیر بیت‌های Channel Status بین کاربردهای حرفه‌ای (AES3) و نیمه‌حرفه‌ای (S/PDIF) وجود داشته باشد. در روزهای اولیه، این موضوع گاهی باعث ایجاد مشکلات می‌شد، به‌ویژه هنگام کار با محتوای دارای حق نشر بین تجهیزات حرفه‌ای و مصرفی. خوشبختانه، امروزه این مشکل به ندرت رخ می‌دهد، زیرا بیشتر تجهیزات اکنون به اندازه کافی پیشرفته و توانمند هستند که بتوانند با این مسائل کنار بیایند.

بیت User متصل به هر نمونه صوتی، یک جریان داده سریالی پیوسته (Continuous Serial Data Stream) ایجاد می‌کند. این بیت گرچه در محیط‌های حرفه‌ای به ندرت کاربرد دارد، اما در تجهیزات خانگی برای انتقال اطلاعات تکمیلی مانند شماره تراک‌ها و زمان‌های اجرای CD مورد استفاده قرار می‌گیرد.

کاربردهای با سرعت بالا (High-Speed Applications)

AES3 و S/PDIF در ابتدا برای پشتیبانی از نرخ نمونه‌برداری تا ۴۸ کیلوهرتز طراحی شده بودند. معرفی نرخ‌های نمونه‌برداری دوگانه (۸۸.۲ و ۹۶ کیلوهرتز) در ابتدا مشکلاتی ایجاد کرد، زیرا پهنای باند مورد نیاز افزایش یافته و فراتر از قابلیت‌های اکثر مدارهای رابط بود.

راه‌حل اولیه، استفاده از دو رابط AES3 و دو کابل بود که اغلب با عنوان ‘Double Wide’ شناخته می‌شود. در این حالت، به جای اینکه هر فریم AES3 شامل یک جفت نمونه استریو باشد، دو نمونه متوالی از همان کانال منتقل می‌شود تا نرخ نمونه‌برداری دو برابر را پوشش دهد. با این حال، برای انتقال کانال دوم، یک رابط AES3 دیگر لازم است.

اگرچه این راهکار عملی و قابل اجرا بود، اما ناکارآمد و دست و پاگیر بود و به‌زودی مدارهای رابط بهبود یافتند تا بتوانند با دو برابر سرعت رابط اولیه عمل کنند. بدین ترتیب، صدای استریو با نرخ ۸۸.۲ یا ۹۶ کیلوهرتز می‌توانست از طریق یک رابط AES3 واحد منتقل شود و اگرچه در ابتدا به آن ‘Double Fast’ گفته می‌شد، اکنون روش استاندارد برای کار با محتوای دو برابر نرخ نمونه‌برداری محسوب می‌شود.

برای نرخ‌های چهارگانه (۱۷۶ یا ۱۹۲ کیلوهرتز)، روش معمول در حال حاضر گسترش حالت ‘Double Wide’ است که از دو رابط تک‌کاناله با نرخ دو برابر استفاده می‌کند.

امروزه بسیاری از تجهیزات دارای چندین خروجی هستند و در حالی که قابلیت ۶۴ کاناله MADI-X اغلب بیش از حد نیاز است، اکثر شرکت‌ها رابط هشت کاناله را روی کانکتور ۲۵ پین D-sub ارائه می‌دهند تا چهار جریان AES3 موازی ورودی و خروجی فراهم شود. با این حال، چندین روش سیم‌کشی متفاوت و ناسازگار وجود دارد.

شرکت Tascam یک چیدمان خاص پیاده‌سازی کرده که توسط Digidesign و SADiE نیز پذیرفته شده و نزدیک‌ترین گزینه به یک استاندارد کنونی محسوب می‌شود. متأسفانه، رابط‌های مشابه اما ناسازگار در تجهیزات Yamaha، Genex و Euphonix وجود دارند و در غیاب آداپتورهای تجاری رابط، تنها راهکار عملی، استفاده از کابل‌های سفارشی است.

رابط ADAT

رابط ADAT ‘Lightpipe’ در سال ۱۹۹۱ برای دستگاه Alesis Digital Audio Tape طراحی شد و از کانکتور فیبر نوری Toslink استفاده می‌کند، اما فرمت داده کاملاً متفاوتی از S/PDIF دارد. این رابط برای انتقال تا هشت کانال صوتی با نرخ نمونه‌برداری ۴۸ کیلوهرتز و تا ۲۴ بیت به ازای هر نمونه طراحی شده است و به یکی از محبوب‌ترین روش‌ها برای اتصال تجهیزات نیمه‌حرفه‌ای تبدیل شده است.

برای پشتیبانی از نرخ‌های نمونه‌برداری بالاتر، فرمت اصلی Lightpipe توسط شرکت Sonorus با استفاده از تکنیک‌های تقسیم بیت (Bit-Splitting) اصلاح شد. S/MUX (مخفف Sample Multiplexing) اساساً کانال‌ها را با نمونه‌ها مبادله می‌کند؛ به این معنی که می‌توان ۸ کانال تا ۴۸ کیلوهرتز داشت، اما تنها ۴ کانال تا ۹۶ کیلوهرتز یا ۲ کانال تا ۱۹۲ کیلوهرتز منتقل کرد. امروزه اکثر تولیدکنندگان که رابط‌های ADAT Lightpipe را پیاده‌سازی می‌کنند، از افزونه S/MUX نیز پشتیبانی می‌کنند.

کلاکینگ

برخلاف اتصالات آنالوگ ساده، رابط‌های دیجیتال نیازمند همگام‌سازی ساعت (Clock Synchronisation) بین دستگاه مبدأ و مقصد هستند. اگر یک سیستم دیجیتال به‌درستی کلاکینگ نشود، در بهترین حالت ممکن است صدای کلیک یا خرابی‌های کوتاه ایجاد شود و در بدترین حالت، دستگاه‌ها به‌طور کامل بی‌صدا شده و کار نمی‌کنند! به زبان ساده، این کلیک‌ها زمانی ایجاد می‌شوند که یک دستگاه در حال جستجوی نمونه ورودی است اما نمونه‌ای در زمان مورد انتظار پیدا نمی‌کند زیرا به زمان اشتباه نگاه می‌کند.

این کلیک‌ها اغلب هنگام پخش اکثر انواع محتوای صوتی کاملاً غیرقابل تشخیص هستند، اما توصیه می‌شود هر بار که تنظیمات ساعت‌دهی سیستم دیجیتال تغییر می‌کند، آن را با یک نمونه آزمایشی بررسی کنید. انجام این تست تنها حدود نیم دقیقه زمان می‌برد، اما می‌تواند از ساعت‌ها کار تکراری جلوگیری کند — و این توصیه از تجربه شخصی است!

برای این کار تنها به یک منبع مطمئن از موج سینوسی با فرکانس بالا نیاز است. یک CD تست تجاری کافی است، اما می‌توانید فایل تست خود را نیز بسادگی بسازید: یک موج سینوسی حدود ۴ کیلوهرتز و سطح -۱۸dBFS ایده‌آل است. اگر تنها چیزی که می‌شنوید صدای سوت صاف و ثابت است، ساعت‌دهی سیستم درست است. با این حال، هر گونه کلیک نشانه‌ای از خطای ساعت‌دهی در جایی از سیستم است.

همگام سازی ساده  (Simple Synchronisation)

به جز رابط MADI که پیش‌تر ذکر شد، تمامی رابط‌های AES3 و سیستم ADAT Lightpipe دارای ساعت تعبیه‌شده (Self-Clocking) هستند؛ یعنی همه آن‌ها ساعت منبع را به همراه سیگنال منتقل می‌کنند. بنابراین، در یک سیستم ساده، دستگاه گیرنده می‌تواند فقط با استفاده از ساعت تعبیه‌شده منبع، همگام شود. در بسیاری از موارد، این فرآیند کاملاً خودکار انجام می‌شود: برای مثال، یک مبدل D-A به‌طور خودکار با سیگنال ورودی همگام می‌شود و یک رکوردر CD هنگام ضبط، به‌طور خودکار با ورودی دیجیتال همگام می‌گردد.

در سیستم‌های پیچیده‌تر، مانند DAWها یا کنسول‌های دیجیتال، معمولاً یک سوئیچ روی پنل جلویی یا منوی نرم‌افزاری برای انتخاب منبع ساعت مورد نیاز وجود دارد. به‌طور معمول سه گزینه در دسترس است: ورودی دیجیتال، مرجع Word Clock (یا ویدئو) خارجی، و ساعت داخلی. انتخاب هر یک بستگی به پیکربندی سیستم دارد، اما نتیجه نهایی باید همیشه همگام‌سازی دستگاه با ورودی‌های دیجیتال باشد.

ساده‌ترین راهکار، انتخاب ورودی مربوطه به‌عنوان منبع ساعت و استفاده از ساعت تعبیه‌شده آن است. با این حال، اگر آن دستگاه قطع، خاموش یا نرخ نمونه‌برداری آن تغییر کند، ممکن است سیستم ناپایدار و بدون ساعت شود. همچنین، اگر بخواهید همزمان با بیش از یک منبع کار کنید، نیاز به راهکار پیچیده‌تر و پیشرفته‌تر خواهید داشت.

انتخاب ساعت داخلی تضمین می‌کند که DAW یا کنسول همیشه پایدار باشد و با نرخ ساعت مشخصی عمل کند، اما لازم است اطمینان حاصل کنید که سایر تجهیزات دیجیتال نیز با آن همگام شوند. برای این کار، باید Word Clock (یا سیگنال ساعت دیگر) را از DAW/کنسول به ورودی‌های مرجع ساعت دستگاه‌های منبع منتقل کرده و آن‌ها را برای همگام‌سازی با ساعت خارجی تنظیم کنید. این روش کاملاً معتبر است، اما تنها زمانی قابل اجراست که دستگاه منبع قابلیت Slave شدن به ساعت خارجی را داشته باشد — قابلیتی که در بسیاری از تجهیزات مصرفی و نیمه‌حرفه‌ای وجود ندارد.

اگر دستگاه منبع قابلیت همگام‌سازی با ساعت خارجی نداشته باشد، دو راهکار وجود دارد:
۱. آن دستگاه را به ساعت اصلی (Master Clock) تبدیل کرده و DAW یا کنسول را به آن Slave کنید
۲. از مبدل نرخ نمونه‌برداری (Sample-Rate Converter – SRC) استفاده کنید تا خروجی دستگاه با سیستم همگام‌سازی شده به نظر برسد

در روش دوم، ساعت مرجع از DAW یا کنسول برای همگام‌سازی خروجی SRC استفاده می‌شود، در حالی که دستگاه منبع مستقل با ساعت داخلی خود کار می‌کند و SRC اختلافات زمانی بین دو منبع را اصلاح می‌کند.

راهکار جایگزین…

یک روش جایگزین که نباید نادیده گرفته شود، صرف‌نظر از رابط‌های دیجیتال و اتصال دو دستگاه با استفاده از اتصالات آنالوگ است. این روش همیشه کارآمد است، تمام مشکلات ساعت‌دهی را حذف می‌کند و با مبدل‌های مدرن تقریباً هیچ تفاوت شنیداری قابل توجهی احساس نخواهید کرد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *