माइक और स्पीकर की ऑडियो लेटेंसी मापना
सारांश (TL;DR)
पुराने USB माइक इंटरफ़ेस से acoustic गिटार रिकॉर्ड करते समय मॉनिटर हेडफ़ोन में लगभग 35 ms की round-trip लेटेंसी सुनाई देती थी। जब उसे MOTU M2 + ASIO driver पर बदला, तो 5 ms तक आ गया, और वही प्रदर्शन “बजाने लायक़ नहीं” से सीधे “स्वाभाविक” में बदल गया। “माइक में आवाज़ की और हेडफ़ोन में थोड़ी देर से सुनाई दी” बग नहीं है, round-trip latency का भौतिक प्रमाण है। लेटेंसी कुल मिलाकर पाँच चरणों का जोड़ है: माइक से sampled signal को input buffer में जमा करने का समय, DAW/संचार सॉफ़्टवेयर का processing समय, नतीजे को output buffer में जमा, DAC द्वारा analog कन्वर्ज़न, और स्पीकर से कान तक वायु प्रसारण समय (हर 34 cm पर लगभग 1 ms)। इनमें सबसे अधिक ट्यून करने योग्य पहलू buffer size और driver model हैं। ASIO, WASAPI Exclusive, Core Audio, JACK सबकी विशिष्ट न्यूनतम लेटेंसी भिन्न है, और प्लेटफ़ॉर्म सीमाएँ भी।
पृष्ठभूमि
माइक की आवाज़ स्पीकर पर लौटने से पहले कंप्यूटर के अंदर कई हिस्सों से गुज़रती है। पहले ADC analog सिग्नल को sample rate (जैसे 48 kHz) पर sample करता है, samples जमा करके input buffer में रखता है। buffer एक block (जैसे 128 samples) भर जाए तब driver software को सिग्नल सौंपता है। यहीं से input latency। 128 samples / 48 kHz = लगभग 2.67 ms — यही self में मायने रखता है।
Software (DAW, संचार ऐप) buffer को प्रोसेस करके (effects, mix, network transmit prep) output buffer में लिखता है। यह block DAC से analog बनकर स्पीकर में जाता है।
अंतिम चरण हवा में यात्रा। ध्वनि की गति कमरे के तापमान पर लगभग 343 m/s, यानी हर 34 cm पर लगभग 1 ms। हेडफ़ोन में यह लगभग शून्य, पर 1.7 m दूरी पर बैठे मॉनिटर speaker pair पर अकेले लगभग 5 ms।
Round-trip latency (RTT) = input buffer + processing + output buffer + DAC/propagation। sample rate स्थिर हो तो buffer size कम करने पर latency कम, पर CPU को ज़्यादा जागना पड़ता है, load बढ़ता है।
तुलना और डेटा
| मानदंड | ASIO | WASAPI Exclusive | Core Audio | JACK |
|---|---|---|---|---|
| प्लेटफ़ॉर्म | मुख्यतः Windows | Windows | macOS | Linux केंद्रित, cross-platform |
| विशिष्ट न्यूनतम लेटेंसी | बहुत कम, कुछ ms | कम, कुछ ms | कम, स्थिर कुछ ms | बहुत कम संभव, जटिलता के साथ |
| शेयर्ड मोड | driver पर निर्भर | shared/exclusive चुन सकते, exclusive कम | default shared पर tuned | routing matrix, multi-client |
सटीक ms मान hardware·driver·OS version पर बहुत निर्भर हैं। Focusrite Scarlett 2i2 3rd Gen या MOTU M2 जैसे entry-level इंटरफ़ेस ASIO या Core Audio के साथ single-digit ms तक आराम से उतरते हैं। Windows default WASAPI shared या ASIO4ALL पर वही hardware अलग नतीजा देता है।
वास्तविक परिदृश्य
परिदृश्य 1 — लाइव प्रदर्शन·in-ear monitoring। गायक अपनी आवाज़ in-ear में सुनते गाता है; RTT बढ़े तो आवाज़ कुछ ms देर से लौटे और tempo बिगड़े। लक्ष्य 10 ms से कम। buffer कम, ASIO/Core Audio, और संभव हो तो hardware direct monitoring। MOTU M2 के फ़्रंट पैनल मॉनिटर knob से तुरंत।
परिदृश्य 2 — पॉडकास्ट रिकॉर्डिंग। एक ही कमरे में कई लोग एक साथ न हों, तो 50–100 ms लेटेंसी भी स्वीकार्य। रिकॉर्डिंग में कम latency अनिवार्य नहीं, post-production में टाइमलाइन align कर देते हैं।
परिदृश्य 3 — वीडियो मीटिंग। ब्राउज़र WebRTC मीटिंग औसतन 100–200 ms latency दिखाती है। नेटवर्क प्रोपगेशन·encode·decode latency जुड़ती हैं। वायरलेस earphones·Bluetooth latency जुड़ने पर बातचीत overlap होने लगती है।
आम ग़लतफ़हमियाँ
“Bluetooth की latency हमेशा अधिक।” Classic A2DP आधारित transport में हाँ। पर LE Audio (LC3 codec) या aptX Low Latency जैसे low-latency codec काफ़ी कम latency देते हैं। मॉनिटरिंग·रिकॉर्डिंग के लिए वायर्ड अब भी सुरक्षित।
“USB audio हमेशा analog से बेहतर।” अच्छा DAC·low-noise preamp·driver वाला USB interface analog से साफ़। पर सस्ते USB DAC jitter·noise·driver समस्याओं से बदतर हो सकते हैं।
“192 kHz sample rate से latency कम।” एक ही ms buffer रखें तो sample rate बढ़ाने से physical समय नहीं घटता। sample-count buffer पर sample rate बढ़ने से buffer-time (ms) घटता है, पर CPU·driver stress बढ़ता है।
चेकलिस्ट
- लक्ष्य RTT तय करें। लाइव <10 ms, रिकॉर्डिंग 50–100 ms, मीटिंग 100–200 ms।
- Driver model चुनें। Windows ASIO या WASAPI Exclusive, macOS Core Audio, Linux JACK/PipeWire। MME, default WASAPI shared latency में भारी।
- Buffer धीरे-धीरे कम करें RTT घटाने के लिए, crackle से ठीक पहले तक।
- Loopback मापें। interface output-input cable से, test tone चलाएँ, output·input waveform का समय अंतर audio editor से पढ़ें।
- Sample rate प्रोजेक्ट के हिसाब से। वीडियो 48 kHz, संगीत 44.1/48 kHz उचित; 96 kHz+ केवल स्पष्ट कारण पर।
- Monitoring path जाँचें। DAW software monitoring की जगह interface direct monitoring से RTT लगभग शून्य।
संबंधित टूल
Patrache Studio का ऑडियो लेटेंसी मापन टूल ब्राउज़र में input·output path की round-trip latency का मोटा अनुमान देने के लिए बनाया गया है। इनपुट device लेटेंसी के लिए कीबोर्ड NKRO और गेमिंग इनपुट लेटेंसी देखें, और वीडियो कॉल A/V sync में वेबकैम डायग्नोस्टिक्स में कैमरा-पक्ष latency भी साथ मिलाकर जाँचें।
संदर्भ
- Steinberg ASIO official — https://www.steinberg.net/en/company/technologies/asio.html
- Microsoft Learn, Windows low-latency audio (WASAPI) — https://learn.microsoft.com/en-us/windows-hardware/drivers/audio/low-latency-audio
- Bluetooth SIG, LE Audio — https://www.bluetooth.com/specifications/specs/le-audio