[ad_1]

همه ما آنجا بوده ایم: در یک تماس ویدئویی ، چند نفر همزمان صحبت می کنند و ناگهان نمی توانید حرفهای شخصی را بشنوید. واقعیت این است که صدا برای تماس های ویدئویی – به طور کلی – کاملاً بد است و پس از یک روز طولانی صحبت ، کاربران احساس ناراحتی ، خستگی و ناامیدی می کنند. لازم نیست اینطور باشد. صنایع دیگر ، مانند صنعت بازی ، برای ایجاد یک تجربه صوتی غنی و پویا – با صدای طبیعی ناشی از سر و صدای محیط و صحنه های پیچیده صوتی که به کاربران اجازه می دهد بفهمند آیا چیزی از کناره ، جلو یا عقب می آید – راه هایی را پیدا کرده اند که کاربران می تواند ساعت ها وقت بگذارد و هنوز هم بیشتر بخواهد. آنها چگونه انجامش میدهند؟ با اولویت بندی صدای چند کاناله و کاملاً مخلوط شده. مهندسین گفتگوی ویدیویی باید نکاتی از این صنایع دیگر بگیرند و از فن آوری های موجود مانند Dolby Voice بهره بگیرند که می تواند به ایجاد تعاملات طبیعی کمک کند که ثروتمندتر ، راحت تر باشند و احساس بیشتر و بیشتر مردم را به گونه ای رقم بزنند که گویی رو در رو ملاقات می کنند.

هنجار جدید جلسات مجازی به ظاهر بی پایان در حال تغییر سریع هنجارهای اجتماعی و تحریک علاقه جدید به فناوری متصل کننده ما است. اگرچه سالهاست که سیستم عامل های کنفرانس ویدیویی وجود دارد ، اما این برنامه ها جایگزین تعامل شخصی نیستند. بعد از یک سال خستگی در مقیاس بزرگ ، وقت آن است که در مورد ویژگی ها و ویژگی هایی که باعث می شوند کاربران احساس ارتباط کنند – و چگونه می توان آنها را بهبود بخشید ، دوباره فکر کنیم. یک جنبه مهم صدا است. در حقیقت ، اگر همه افراد درگیر مکالمه بتوانند بشنوند ، می توان ادعا کرد که این مهمترین ویژگی تعامل شخصی است.

صدای خوب به ما اجازه می دهد تا نه تنها کلمات موجود در مکالمه را درک کنیم ، بلکه می توانیم حالات ناشی از صدای صوتی و اصوات محیط را نیز درک کنیم. از طرف دیگر صدای بد ما را ناامید می کند. در مکالمات ویدئویی با بیش از دو نفر – اغلب اوقات برای ساعات شادی مجازی ، جلسات تیمی و جلسات مشترک – سخنرانان همزمان ناگزیر یکدیگر را غرق می کنند. امروزه محبوب ترین سیستم عامل های گفتگوی ویدیویی با گفتگوی فوری سازگار نیستند.

اما با توجه به اینکه چند شرکت سیاست های WFH را دنبال می کنند ، روزهای تماس ویدیویی به جایی نمی روند. بنابراین برای پربارتر کردن جلسات و دیگر جلسات (و سرگرم کننده تر بودن) ، مهم است که بدانید چرا این تجربه بسیار بد است – و بدانید که راه حل هایی برای توسعه دهندگان پلتفرم های ویدیویی در دنیای بازی های ویدیویی و موسیقی وجود دارد.

چرا صدای کنفرانس ویدیویی وحشتناک است

در ابتدایی ترین سطح ، سطح میکروفون در افراد متفاوت است و به راحتی می توان موج صوتی هر شخص را در یک جریان صوتی ترکیب کرد. در برخی از سیستم عامل ها ، این می تواند منجر به تعصب بلندگو شود ، جایی که بلندترین فرد برنده می شود. دیگران فقط به جریان صوتی مجری فعال در اولویت هستند. نتیجه قطع گفتگو ، تکرار و گیجی که ما تجربه می کنیم باعث می شود افراد در چت ویدیویی متفاوت از حد معمول رفتار کنند. این یک مشکل فنی است و همه چیز به اصطلاح “فاز” بین امواج صوتی ترکیبی برمی گردد.

نحوه کار آن این است: دو موج صوتی با امضای فرکانس یکسان ، که کاملاً تراز شده اند ، دارای اختلاف فاز 0 هستند که ما آنها را “در فاز” می نامیم. وقتی امواجی که در فاز هستند با هم ترکیب می شوند ، مثل اینکه دو نفر همزمان یک حرف را می زنند ، صدایی می آورند که دو برابر بلندتر است. این مشکل وقتی بوجود می آید که دو موج صوتی در باند های فرکانسی مشابه “خارج از فاز” باشند. وقتی موجها همزمان نباشند ، شروع به لغو یکدیگر می کنند ، تا جایی که دو موج کاملاً مخالف کاملاً لغو می شوند. هدفون های حذف نویز با این کار عمدی کار می کنند.

در بیشتر تماس های ویدئویی ، مشکلات فاز در توانایی شنیدن صحبت های دیگران ایجاد می کند. هنگامی که امواج صوتی گفت و گو ترکیب می شوند ، این امر منجر به لغو قسمتهای مختلف امواج ، نقاط تقویت صدای تصادفی و تنظیم فرکانس پر سر و صدا بین فازها و فازهای خارج از فاز چرخه موج می شود.

یک مشکل اضافی وجود دارد: کنفرانس ویدیویی برای جلسات اداری طراحی شده است ، جایی که می توانید انتظار یک محیط آرام را داشته باشید (اگرچه حتی در یک محیط ایده آل ، اکثر خدمات دارای نقاط ضعفی هستند). چه اتفاقی می افتد که بخواهیم در واقع قهوه بخوریم ، معاشرت کنیم ، در یک کلاس رقص شرکت کنیم و سایر کارهایی که معمولاً خارج از کار انجام می دهیم؟ سیستم عامل ها معمولاً صدا را فیلتر می کنند تا وقتی که مردم صحبت نمی کنند ، از میزان فرکانس ها کم کنند. در ترکیب با مشکلات فاز فوق الذکر ، این بدان معناست که صدای فراگیر را نمی توان بدون کاهش بیشتر (یا لغو کامل) فهم گفتگو ، در تماس های ویدیویی امروز وارد کرد. بنابراین ، صدای شهری ترافیکی ، هیپ هاپ دهه 90 مورد علاقه شما در پس زمینه کافه یا یک آهنگ پاپ پویا که باعث ایجاد روحیه می شود ، برای IRL محفوظ است. این ناامیدکننده است. بدون سر و صدا ، وقتی از صحبت کردن فاصله می گیریم ، از سکوت رنج می بریم که روحیه ما را از بین می برد.

با این وجود نیازی به پذیرش این محدودیت نداریم. در حالی که فناوری چت ویدیویی چالش هایی را در مورد ریتم طبیعی گفتگو و روحیه محیط ایجاد می کند ، اما در فضاهای دیگر مانند موسیقی و بازی ها ، برای مدتی فناوری صوتی نقطه کانونی پیشرفت بوده است.

آنچه شرکت های گفتگوی ویدیویی می توانند از موسیقی و بازی یاد بگیرند

وقتی وارد یک محیط مجازی می شوید ، مثلاً چند نفره Call of Duty ، بگویید ، در یک دیدگاه اول شخص غوطه ور می شوید که می توانید ساعت ها را بدون زحمت در آن سپری کنید. تصادفی نیست که گیمرها نسبت به کاربران پلتفرمی مانند زوم کمتر خسته می شوند. این تجربه بصری با توانایی داشتن وضوح صوتی کامل از نظر صدای محیط ، جلوه های صوتی اکشن ، گفتگوی یک هم تیمی مجازی و موارد دیگر همراه است. در حالی که ممکن است یک انفجار در مقابل شما رخ دهد ، شما می توانید صدای جیرجیرک را در دوربین محیطی خود بشنوید و صدای هم تیمی های خود را در مرکز صحنه در سمت راست ، همه در هدفون های خود ببینید. به زبان ساده ، این امر به دلیل نگاشت صدا (یا اختلاط) امکان پذیر است. با تلاش برای قرار دادن وسایل در یک فاصله و جهت مشخص از کاربر ، امواج صوتی با پردازش سیگنال که برای کاهش چالش های مرحله بندی و سر و صدا کار می کنند ، جمع می شوند.

این آنالوگ موسیقی را نیز حمل می کند. اگرچه ممکن است متوجه این موضوع نشوید ، از زمانی که ما برای ایجاد یک تجربه واحد چند صدا را اضافه کردیم ، موسیقی نیاز به میکس دارد. در موسیقی ، تهیه کنندگان نه تنها آواز را برای خواننده های اصلی و پس زمینه میکس می کنند ، بلکه به طور یکپارچه سیم ، شاخ ، باس و سازهای دیگر را برای ارائه آهنگ های محبوب اضافه می کنند. مهندسان صوتی اطمینان حاصل می کنند که سازها با یکدیگر برخورد نمی کنند ، میزان صدای آهنگ صحیح است و احساس اصلی آهنگ از طریق مرحله بندی صحیح (فیلتر کردن ، فشرده سازی و غیره) از ترکیب عبور می کند.

اگر صدا را از موسیقی (یا بازی های ویدیویی) مقایسه کنید ، می بینید که کنفرانس ویدیویی تا کجا باید پیش رود. چشمان بسته به یکی از آهنگهای مورد علاقه خود گوش دهید – در جایی که آوازها روی صحنه صدا می نشینند ، در مقایسه با سایر سازهای ملودی ، بشنوید. سپس ، دفعه بعدی که با دو نفر دیگر روی رایانه خود با Google چت می کنید ، به همه صداها گوش دهید. مشاهده خواهید کرد که در گپ ویدیویی از صحنه صدا به میزان لازم استفاده نمی شود.

توسعه دهندگان چت ویدیویی می توانند از مهندسان صوتی در صنعت موسیقی بهره ببرند ، که ده ها سال مسئول ارائه یک تجربه صوتی تقریباً عالی بوده اند. در نظر بگیرید که چگونه می توان این موضوع را با صدای یک جلسه مجازی مشترک تطبیق داد. تصور کنید یک نفر بیشتر به سمت چپ ، دیگری بیشتر به راست می شنوید ، در حالی که موسیقی اطراف در خارج از صحنه پخش می شود. اکنون تعامل طبیعی تری دارید و با دادن فضای بیشتری به مرحله صدا برای هدایت چت ویدیویی ، مغز کاربر در حقیقت صدای گفتگو با منبع صفحه را بهبود می بخشد. این روش باعث می شود کاربر جهت گیری بهتری داشته باشد ، که در نهایت منجر به کاهش خستگی مقیاس بندی می شود.

چت ویدیویی بهتری بسازید

همانطور که صدا به عنوان بخشی کلیدی از گفتگوی ویدئویی مورد توجه قرار می گیرد ، شرکت هایی مانند Pilotly (جایی که من مدیر عامل شرکت هستم) و BlueJeans اقداماتی را برای حرکت به سمت آینده تحول مجازی انجام داده اند. هر دو شرکت با همکاری با رهبران در فضای پردازش صدا ، الگوریتم هایی را برای چت تصویری استفاده کرده اند که از طریق مخلوط کردن صدا با ثبات ، وضوح بیشتری را در مورد گفتگو ایجاد می کنند.

BlueJeans که اخیراً توسط Verizon خریداری شد ، یکی از اولین کسانی بود که برای بهبود تجربه کاربری خود با Dolby همکاری کرد. آنها برای قرار دادن گفتگوی واضح در ارزش پیشنهادی خود ، Dolby Voice را شامل می شوند ، سیستمی که می تواند سطح صدا را عادی کند ، برای پهنای باند صدای خاص بهینه سازی کند ، نویز را کاهش دهد و برای جلوگیری از لغو هنگام صحبت بسیاری از طرفین ، در ابر مخلوط شود. ملاقات.

ممکن است شرکت های دیگر نیز از این الگو پیروی کنند. در حال حاضر دالبی در تلاش است تا برنامه ها بتوانند قابلیت های صوتی خود را بهتر کنند. پل باست ، معمار ارشد گروه تجارت ارتباطات دالبی ، می گوید گسترش استفاده از این فناوری ها برای شرکت در اولویت است. وی می گوید: “من بیش از 20 سال به عنوان محقق ، مهندس و معمار در ارتباطات صوتی و تصویری تخصص داشتم.” “من واقعاً اصرار داشتم که ارتباطات آنلاین را تا حد ممکن طبیعی کنم.”

پلتفرم چت تصویری Pilotly ، Reelchat ، بر ایجاد یک محیط مجازی متشکل از یک تجربه بازی است. اولین برنامه Reelchat گروه های متمرکز مجازی است ، در آنجا مهم است که مکالمه های سریع و آزاد داشته باشید که بتوانید همزمان بیش از یک نفر را بشنوید – درست مثل یک قرار ملاقات یا یک ساعت خوش. این یکی از دلایلی است که ما اولویت صدا را ایجاد می کنیم تا حداکثر راحتی و شهود را برای شرکت کنندگان در مکالمه ایجاد کنیم. ما بر این باوریم که کلید کارکرد فعل و انفعالات انسانی مجازی انتقال کاربر به فضایی است که صدا در آن به طور طبیعی وجود دارد.

تنظیم و تسریع پیشرفت در فناوری گفتگوی ویدیویی برای موفقیت در تجارت ، تحصیلات عالی و ارتباطات اجتماعی بسیار مهم است ، زیرا ما همچنان از محدودیت های شدیدی در تعامل IRL ها در طی یک بیماری همه گیر رنج می بریم. صدا ، که مدتهاست به عنوان یک عامل اصلی در تجربه بینایی از دید بصری مورد غفلت واقع می شود ، آینده تعامل است. بازی ها و موسیقی این را درک می کنند و توسعه بعدی سیستم عامل های همکاری و جلسات خوب است که از همان نوع میکس موسیقی در تجربه کاربری خود الگوبرداری کنیم.

[ad_2]

منبع: bighat-news.ir