دستگاه حضور و غیاب تشخیص گفتار چگونه کار می کند؟

دستگاه حضور و غیاب  به صورت گفتار و صدا
دستگاه حضور و غیاب تشخیص گفتار چگونه کار می کند؟
دستگاه  تشخیص گفتار پس از ساخت یک مدل دیجیتال از صدای فرد می تواند به عنوان نمونه ایی از صدای فرد ذخیره شود. کلمات و عبارات و واژه ها به انواع مختلف نمونه های فرکانسی تقسیم می شوند که با یکدیگر ترکیب می شوند و روش مخصوصی برای هر فرد توصیف میشود. این الگوها در پایگاه داده جهت مطابقت با دیگر انواع داده های بیومتریک ذخیره می شوند.
این سیستم ها می توانند وابسته به متن، یا جدا از متن باشند و یا گاهی ترکیبی از دوتای آنها باشد. برای مثال می توانند جهت شناسایی کارمندان در دستگاه های کنترل دسترسی و حضور و غیاب مورد استفاده قرار گیرند. در سیستم های وابسته به متن، اعداد یا عبارت کلمه عبور ذکر شده با نمونه ای از کلمات مشابه که به هنگام ثبت نام ذخیره شده بود، مقایسه می گردد و کاربر تایید یا رد می شود . تکنولوژی جدا از متن نیازی به ذکر کلمه عبور خاصی ندارد بلکه ویژگی های صوتی مخصوص به فرد شخص سخنران به هنگام حرف زدن تحلیل و بعد از آن شناسایی می شود.
کاربردهای عملی تشخیص صدا و گفتار:
فناوری تشخیص صدا و گفتار در تمامی دستگاه ها برای اولین بار نیازمند یک میکروفون برای شنیدن است. احتمالا شما اپلیکیشن تشخیص صدا در تلفن همراه خود دارید. در گوشی های اندروید اپلیکیشن OK Google و در ویندوز10 برنامه Cortana شرکت مایکروسافت می توانند جستجو و وظایف اصلی را بر اساس فرمان صوتی انجام دهند.(مانند پخش کردن موزیک، برقراری تماس تلفنی، جستجوی اینترنتی و...)                               برای نگهداری و محافظت و دسترسی فیزیکی نیز می توان از تکنولوژی تشخیص گفتار استفاده کرد، به عنوان مثال برای ورود پرسنل به قسمت انبار یا آزمایشگاهها کاربرانی که قبلا هویت خود را با فناوری تشخیص گفتار ثبت نموده اند، اکنون می توانند از مکان هایی که در پروفایلشان تعریف شده است به آسانی تردد نمایند. تایید هویت با شناسایی گفتار همراه با GPS برای ردیابی نگهبانان امنیتی جهت اطمینان از اینکه واقعا سر پست خود هستند و شخص دیگری به جای آنها حاضر نشده است، بسیار مورد استفاده می باشد.
اپلیکیشن بانکی USAA از تشخیص چهره و تشخیص صدا استفاده می کند تا شرایط آسان و در عین حال امنی را برای مشتریان فراهم نماید که در این میان فناوری تشخیص گفتار قدرت بالایی در تشخیص زودهنگام نسبت به سایر عامل های شناسایی تشخیص هویت دارد.
از آنجایی که کاربرد تمام انواع بیومتریک در حال افزایش است، احراز هویت مبتنی بر صدا یک رویکردی است که به نظر می رسد پرسنل در مقابل این فناوری مقاومت کمتری نسبت به سایر تکنولوژی ها نشان می دهند زیرا این فناوری بدون تماس بوده و کاربران بسیار آسان با آن ارتباط برقرار می کنند.
به رسمیت شناختن صدا جهت احراز هویت به طور چشمگیری در مرکز تماس(Call Center) نتایج خوبی در برداشته است. Swisscom، یکی از بزرگترین ارتباطات مخابراتی در سوئیس، به تازگی فناوری تشخیص گفتار را در مرکز تماس خود  راه اندازی نموده است.
فناوری تشخیص صدا و تشخیص گفتار مبتنی بر نرم افزار و تکنولوژی بدون تماس بیومتریک هستند. به همین خاطر در بین سایر تکنولوژی های بیومتریک، به عنوان راحتترین عامل شناسایی هویت شناخته شده است. با افزایش فناوری اینترنت اشیا ، فناوری تشخیص گفتار نیز در بین افراد جایگاه متفاوتی کسب کرده است. فناوری تشخیص صدا، همچنین فرمان صوتی نیز نامیده می شود زیرا به کاربران اجازه می دهد تا با حرف زدن با فناوری ارتباط برقرار کرده و آنها را کنترل نمایند. امروزه استفاده از فناوری تشخیص صدا به قدری در دستگاه های تلفن همراه گسترش پیدا کرده است که کار با آن خیلی راحتر از قبل شده است. فناوری تشخیص گفتار فرصت های شگفت انگیز و بهتری برای سازمان ها ایجاد کرده است و نسبت به سایر روش ها از درجه اطمینان بالاتری برخوردار است.
تفاوت فناوری تشخیص صدا و تشخیص گفتار:
تشخیص صدا و تشخیص گفتار دو روش مجزا از هم هستند که به دلیل وابستگی به صدای انسان، به میزان قابل توجهی از جهاتی با یکدیگر شباهت دارند. اولین قدم برای شناخت این تکنولوژی بیومتریک درک تفاوت اصلی بین تشخیص صدا و گفتار است. توانایی سیستم برای پردازش "آنچه که یک نفر می گوید" تشخیص صدا و "تایید شخص سخنران" مبتنی بر فیزیولوژیک و رفتار صوتی او جهت تایید هویت، تشخیص گفتار نامیده می شود. در حقیقت، تشخیص گفتار یک تکنولوژی رابط کاربری است که با اندازه گیری صدای کاربر هنگام صحبت کردن، می تواند فاکتورهای بیولوژیکی یکتایی را با هم ترکیب نموده و صدای منحصر به فردی را تولید و ذخیره نماید.
بر اساس نظرسنجی( Unisys شرکت جهانی در حوزه فناوری اطلاعات)، فناوری های بیومتریک بر اساس اولویت مصرف کنندگان عبارتند از: تشخیص صدا (32٪)، اثر انگشت (27٪)، اسکن چهره (20٪)، هندسه دست (12٪) و اسکن عنبیه چشم (10٪) است. این رتبه بندی تایید می کند که افراد هنگام انتخاب یک تکنولوژی بیومتریک راحتی و آشنایی را ترجیح می دهند.

تشخیص هویت با صدا (شناسایی گوینده):
 
گفتار هر گوینده شامل اطلاعاتی در مورد هویت فرد است و نرم‌افزار تشخیص هویت گوینده ،برای تعیین هویت گوینده، از آن استفاده می‌کند. در فرایند شناسایی گوینده، اطلاعاتی از سیگنال گفتار استخراج می‌شود که در بردارنده مشخصات گوینده است و باعث می‌شود وی از بین گویندگان مختلف از روی صحبت کردن شناسایی شود. از مزیت‌های تشخیص هویت از روی صدا به عنوان یک روش بیومتریک این است که صدای فرد همیشه همراه وی بوده و مثل رمز یا کارت شناسایی امکان به سرقت رفتن ندارد و بر خلاف ویژگی‌هایی مثل عنبیه و اثر انگشت می‌تواند بدون حضور فیزیکی و از راه دور (مانند پشت تلفن) نیز مورد استفاده قرار گیرد. آموزش صدای افراد به صورت مستقل از متن انجام می‌گیرد و متن زمان آموزش و تست می‌تواند متفاوت باشد.

مزایای دستگاه تشخیص صدا و گفتار:
دقت و سرعت شناسایی بالا
استفاده به عنوان ماژول  برای برنامه نویسان
 امکان تصدیق هویت گوینده
امکان تشخیص هویت گوینده
قابلیت اجرا به صورت برخط (آنلاین) و برون خط (آفلاین)
پردازش آنلاین خطوط تلفن و ماهواره
امکان افزودن و آموزش گویندگان
امکانات ضبط صدا، دسته بندی گویندگان 
کاربردهای دستگاه تشخیص صدا :
رمز صوتی
مجوز دسترسی با گفتار برای ورود به یک مکان
کنترل حضور و غیاب با تشخیص صدا
کنترل دسترسی به رایانه با صدای شخص
احراز هویت و تایید اعتبار در تراکنش های تلفنی مانند تلفن بانک
جستجو و شناسایی مجرمین از روی صدا (آواشناسی قضایی)
ردیابی و نظارت بر مکالمات (تلفنی، بیسیم و …) جهت شناسایی هویت مظنونین
دسته‌بندی و جداسازی فایل‌های صوتی مانند سخنرانی‌ها بر اساس گوینده‌های آن