מהו זיהוי דיבור?

שימוש בקול שלך כשיטת קלט

זיהוי דיבור היא טכנולוגיה המאפשרת קלט דיבור למערכות. אתה מדבר עם המחשב, הטלפון או המכשיר והוא משתמש מה שאמרת כקלט כדי להפעיל פעולה כלשהי. הטכנולוגיה משמשת להחליף שיטות אחרות של קלט כמו הקלדת, לחיצה או בחירה בדרכים אחרות. זה אמצעי לעשות התקנים ותוכנה יותר ידידותי למשתמש ולהגדיל את הפרודוקטיביות.

יש שפע של יישומים ואזורים שבהם נעשה שימוש בזיהוי דיבור, כולל הצבא, כסיוע לאנשים פגועים (דמיינו אדם עם נכים או ללא ידיים או אצבעות), בתחום הרפואי, ברובוטיקה וכו '. בעתיד הקרוב, כמעט כולם יהיו חשופים הכרה בדיבור בשל התפשטות שלה בין מכשירים נפוצים כמו מחשבים טלפונים ניידים.

טלפונים חכמים מסוימים עושים שימוש מעניין בהכרה בדיבור. מכשירי iPhone ו- Android הם דוגמאות לכך. באמצעותם, ניתן ליזום שיחה לאיש קשר על ידי קבלת הוראות מדוברות כגון 'Call office'. פקודות אחרות עשויים גם מבודר, כמו 'הפעל את Bluetooth'.

בעיות עם זיהוי דיבור

זיהוי דיבור, בגרסתו הידועה בשם דיבור לטקסט (STT), שימש גם זמן רב לתרגום מילים מדוברות לטקסט. "אתה מדבר, זה סוג", כמו ViaVoice היה אומר על הקופסה שלה. אבל יש בעיה אחת עם STT כפי שאנו מכירים אותו. לפני יותר מ -10 שנים, ניסיתי ViaVoice וזה לא נמשך שבוע על המחשב שלי. למה? זה היה לא מדויק למדי, ואני בסופו של דבר מבלה יותר זמן ואנרגיה מדברים ולתקן מאשר הקלדת הכל. ViaVoice הוא אחד הטובים בתעשייה, אז לדמיין את השאר. הטכנולוגיה התבגרה ושיפרה, אבל הדיבור לטקסט עדיין גורם לאנשים לשאול שאלות. אחד הקשיים העיקריים שלו הוא וריאציות עצומות בין אנשים מבטאים מילים.

לא כל השפות אמורות בהכרה בדיבור, ואלה שעושים זאת אינן נתמכות לעתים קרובות כמו גם באנגלית. כתוצאה מכך, רוב המכשירים המפעילים תוכנת זיהוי דיבור מבצעים ביצועים סבירים רק באנגלית.

קבוצה של דרישות חומרה מאפשרת זיהוי דיבור לפריסה במקרים מסוימים. אתה צריך מיקרופון כי הוא חכם מספיק כדי לסנן את רעש הרקע אבל באותו זמן חזק מספיק כדי ללכוד את הקול באופן טבעי.

אם כבר מדברים על רעש רקע, זה יכול לגרום למערכת שלמה להיכשל. כתוצאה מכך, זיהוי דיבור נכשל במקרים רבים עקב רעשים שאינם בשליטת המשתמש.

זיהוי דיבור הוא להוכיח להיות יותר טוב כשיטת קלט עבור טלפונים חדשים וטכנולוגיות תקשורת כמו VoIP, מאשר ככלי פרודוקטיביות עבור קלט טקסט המוני.

יישומים של זיהוי דיבור

הטכנולוגיה צוברת פופולריות בתחומים רבים ומצליחה בכך:

- בקרת המכשיר. רק אומר "אישור Google" לטלפון אנדרואיד שריפות מערכת כי הוא כל האוזניים פקודות קוליות שלך.

- מערכות Bluetooth לרכב. מכוניות רבות מצוידות במערכת המחברת את מנגנון הרדיו לטלפון החכם באמצעות Bluetooth. לאחר מכן תוכל לבצע ולקבל שיחות מבלי לגעת הטלפון החכם שלך, והוא יכול אפילו לחייג מספרים פשוט אומר אותם.

- תמלול קול. באזורים שבהם אנשים צריכים להקליד הרבה, כמה תוכנות חכמות לוכד את המילים המדוברות שלהם לתמלל אותם לטקסט. זה הנוכחי בתוכנות עיבוד תמלילים מסוימות. תעתיק קול גם עובד עם דואר קולי חזותי .