முனைவர் கு. செல்வஈஸ்வரி,
தமிழ்த்துறை உதவிப்பேராசிரியர்,
தி ஸ்டாண்டர்டு ஃபயர் ஒர்க்ஸ் இராஜரத்தினம் மகளிர் கல்லூரி, சிவகாசி
Abstract
It aims to provide an efficient way for humans to interact with computers. With the extensive development of these systems, users can talk naturally with computers. Therefore, researchers today are mainly focused on developing a system to recognize continuous speech to perform tasks such as replying to e-mails and creating text documents. This paper presents an Automatic Speech Recognition (ASR) system for Tamil language using Hidden Markov Model (HMM) approach. They selected the sound model to recognize a given set of sentences from the medium vocabulary. The results for the proposed developed system are found to be satisfactory with 92% word recognition accuracy and 81% sentence accuracy.
முன்னுரை
அறிவியல் உலகில், கணினி எப்போதும் மனித உருவகங்களை புரிந்துகொள்கிறது. பேச்சு அங்கீகார அமைப்பை உருவாக்குவதற்கான யோசனை, ஏனெனில் கடினமான வழிமுறைகளைக் காட்டிலும் பேச்சு அல்லது குரல் மூலம் ஒரு கணினி, ரோபோ அல்லது எந்த இயந்திரத்துடனும் தொடர்புகொள்வது மனிதர்களுக்கு வசதியானது. மனிதர்களைப் போலவே புரிந்துகொண்டு பேசக்கூடிய கணினியை உருவாக்க மனிதர்கள் நீண்ட காலமாக ஈர்க்கப்பட்டு வருகின்றனர். 1960 களில் இருந்து, கணினி விஞ்ஞானிகள் கணினி பதிவை உருவாக்குவதற்கும், மனிதனைப் புரிந்துகொள்வதற்கும் பல்வேறு வழிகள் மற்றும் வழிமுறைகளை ஆராய்ச்சி செய்து வருகின்றனர். நாம் இக்கடடுரையில் பேச்சு அங்கீகாரத்தின் அடிப்படை அம்சங்களைப் பற்றியும், உச்சரிப்புகளின் அடிப்படையில் பேச்சு அங்கீகார அமைப்பு வகைகள் பற்றியும், சொற்களஞ்சியத்தின் அடிப்படையில் பேச்சு அங்கீகாரத்தின் வகைகள் பற்றியும், பேச்சு அங்கீகார அமைப்பின் செயல்பாடு பற்றியும் காண்போம்.
பேச்சு அங்கீகாரத்தின் அடிப்படை அம்சங்கள்
பேச்சு அங்கீகாரத்தின் அடிப்படை அம்சங்கள் ஒலியை உரை மற்றும் கட்டளைகளாக மொழிபெயர்ப்பதாகும். பேச்சு அங்கீகாரம் என்பது ஒரு ஒலியியல் பேச்சு சமிக்ஞையை பேச்சின் சுருக்கமான அர்த்தத்திற்கு கணினி வரைபடமாக்குகிறது. சிறந்த தரமான பேச்சு அங்கீகார அமைப்புகளை உருவாக்க பல்வேறு அம்சங்களை பிரித்தெடுக்கும் முறைகள் மற்றும் முறை பொருத்துதல் நுட்பங்கள் பயன்படுத்தப்படுகின்றன. பல்வேறு நபர்களின் பேச்சு அங்கீகார விகிதத்தை அதிகரிக்க பேச்சு அங்கீகார அமைப்பில் அம்சம் பிரித்தெடுத்தல் நுட்பம் மற்றும் முறை பொருத்துதல் நுட்பங்கள் முக்கிய பங்கு வகிக்கின்றன.
உச்சரிப்புகளின் அடிப்படையில் பேச்சு அங்கீகார அமைப்பு வகைகள்
உச்சரிப்பு அடிப்படையில் பேச்சு அங்கீகார அமைப்புகளை நான்கு வகைகளாகப் பாகுபாடு செய்யலாம்.
1.தனிமைப்படுத்தப்பட்ட வார்த்தைகள்
2.இணைக்கப்பட்ட வார்த்தைகள்
3.தொடர்ச்சியான பேச்சு
4.தன்னிச்சையான பேச்சு
தனிமைப்படுத்தப்பட்ட வார்த்தைகள்
தனிமைப்படுத்தப்பட்ட வார்த்தைகள் என்பது, ஒற்றைச் சொல்லை அங்கீகரிக்கும் தனிமைப்படுத்தப்பட்ட சொல் அங்கீகார அமைப்பினைக் குறிக்கும். பயனர் ஒரு வார்த்தை பதில் அல்லது கட்டளைகளை மட்டுமே வழங்க வேண்டிய சூழ்நிலைகளுக்குத் தனிமைப்படுத்தப்பட்ட சொல் அங்கீகாரம் பொருத்தமானது, ஆனால் பல சொல் உள்ளீடுகளுக்கு இது மிகவும் இயற்கைக்கு மாறானது. இது எளிமையானது மற்றும் செயல்படுத்த எளிதானது, ஏனெனில் வார்த்தை எல்லைகள் வெளிப்படையானவை மற்றும் சொற்கள் தெளிவாக உச்சரிக்கப்படுகின்றன.
இணைக்கப்பட்ட வார்த்தைகள்
இணைக்கப்பட்ட சொற்கள் அமைப்பு தனிமைப்படுத்தப்பட்ட சொற்களைப் போன்றது, ஆனால் இது தனித்தனியான சொற்களை “ஒன்றாக” இருக்க அனுமதிக்கிறது, அவற்றுக்கிடையே குறைந்த இடைவெளியுடன். உச்சரிப்பு என்பது கணினிக்கு ஒரு ஒற்றை அர்த்தத்தைக் குறிக்கும் ஒரு வார்த்தை அல்லது வார்த்தைகளின் குரல் ஆகும்.
தொடர்ச்சியான பேச்சு
தொடர்ச்சியான பேச்சு அங்கீகார அமைப்பு பயனர்களைக் கிட்டத்தட்ட இயல்பாகப் பேச அனுமதிக்கிறது, அதே நேரத்தில் கணினி அதன் உள்ளடக்கத்தை தீர்மானிக்கிறது. அடிப்படையில், இது கணினி டிக்டேஷன் ஆகும். இந்த நெருங்கிய சொற்கள் இடைநிறுத்தம் இல்லாமல் அல்லது வேறு எந்தப் பிரிவினையும் இல்லாமல் ஒன்றாக இயங்கும். தொடர்ச்சியான பேச்சு அங்கீகார அமைப்பை உருவாக்குவது கடினம்.
தன்னிச்சையான பேச்சு
தன்னிச்சையான பேச்சு அங்கீகார அமைப்பு இயற்கையான பேச்சை அங்கீகரிக்கிறது. தன்னிச்சையான பேச்சு வாயில் திடீரென வருவது இயல்பு. தன்னிச்சையான பேச்சைக் கொண்ட ASR அமைப்பு, வார்த்தைகள் ஒன்றாக இயங்குவது போன்ற பல்வேறு இயல்பான பேச்சு அம்சங்களைக் கையாள முடியும். தன்னிச்சையான பேச்சில் தவறான உச்சரிப்பு, தவறான-தொடக்கங்கள் மற்றும் சொற்கள் அல்லாதவை ஆகியவை அடங்கும்.
சொற்களஞ்சியத்தின் அடிப்படையில் பேச்சு அங்கீகாரத்தின் வகைகள்
ஒவ்வொரு பேச்சாளருக்கும் அவரது தனித்துவமான உடல் மற்றும் ஆளுமை காரணமாக சிறப்பு குரல் உள்ளது. பேச்சு அறிதல் முறை மூன்று முக்கிய வகைகளாகப் பிரிக்கப்பட்டுள்ளது
1. பேச்சாளர் சார்ந்த மாதிரிகள்
2.பேச்சாளர் சுயாதீன மாதிரிகள்
3.பேச்சாளர் அடாப்டிவ் மாதிரிகள்
பேச்சாளர் சார்ந்த மாதிரிகள்
ஒரு குறிப்பிட்ட வகை ஸ்பீக்கருக்காக ஸ்பீக்கர் சார்ந்த அமைப்புகள் உருவாக்கப்பட்டுள்ளன. அவை பொதுவாக குறிப்பிட்ட ஸ்பீக்கருக்கு மிகவும் துல்லியமாக இருக்கும், ஆனால் மற்ற வகை ஸ்பீக்கர்களுக்கு குறைவான துல்லியமாக இருக்கலாம். இந்த அமைப்புகள் பொதுவாக மலிவானவை, உருவாக்க எளிதானவை மற்றும் மிகவும் துல்லியமானவை. ஆனால் இந்த அமைப்புகள் ஸ்பீக்கர் சார்பற்ற அமைப்புகளாக நெகிழ்வானவை அல்ல.
பேச்சாளர் சுயாதீன மாதிரிகள்
ஸ்பீக்கர் இன்டிபென்டன்ட் சிஸ்டம் எந்த முன் பயிற்சியும் இல்லாமல் பல்வேறு பேச்சாளர்களை அடையாளம் காண முடியும். . எந்தவொரு குறிப்பிட்ட வகை ஸ்பீக்கருக்கும் செயல்பட ஸ்பீக்கர் சுயாதீன அமைப்பு உருவாக்கப்பட்டுள்ளது. இது இன்டராக்டிவ் வாய்ஸ் ரெஸ்பான்ஸ் சிஸ்டத்தில் (IVRS) பயன்படுத்தப்படுகிறது, இது பல்வேறு பயனர்களின் உள்ளீட்டை ஏற்க வேண்டும். ஆனால் குறைபாடு என்னவென்றால், இது ஒரு சொற்களஞ்சியத்தில் உள்ள சொற்களின் எண்ணிக்கையைக் கட்டுப்படுத்துகிறது. சபாநாயகர் சுயேச்சை முறையை நடைமுறைப்படுத்துவது மிகவும் கடினமானது. மேலும் இது விலை உயர்ந்தது மற்றும் ஸ்பீக்கர் சார்ந்த அமைப்புகளை விட அதன் துல்லியம் குறைவாக உள்ளது.
பேச்சாளர் அடாப்டிவ் மாதிரிகள்
ஸ்பீக்கர் அடாப்டிவ் ஸ்பீச் ரெகக்னிஷன் சிஸ்டம் ஸ்பீக்கர் சார்ந்த டேட்டாவைப் பயன்படுத்துகிறது மற்றும் பேச்சை அடையாளம் காண மிகவும் பொருத்தமான ஸ்பீக்கருக்கு ஏற்றவாறு மாற்றியமைக்கிறது.
சொற்களஞ்சியத்தின் அடிப்படையில் பேச்சு அங்கீகாரத்தின் வகைகள்
பேச்சு அங்கீகார அமைப்பின் சொற்களஞ்சியத்தின் அளவு ASR அமைப்பின் சிக்கலான தன்மை, செயலாக்கம் மற்றும் அங்கீகார விகிதம் ஆகியவற்றை பாதிக்கலாம். எனவே ASR அமைப்பு பின்வரும் சொற்களஞ்சியத்தின் அடிப்படையில் வகைப்படுத்தப்படுகிறது:
1.சிறிய சொற்களஞ்சியம் – 1 முதல் 100 வார்த்தைகள் அல்லது வாக்கியங்கள்
2.நடுத்தர சொற்களஞ்சியம் – 101 முதல் 1000 வார்த்தைகள் அல்லது வாக்கியங்கள்
3.பெரிய சொற்களஞ்சியம்- 1001 முதல் 10,000 வார்த்தைகள் அல்லது வாக்கியங்கள்
4.மிகப் பெரிய சொற்களஞ்சியம் – 10,000 க்கும் மேற்பட்ட வார்த்தைகள் அல்லது வாக்கியங்கள்
பேச்சு அங்கீகார அமைப்பின் செயல்பாடு
பேச்சு அங்கீகார அமைப்பின் செயல்பாட்டினை
- முன் செயலாக்கம்/டிஜிட்டல் செயலாக்கம்
- அம்சம் பிரித்தெடுத்தல்
- ஒலி மாடலிங்
- மொழி மாடலிங்
- வடிவ வகைப்பாடு என்று ஐந்து வகைகளாகப் பாகுபாடு செய்யலாம்.
முன் செயலாக்கம்/டிஜிட்டல் செயலாக்கம்
பதிவுசெய்யப்பட்ட ஒலி சமிக்ஞை ஒரு அனலாக் சமிக்ஞையாகும். ஒரு அனலாக் சிக்னல் நேரடியாக ASR அமைப்புகளுக்கு மாற்ற முடியாது. எனவே இந்தப் பேச்சு சமிக்ஞைகள் டிஜிட்டல் சிக்னல்களின் வடிவத்தில் மாற்றப்பட வேண்டும், பின்னர் மட்டுமே அவற்றை செயலாக்க முடியும். இந்த டிஜிட்டல் சிக்னல்கள், சிக்னல்களை ஸ்பெக்ட்ரலாக சமன் செய்ய முதல் வரிசை வடிகட்டிகளுக்கு நகர்த்தப்படுகின்றன. இந்தச் செயல்முறை அதிக அதிர்வெண்ணில் சமிக்ஞையின் ஆற்றலை அதிகரிக்கிறது. இது முன்செயலாக்கப் படியாகும்.
அம்சம் பிரித்தெடுத்தல்
அம்சம் பிரித்தெடுத்தல் படியானது பேச்சு சமிக்ஞைகளுடன் ஒலி தொடர்பு கொண்ட உச்சரிப்புகளின் அளவுருக்களின் தொகுப்பைக் கண்டறியும் மற்றும் இந்த அளவுருக்கள் ஒலி அலைவடிவத்தைச் செயலாக்குவதன் மூலம் கணக்கிடப்படுகின்றன. இந்த அளவுருக்கள் அம்சங்கள் என்று அழைக்கப்படுகின்றன. அம்சம் பிரித்தெடுத்தலின் முக்கிய கவனம், தொடர்புடைய தகவலை வைத்திருப்பதும், பொருத்தமற்ற ஒன்றை நிராகரிப்பதும் ஆகும். இந்தச் செயல்பாட்டின் மீது செயல்பட, அம்சம் பிரித்தெடுத்தல் ஒலி சமிக்ஞையை 10-25 ms ஆக பிரிக்கிறது. இந்த பிரேம்களில் பெறப்பட்ட தரவு சாளர செயல்பாட்டால் பெருக்கப்படுகிறது. ஹேமிங் செவ்வக, பிளாக்மேன், வெல்ச் அல்லது காஸியன் போன்ற பல வகையான சாளர செயல்பாடுகள் பயன்படுத்தப்படலாம். இந்த வழியில் ஒவ்வொரு சட்டகத்திலிருந்தும் அம்சங்கள் பிரித்தெடுக்கப்பட்டுள்ளன. மெல்-ஃப்ரீக்வென்சி செப்ஸ்ட்ரல் குணகம் (எம்எஃப்சிசி), லீனியர் ப்ரெடிக்டிவ் செப்ஸ்ட்ரல் குணகம் (எல்பிசிசி), பெர்செப்சுவல் லீனியர் ப்ரெடிக்ஷன் (பிஎல்பி), அலைவரிசை மற்றும் ராஸ்டா-பிஎல்பி (உறவினர் ஸ்பெக்ட்ரல் டிரான்ஸ்ஃபார்ம்) செயலாக்கம் போன்ற அம்சங்களைப் பிரித்தெடுக்க பல முறைகள் உள்ளன.
ஒலி மாடலிங்
ஒலி மாடலிங் என்பது ASR அமைப்பின் அடிப்படை பகுதியாகும். ஒலி மாடலிங்கில், ஒலியியல் தகவல் மற்றும் ஒலிப்பு ஆகியவற்றுக்கு இடையேயான தொடர்பு நிறுவப்பட்டது. கணினியின் செயல்திறனில் ஒலி மாதிரி முக்கிய பங்கு வகிக்கிறது மற்றும் கணக்கீட்டு சுமைக்கு பொறுப்பாகும். பயிற்சி அடிப்படை பேச்சு அலகுகள் மற்றும் ஒலியியல் அவதானிப்புகளுக்கு இடையே ஒரு தொடர்பை ஏற்படுத்துகிறது. அமைப்பின் பயிற்சிக்கு, ஒரே வகுப்பின் பேச்சு ஒலிகளுடன் தொடர்புடைய ஒன்று அல்லது அதற்கு மேற்பட்ட வடிவங்களைப் பயன்படுத்தி வகுப்பின் அம்சங்களுக்கு ஒரு மாதிரி பிரதிநிதியை உருவாக்க வேண்டும். ஒலி மாடலிங்கிற்காக பல மாதிரிகள் உள்ளன, அவற்றில் மறைக்கப்பட்ட மார்கோவ் மாடல் (HMM) பரவலாகப் பயன்படுத்தப்படுகிறது மற்றும் ஏற்றுக்கொள்ளப்படுகிறது
மொழி மாடலிங்
ஒரு மொழி மாதிரியானது நிகழ்வின் நிகழ்தகவுகளை உருவாக்குவதற்கு மொழியில் கிடைக்கும் கட்டமைப்புக் கட்டுப்பாடுகளைக் கொண்டுள்ளது. இது ஒரு சொல் வரிசைக்குப் பிறகு ஒரு சொல் நிகழ்வின் நிகழ்தகவைத் தூண்டுகிறது . ஒவ்வொரு மொழிக்கும் அதன் சொந்த கட்டுப்பாடுகள் உள்ளன. பொதுவாக பேச்சு அங்கீகார அமைப்புகள் பை-கிராம், ட்ரை-கிராம், என்-கிராம் மொழி மாதிரிகளைப் பயன்படுத்தி, n-1 முந்தைய சொற்களைப் பயன்படுத்தி, n வது வார்த்தையின் சாத்தியக்கூறுகளைக் கணிப்பதன் மூலம் சரியான சொல் வரிசையைக் கண்டறியும். பேச்சு அங்கீகாரத்தில், கணினி அமைப்பு ஒலிகளை வார்த்தை வரிசையுடன் பொருத்துகிறது. மொழி மாதிரியானது ஒரே மாதிரியான ஒலியைக் கொண்ட சொல் மற்றும் சொற்றொடரை வேறுபடுத்துகிறது.
வடிவ வகைப்பாடு
பேட்டர்ன் வகைப்பாடு (அல்லது அங்கீகாரம்) என்பது அறியப்படாத சோதனை வடிவத்தை ஒவ்வொரு ஒலி வகுப்பு குறிப்பு வடிவத்துடன் ஒப்பிட்டு அவற்றுக்கிடையே உள்ள ஒற்றுமையின் அளவைக் கணக்கிடும் செயல்முறையாகும். சோதனையின் போது கணினியின் பயிற்சியை முடித்த பிறகு, பேச்சை அடையாளம் காணும் வடிவங்கள் வகைப்படுத்தப்படுகின்றன.
பேச்சு – புதிய மொழிகளைக் கட்டளையிடல்
டிக்டேட் அம்சம், உங்கள் எண்ணங்களை உங்கள் ஆவணத்தில் விரைவாகப் பெற, பேச்சு முதல் உரையைப் பயன்படுத்துவதன் மூலம் நேரத்தைச் சேமிக்கவும், ஓட்டத்தில் இருக்கவும் உதவுகின்றது. கூடுதல் மொழிகளுக்கான ஆதரவு Microsoft 365 பயனர்களிடமிருந்து நாம் பெறும் பொதுவான கோரிக்கைகளில் ஒன்றாகும். Office இல் உள்ள டிக்டேட் அம்சம் இப்போது பின்வரும் 25 புதிய மொழிகளில் கிடைக்கின்றன.
- Arabic (Bahrain), ar-BH
- Arabic (Egypt), ar-EG
- Arabic (Saudi Arabia), ar-SA
- Bulgarian, bg-BG
- Chinese (Traditional, Hong Kong), zh-HK
- Croatian, hr-HR
- Czech, cs-CZ
- English (New Zealand), en-NZ
- Estonian, et-EE
- Greek, el-GR
- Gujarati (India), gu-IN
- Hebrew, he-IL
- Hungarian, hu-HU
- Irish, ga-IE
- Latvian, lv-LV
- Lithuanian, lt-LT
- Maltese, mt-MT
- Marathi (India), mr-IN
- Romanian, ro-RO
- Slovak, sk-SK
- Slovenian, sl-SI
- Tamil (India), ta –IN
- Telugu (India), te- IN
- Turkish, tr-TR
- Vietnamese, vi-VN
இவை அனைத்தும் தேர்ந்தெடுக்கப்பட்ட Office ஆப்ஸைத் திறக்கும்போது முகப்புத் தரவில் கட்டளையிடு பொத்தான் தோன்றும். (டெஸ்க்டாப் டிக்டேஷன் தற்போது பின்வரும் பயன்பாடுகளில் கிடைக்கின்றது: Word for Windows, Mac மற்றும் Web; Outlook for Windows மற்றும் Mac; PowerPoint for Windows மற்றும் Web; தற்போது Windows மற்றும் இணையத்திற்கான OneNote இல் வெளிவருகிறது.)
புதிய மொழிகளின் பயனாக்கம்
முகப்புத் தரவில், டிக்டேஷன் அனுபவத்தைத் தொடங்க, கட்டளையிடு பொத்தானைக் கிளிக் செய்யவேண்டும். டிக்டேஷன் கருவிப்பட்டியில், டிக்டேஷன் செட்டிங்ஸ் (கியர் ஐகான்) என்பதைக் கிளிக் செய்து, பேசும் மொழியைக் கிளிக் செய்து, நாம் பயன்படுத்த விரும்பும் மொழியைத் தேர்ந்தெடுக்கவும்.
கிடைக்கும் மென்பொருள்கள்:
- Windows Version Version 2012 (Build 13616.10000) or later
- Mac Version 16.32 (Build 19120802) or later விண்டோஸ் 10 மற்றும் விண்டோஸ் 11 இல் உரையிலிருந்து பேச்சு மொழிகளை நிறுவஉதவுகின்றன.
புதிய மொழியை சீரான முறையில் நிறுவ,
பொதுவாக நாம் விண்டோஸ் சாதனத்தில் தொடக்க மெனுவைத் திறந்து அமைப்புகள் > நேரம் & மொழி என்பதைத் தேர்ந்தெடுக்கவும். மொழி அல்லது மொழி & பகுதியைத் தேர்வு செய்யவும் > மொழியைச் சேர்க்கவும். தேடல் பட்டியில் ஒரு மொழியைத் தேடவும் அல்லது பட்டியலிலிருந்து ஒன்றைத் தேர்ந்தெடுக்கவும். டெக்ஸ்ட்-டு-ஸ்பீச் திறன் கொண்ட மொழிப் பொதிகளில் டெக்ஸ்ட்- டு-ஸ்பீச் ஐகான் இருக்கும். நாம் பதிவிறக்க விரும்பும் மொழியை அடுத்தடுத்து தேர்ந்தெடுத்துக் கொள்ள இத்தகு வழிமுறைகள் உதவுகின்றன.
அடுத்து, நீங்கள் தேர்ந்தெடுத்த மொழியில் கிடைக்கும் அம்சங்களையும் அவற்றின்
பதிவிறக்க அளவுகளையும் காணமுடியும். நாம் நிறுவ விரும்பும் அம்சங்களைத்
தேர்வுசெய்ய, பெட்டிகளைத் தேர்வு செய்யவும் அல்லது தேர்வுநீக்கவும், பின்னர் நிறுவவும் செய்யலாம். விண்டோஸ் காட்சி மொழியாக அமைப்புகள் மற்றும் கோப்பு எக்ஸ்ப்ளோரர் போன்ற Windows அம்சங்களை நீங்கள் தேர்ந்தெடுத்த மொழியில் மொழிபெயர்க்கவும் உதவுகின்றது. உரையிலிருந்து பேச்சு உங்கள் திரையில் உள்ள உரையை கேட்கக்கூடிய வகையில் விவரிக்கின்றது. இவ்வாறு பேச்சு அங்கீகாரம்: வகைக்கு பதிலாகப் பேசுவதற்கு நாம் அனுமதிக்க கணினிப்பயன்பாடு மிகவும் உறுதுணைபுரிகின்றது எனலாம். அதோடு மட்டுமின்றி கையெழுத்து நமது சாதனத்தில் எழுதும் உள்ளடக்கத்தையும் இவை அங்கீகரிக்கின்றது.
முடிவுரை
இங்ஙனம் பல்வேறு நுட்பங்களைப் பயன்படுத்தி பேச்சு அங்கீகார விகிதத்தை மேம்படுத்தலாம் மற்றும் சிறந்த தரமான பேச்சு அங்கீகாரத்தை உருவாக்கலாம். எதிர்காலத்தில் பெரிய சொல்லகராதி பேச்சு அங்கீகார அமைப்பு மற்றும் பேச்சாளர் சுயாதீன தொடர்ச்சியான பேச்சு அங்கீகார அமைப்பு ஆகியவற்றின் வளர்ச்சியில் கவனம் செலுத்தப்படும். இத்தகு புதிய பேச்சு மொழிகளின் பயன்பாட்டால் நாம் அவரவர் மொழியைத் தேர்ந்தெடுக்கவும், பிற மொழி அமைப்புகள் பதிவிறக்கவும் இத்தகு மென்பொருள் அம்சங்கள் உதவுவது சாலச்சிறந்தது.
துணைநூற்பட்டியல்
- Charles, A. H., & Devaraj, G. (2004). Alaigal-A Tamil Speech Recognition. Tamil Internet.
- Ghai, W., & Singh, N. (2012). Literature review on automatic speech recognition. International Journal of Computer Applications,
- Juang, B. H., & Rabiner, L. R. (2005). Automatic speech recognition–A brief history of the technology development. Encyclopedia of Language and Linguistics.
- Furui, S., Ichiba, T., Shinozaki, T., Whittaker, E. W., & Iwano, K. (2005). Cluster-based modeling for ubiquitous speech recognition. Interspeech2005, 2865-2868