கணினியில் பயன்படுத்தப்படும் பேச்சுசார் தொழில்நுட்பம்:SPEECH TECHNOLOGY USED IN THE COMPUTER

கா.செல்வகாமாட்சி

முனைவர் பட்ட ஆய்வாளர், தமிழ்த்துறை தியாகராசர் கல்லூரி, மதுரை                                                                                                                               

SUMMARY

           Five hundred years ago no one would have believed if a man could speak to another man several miles away, live, in video mode. But now this has become possible. An instrument is fundamentally responsible for every progress of man. It has grown from ploughing in agriculture to computers today.

            The speech technology on the computer is also suitable for use by people who do not know how to type. The microphone and the Internet play a major role in speech technology. Our voice is received as input of speech technology and received as text as output.

            Many websites and apps perform such actions. Some of these are only active on websites.  Such technology is located in different languages and some of these websites act as voice converters, translations, font converters. It is used to communicate on email and other social media, as well as to quickly run through voice instead of typing messages on multimedia messaging services. From punctuation to easy insertion, this technology has been developed.

            Using speech technology, deaf people can be made to see and understand what others are saying to become textual. For those who are less usable in their hands and are not skilled at typing, using such technology, speech technology plays a huge role in getting results within a certain period of time.

           Even a detailed paragraph can be easily and quickly typed. Plays an important role in time management The entire device can be run using applications such as cortana on a computer using speech technology. Such technology is used in various devices such as television, telephone, refrigerator, air conditioner, etc. In some devices, these processors remain normal.

KEYWORDS:

       Microphones – Websites  Voice – converters –  Translations –  Font converters – Social media – Multimedia messaging services.

முன்னுரை :

     அறிவியல் கண்டுபிடிப்புகளில் உயர்ந்த இடத்தை பிடித்துள்ளது கணிப்பொறியாகும். ஐந்நூறு ஆண்டுகளுக்கு முன் ஒரு மனிதன் பல மைல் தொலைவில் உள்ள மற்றொரு மனிதனுடன் காணொளி முறையில் நேரலையில் உரையாற்ற முடியுமென்றால் யாரும் நம்பியிருக்கமாட்டார்கள் ஆனால், தற்போது எங்கும்  கணினி  எதிலும்  கணினி என இந்த 21ம் நூற்றாண்டு  திகழ்கிறது.

     கணினியில் பயன்படுத்தப்படும் பேச்சுசார் தொழில்நுட்பமானது பல்வேறு வகைகளை உள்ளடக்கியுள்ளன. இவற்றில்  பேச்சு அங்கீகாரம், பேச்சு தொகுப்பு பற்றிய  செய்திகளை ஆராய்வதாக இக்கட்டுரையானது அமையப்பெறுகிறது.

பேச்சுசார்  தொழில்நுட்பம் :

       உலக மக்களை ஒன்றிணைக்கக் கூடிய மிகப்பெரிய சக்தியாக கணினி அமையப்பெற்று வருகிறது. “இப்போதுள்ள நவீன கம்ப்யூட்டர்களுக்கு முன்னோடியாக விளங்குவது சார்லஸ் பாபேஜ் உருவாக்கிய கம்யூட்டர் தான்”1 பேச்சுசார் தொழில்நுட்பம் என்பது மனிதனின் பேச்சை உரையாக (Text) அல்லது கேட்கக்கூடிய வடிவத்தில் செயலாக்குவதை உள்ளடக்கிய கணினிஅறிவியல் கணக்கீட்டு மொழியியல் முதலிய துறைகளைக் கொண்ட பரந்த தொழில்நுட்பம். பேச்சுசார் தொழில்நுட்பமானது  பேச்சு அங்கீகாரம்,  பேச்சு தொகுப்பு, குரல் கம்ப்யூட்டிங் மற்றும் பல முக்கிய அம்சங்களை கொண்டு திகழ்கிறது.

பேச்சு அங்கீகாரம் (Speech Recognition) :

        பேச்சு அங்கீகாரமாது பேச்சின் ஒலியியல் அம்சங்களை பகுப்பாய்வு செய்து, அதனை சாத்தியமான வார்த்தைகள் அல்லது சொற்றொடர்களுடன் பொருத்தி உரையாக (Text message) மாற்றும் திறன் உடையவை.

 பேச்சு அங்கீகார  அமைப்பின்  வரலாறு :   

        முதலில் கண்டறியப்பட்ட பேச்சு அங்கீகார அமைப்புகள் வார்த்தைகளில் கவனம் செலுத்தவில்லை மாறாக, எண்களில் கவனம் செலுத்தின. 1952 ஆம் ஆண்டு ஆட்ரி என்ற ஒரு வகை அமைப்பை  பெல்   ஆய்வகங்கள் வடிவமைத்தன. இது நாம் பேசும் குரல்களுக்கான விளக்கங்களை அடையாளம் காணப் பயன்படுத்தப்பட்டன.

        “IBM ஆனது ஆங்கிலத்தில் பதினாறு வார்த்தைகளை புரிந்துக் கொண்டு பதில் அளிக்கும் shoe box ஐ அறிமுகப்படுத்தியது”2 மற்ற நாடுகளில்   மற்றும் பேச்சை அடையாளம் காணக்கூடிய வன்பொருள்கள் உருவாக்கின. இந்த காலகட்டத்தில் பேச்சு அங்கீகாரம் ஆனது பல்வேறு மாற்றங்கள் மற்றும் முன்னேற்றங்களை சந்தித்தது.

21 ஆம் நூற்றாண்டில் வளர்ச்சி :

        கூகுள் வரும் வரையில் பெரும் முன்னேற்றங்கள் ஏற்படவில்லை. கூகுள் பயன்பாட்டு முறையை மில்லியன் கணக்கிலான மக்களிடம் பேச்சு அங்கீகார முறையை வழங்கியது.

 சிரி (Siri) :

        2011 ஆம் ஆண்டு ஆப்பிள் நிறுவனம் சிரி (Siri) என்ற அமைப்பை அறிமுகப்படுத்தியது. தொடர்ந்து இந்த அமைப்பை பயன்படுத்துவதன் மூலம் பயன்பாட்டாளரின்   தனிப்பட்ட மொழி பயன்பாடு தேடல்கள்  விருப்ப  தேர்வுகளுக்கு  ஏற்ப தனிப்பட்ட  முடிவுகளை  தருகிறது.

        இந்த அமைப்பானது ஆப்பிள் சாதனங்களில் மட்டுமே பயன்படுத்தக் கூடியனவாகும். “SRI  என்பது SRI இண்டர்நேஷனல் செயற்கை நுண்ணறிவு மையத்தால்   உருவாக்கப்பட்ட   திட்டத்தில்    இருந்து  உருவான  ஒரு ஸ்பின்-ஆஃப் ஆகும்”3 ஆப்பிள் சாதனங்களில் இவை இயல்பு நிலையாகவே (Default) அமைந்திருக்கின்றன.

அலெக்சா (Alexa):

       அமேசானின் அலெக்சா 2014 ஆம் ஆண்டு அறிமுகப்படுத்தப்பட்டது கூகுள் ஹோம் மூலம் வாடிக்கையாளர்கள் மின் இயந்திரங்களுடன் பேசுவதற்கு வசதியாக உள்ளது . அலெக்சா செயற்கை நுண்ணறிவு (Artificial Intelligence) உடையதாகும்.

சோனிக்ஸ் (SONIX):

       2023 ஆம் ஆண்டின் சோனிக்ஸ் சிறந்த தானியங்கி டிரான்ஸ்கிரிப்ஷன் சேவையாகும். ஆடியோ மற்றும் வீடியோ கோப்புகளை நாற்பதுக்கும் மேற்பட்ட மொழிகளில் சோனிக்ஸ் படியெடுத்து மொழிபெயர்க்கும் பணியில் உதவி புரிகிறது வேகமாக துல்லியமாக மற்றும் மலிவாக கிடைக்கக்கூடிய அமைப்பாக சோனிக்ஸ் திகழ்கிறது.

இ மெயிலில் வாய்ஸ் மெயில் :

      இமெயிலில் வாய்ஸ் மெயில் அனுப்பும் வசதி 1980 ஆம் ஆண்டு முதல் அமெரிக்க அளவிலான குரல் அஞ்சல் சேவையை அறிமுகப்படுத்த உருவாக்கப்பட்டது. இதில் தட்டச்சு பலகை உதவியின்றி வாய்ஸ் மெயிலாக அனுப்பும் வசதி உள்ளது. “இந்த வசதியை ஹைதராபாத்தைச் சேர்ந்த now-pos என்ற நிறுவனம் அறிமுகம் செய்துள்ளது”4 வெளிநாடுகளுக்கு கூடுதல் ஐஎஸ்டி கட்டணமின்றி தொடர்பு கொள்ள இச்சேவை உருவாக்கப்பட்டது.

பேச்சு அங்கீகார செயலிகள், தளங்கள் :       

      பேச்சு அங்கீகார அமைப்புகள் இணையதளங்கள், செயலிகளாகவும் உள்ளன. செயலிகள் உதவியுடன் நாம் பிற சமூக ஊடகங்களும் தட்டச்சு செய்வதற்கு பதிலாக நம் பேச்சின் மூலமாக கருத்துக்களை உரையாக மாற்ற இயலும்

      Gboard , Speech  to text converter, Tamil voice Typing,  Easy tamil voice keyboard app,  Tamil keyboard என்று பல செயலிகள் தமிழுக்காக திகழ்கின்றன மேலும் பல மொழிகளிலும் இத்தகைய  செயலிகள் உள்ளன.

       SpeechTyping.com, Typingguru, unicodefont.in, Speaktyping.com, speechnotes.com மற்றும் பல இணையதளங்கள் செயல்பட்டு வருகின்றன இவற்றை அவற்றிற்கான இணையதளங்களில் மட்டுமே நேரடியாக பயன்படுத்த முடியும் உரையாக பெறப்பட்ட செய்திகளை எடுத்து நகல் (copy) செய்து பிற சமூக ஊடகங்களில் ஒட்டி (paste)  பயன்படுத்திக்கொள்ளலாம். நேரடியாக பிற செயலிகளில் பயன்படுத்த இயலாது இவை ஒலிவாங்கி மூலமாக நமது குரலை உள்ளீடாக பெற்று உரையாக மாற்றி தருகின்றன.

பேச்சு தொகுப்பு :

      உரை அல்லது பிற உள்ளீடுகளில் இருந்து செயற்கை முறையில் பேச்சை உருவாக்கும் திறனாகும். முதல் கணினி அடிப்படையிலான பேச்சுதொகுப்பு அமைப்புகளானது 1950ஆம் ஆண்டு தோன்றின.

      1968 ஆம் ஆண்டில் ஜப்பானில் உள்ள எலக்ட்ரோ டெக்னிக்கல் ஆய்வகத்தில் முதல் பொது ஆங்கில உரையிலிருந்து பேச்சு முறையை உருவாக்கினர்.

பேச்சு தொகுப்பு அமைப்புகள் :

       உரையிலிருந்து பேச்சாக மாற்றக் கூடிய அமைப்புகளானது பேச்சு தொகுப்பு அமைப்புகள் எனப்படுகின்றன. இது டெஸ்ட் டு ஸ்பீச் (Text -to -speech) என்பதாகும் கணினி உரையை (Text) படிக்கும் திறனை இது குறிக்கிறது.

        TTS  ஆனது எழுதப்பட்ட உரையை ஒலி எழுத்து பிரதிநிதித்துவமாக மாற்றுகிறது. பின்னர் ஒலி வடிவங்களை ஒலியாக வெளியிடக்கூடிய அலைவடிவங்களாக மாற்றி அமைக்கிறது.கூகுள் அசிஸ்டன்ட் மற்றும் பிற செயலிகளின் உதவிக் கொண்டு இத்தகைய சேவைகளை பயன்படுத்த இயலும்.

ஒலி நூலின் சிறப்பம்சங்கள் :

       இணையம் வழியாக ஒரு குறிப்பிட்ட புத்தகம் நம் கையில் இல்லாவிட்டாலும் அதனை படிப்பதற்காக இணைய நூலகங்கள் பயன்படுகின்றன. “இணையத்தின் வழியாக தமிழ் மொழிக் கல்வியை அறிமுகப்படுத்திய பெருமை தமிழ் இணைய பல்கலைக்கழகத்தையே சாரும்”5 ஒலி புத்தகங்கள் (Audio Books) இதில் மேலும் சிறப்பம்சம் வகிக்கின்றன.

      பேச்சு தொகுப்பு அமைப்பின் மூலம் நூல்களை படிக்கும் முறை ஒலிநூல் எனப்படுகிறது. “ஒலிநூல்  என்பது  அச்சு நூல்களை  உருவாக்குவது போலப் படித்து  ஒலி  வடிவில்  சேமித்து   வைத்த தகவல்களை திரும்பப் பெறுவது ஆகும்”6m கண் பார்வை  திறனில்  குறைபாடு உள்ளவர்கள், வயதானவர்கள், வேலை செய்து கொண்டே ஒலிவடிவில் இத்தகைய நூல்களை கேட்டு பயன்பெறலாம்.

      ஒலி நூல்கள் Talking Books என்றும் அழைக்கப்படுகின்றன.தமிழுக்கென்று சிறப்பாக .Aidible.in, storytel,  kuku.FM, kadhai osai , spotify, Tamil audio books.com போன்ற தளங்கள் சிறப்பாக செயல்பட்டு வருகின்றன.

கோர்டானாவின்(Cortana) செயல்பாடுகள் :

      கோர்டானா என்பது “மைக்ரோசாப்டின் தனிப்பட்ட உற்பத்தி திறன் உதவியாளராகும்”7 நமது நேரத்தை சேமிக்க இது உதவுகிறது. அட்டவணை புதுப்பித்தல் ,மைக்ரோசாஃப்ட் குழுக்களில் மீட்டிங்கில் சேர,   அடுத்த சந்திப்பு பட்டியலை நினைவூட்ட, பட்டியலை நிர்வகிக்க, தகவல்களை உண்மையாக கண்டறிய,  ஒரு பொருள் பற்றிய வரையறையை அறிய பயன்படுகிறது. குறிப்பிட்ட சில நாடுகளில் மட்டுமே கோர்டானா பயன்பாடு கிடைக்கப்பெறுகிறது.

சிறந்த  பேச்சுசார் தொழில்நுட்ப செயலிகள் :

            Lifewire என்ற இணையதள பக்கமானது 2023 ஆம் ஆண்டிற்கான சிறந்த குரல் உரை செயலிகளை பட்டியலிட்டு வரையறை செய்துள்ளது.

அந்தப் பட்டியல் பின்வருமாறு,

      “சிறந்த செயலி (ஒட்டுமொத்தமாக)  –  டிராகன் எனி வேர் ( Dragon anywhere)

       சிறந்த உதவியாளர்  –  கூகுள் உதவியாளர்  (Google Assistant)

       சிறந்த டிரான்ஸ்கிரிப்சன்  –  பிரான்ஸ் கிரிப்ட்  (Transcribe)

       நீண்ட பதிவுகளுக்கு சிறந்தது  –  பேச்சுகுறிப்புகள்  ( Speech Notes)

       குறிப்புகளுக்கு சிறந்தது  –  குரல் குறிப்புகள்  (Voice Notes)

       செய்திகளுக்கு சிறந்தது  –  ஸ்பீச்டெக்ஸ்டர்  (Speech Texter)  

       மொழிபெயர்ப்புக்கு சிறந்தது  –  ஐ ட்ரான்ஸ்லேட் உரையாடல் (i translate conversation)                

       முக்கிய  தொழில்  விதிமுறைகளுக்கு சிறந்தது  –  பிரெய்னா  (Braina) ”8

என்று இந்த இணையதளப் பக்கத்தில் பட்டியலிடப்பட்டுள்ளது.

இவை  நமது  பல மணி நேர வேலையை எளிதாக செய்ய பேருதவி ஆற்றுகின்றன.

பேச்சுசார்  தொழில்நுட்பத்தின்  பயன்கள் :

      பேச்சுசார் தொழில்நுட்பமானது அனைவரும் பயன்படுத்த மிகவும் எளிதாக அமையப்பெற்றுள்ளது தொழில் வல்லுநர்களுக்கு  மிகவும் பயனுள்ளதாக அமைகின்றது. பேச்சு அங்கீகார அமைப்பின் மூலமாக காது கேளாத நபர்களுக்கு மற்றவர்கள் சொல்லக்கூடிய செய்தியை உரையாக  பார்த்து புரிந்து கொள்ளச் செய்ய இயலும்.

      பேச்சு தொகுப்பு அமைப்பில் ஒலிநூல்கள் வாயிலாக கண் பார்வை அற்றவர்கள் கண் குறைபாடு  உடையவர்கள்  தாங்கள்  நினைக்கும்  புத்தகங்களை  படித்து அறிந்து கொள்ள முடியும். ஒலிநூல்கள் போன்ற தலங்கள் எழுத்தறிவில்லாத பாமர மக்களும் எளிதாக ஒரு  புத்தகத்தைப் பற்றிய செய்தியைப் பெற உதவி புரிகின்றது.

      உரையை  பேச்சொலியாகவும் பேச்சொலியை  உரையாகவும் மாற்றும்  இத்தகைய தொழில்நுட்பங்கள் நேரத்தை மிச்சப்படுத்தி நேர மேலாண்மைக்கு பெரும் பங்காற்றுகின்றன துல்லியம்  மற்றும்  மலிவாக கிடைப்பதால் அனைவரும் பயன்படுத்த எளிதாக அமைகின்றன.

நிறைவுரை :

      கணினியில் பயன்படுத்தப்படும் பேச்சுசார் தொழில்நுட்பம் என்பது பல அம்சங்களைக் கொண்டது இதில் பேச்சு அங்கீகாரமானது  பேச்சின் ஒலியியல் அம்சங்களை பகுப்பாய்வு செய்து, அதனை சாத்தியமான வார்த்தைகள் அல்லது சொற்றொடர்களுடன் பொருத்தி உரையாக மாற்றும் பணியை செயல்படுத்துகின்றன.

       பேச்சுஅங்கீகார தொழில்நுட்பம் இருபதாம் நூற்றாண்டில் பெரும் வளர்ச்சியை நிலையை எட்டியது. கூகுள் பயன்பாட்டு முறை மில்லியன் கணக்கிலான மக்களிடம் பேச்சு அங்கீகார அமைப்பை கொண்டு சேர்த்தது சிரி, அலெக்சா, சோனிக்ஸ் போன்ற அமைப்புகள் பெரிதும் வரவேற்பை பெற்றனர்.

       மைக்ரோசாப்டின் கோர்டானா-வை பயன்படுத்தி அட்டவணை புதுப்பித்தல், மீட்டிங்கில் சேரல், அடுத்த சந்திப்பு பட்டியலை நினைவூட்டல், தகவல்களின் உண்மையை கண்டறிதல் என பல்வேறு வேலைகளை எளிதாக செய்ய முடியும்.            பேச்சுஅங்கீகார செயலிகள் இணையதளங்களாகவும் உள்ளன. ஒலிவாங்கி உதவியுடன் எளிதாக பயன்படுத்தி நேரத்தை நாம் சேமிக்கலாம்

       பேச்சு தொகுப்பு என்பது  பிற உள்ளீடுகளிலிருந்து செயற்கை முறையில் பேச்சை உருவாக்கும் திறனாகும். 1968ஆம் ஆண்டில் ஜப்பானிலுள்ள எலக்ட்ரோ டெக்னிக்கல் ஆய்வகத்தில் முதல் பொது ஆங்கில உரையிலிருந்து பேச்சு முறையை உருவாக்கியது.

       இவை டெக்ஸ்ட் டு ஸ்பீச்  (Text-to-speech)  அமைப்பு என்று அழைக்கப்படுகின்றன. கூகுள் அசிஸ்டன்ட் போன்ற செயலிகள் கொண்டு இத்தகைய சேவைகளை பயன்படுத்தலாம்.

       ஒலி நூல்கள்  முறையானது  ஒரு  குறிப்பிட்ட  நூல் நம் கையில் இல்லாவிட்டாலும்  அதனைப்  படித்து அறிந்துகொள்ள உதவுகிறது.

அடிக்குறிப்புகள்:

1. சுரத்.(2001). கம்யூட்டர் உலகம் (9) தெய்வானை நிலையம்

2.https://en.m.wikipedia.org/wiki/Speech_recognition#:~:text=Speech%20recognition%20is%20an%20interdisciplinary,language%20into%20text%20by%20computers.

3. https://en.m.wikipedia.org/wiki/Siri

4.மருதநாயகம்.இரா.(2015).இருபத்தோராம் நூற்றாண்டில் மக்கள் தகவல் தொடர்பியல்.(112) நியூ செஞ்சுரி புக் ஹவுஸ்

5. திராவிடமணி.பொ, இந்திராகாந்தி.பு.(2016)அறிவியலும் இலக்கியமும்(120)

நியூ செஞ்சுரி புக் ஹவுஸ்

6. மேகலா.இரா.கணினித்தமிழ்(106) நியூ செஞ்சுரி புக் ஹவுஸ்

7.https://support.microsoft.com/en-us/topic/what-is-cortana-953e648d-5668-e017-1341- 7f26f7d0f825

8.https://www.lifewire.com/best-voice-to-text-apps-4583053#:~:text=Available%20for%20Android%20and%20iOS,there%20are%20no%20word%20limits

error: Content is protected !!