भारतीय भाषांसाठी तंत्रज्ञान विकास

Parent Category: मराठी उद्योग Category: व्यवसाय Written by सौ. शुभांगी रानडे

माणसा माणसांत अनेक पद्धतीने संपर्क साधला जातो त्यामधे द्क् आणि श्वाव्य पद्धती सर्वोच्च स्थानावर आहे. सध्या माणूस व मशीन यांच्या दरम्यानचा संपर्क माणसाच्या सोयीपेक्षा मशीनच्या सोयीवर अधिक अवलंबून आहे. माऊस तसेच कीबोर्ड मुख्य इनपुट सांकेतिक भाषा आहे तसेच व्हिज्युअल प्रदर्शन युनिट मुख्य आऊटपुट सांकेतिक भाषा आहे. अशा प्रकारच्या इंटरफेसच्या वापरासाठी खास कौशल्याची तसेच मानसिक अभिवृत्तीची आवश्यकता असते, जे अनेकांकडे नसते. म्हणून परस्पर्रांमध्ये संपर्क प्रस्थापित करणाऱ्या या मशीन केंद्रीत मोडचे मानव-केंद्रित इंटरफेसमध्ये रूपांतर करणे आवश्यक आहे, ज्यामुळे कॉम्प्युटर सामर्थ्याचा सगळयांनाच लाभ मिळेल. खरं म्हणजे माहिती कळण्यासाठी ती डोळयासमीर प्रत्यक्ष दिसल्यास त्याचा सर्वाधिक परिणाम दिसून येतो, परंतू माहिती प्रत्यक्ष वाणीवाटे सांगण्याला सर्वाधिक प्राधन्य दिलं जातं आणि ते सोपही असतं. कॉम्प्युटर आणि दूरसंदेश दळणवळण प्रणाली एकत्रित येण्यामुळे शाब्दिक दळणवळण आज अधिक प्रभावी ठरलं आहे, ज्यामुळे लोकांना, दूरवर असलेल्या कॉम्प्युटर वरून माहिती सहजपणे मिळविता येते.

शाब्दिक दळणवळणात नैसर्गिक भाषांचा सहभाग असल्यामुळे, माहिती तंत्रज्ञानात भाषा शास्त्राला विशेष स्थान प्राप्त झालं आहे. म्हणुनच कॉम्प्युटरसाठी मानव केंद्रित इंटरफेस ही आजच्या काळाची गरज आहे मानवाला भाषेची अनोखी देणगी मिळाली आहे ज्यामुळे तो माहिती, विचार आणि कल्पनांची आपापसात सहजगत्या देवाणघेवाण करतो. नैसर्गिक भाषांचा वापर करून माणूस आणि मशीन यांच्यामध्ये परस्पर संपर्क प्रस्थापित करण्यात, मानवी भाषा तंत्रज्ञानाच्या विविध पैलूंचा समावेश वाणी संकलन, मान्यता, आणि वाणी समजणे स्क्रिप्ट, मशीन भाषांतर आहे,: पाठ सृजन, वाणी आणि कर्सिव्ह स्क्रिप्टचे संस्लेषण, मशीन बरोबर संपर्क स्थापित करण्यासाठी लिखित आणि बोली अशी दोन्ही रूपे उपयुक्त आहेत.

कॉम्प्युटरवर भारतीय भाषांमधे काम करण्याची सोय गेल्या दोन दशकांपासून असून त्यामध्ये, डेटा प्रक्रिया, शब्द प्रक्रिया, डेस्कटॉप पब्लिशिंग इ. गाष्टींचा समावेश आहे.

माहिती तंत्रज्ञान विभागाने, कोणत्याही भाषेच्या अडथळ्याशिवाय बहुभाषिय ज्ञानाच्या स्त्रोताची निर्मिती करून ते उपलब्ध होण्यासाठी तसच त्यांचे संकलन करून, वापरकर्त्यांसाठी नाविन्यपूर्ण उप्तादन विकसित करण्यासाठी आणि त्याची सेवा उपलब्ध करून देण्याकरता माहिती प्रक्रिया साधने आणि तंत्रज्ञान विकसित करण्याच्या उद्देशाने भारतीय भाषांसाठी तंत्रज्ञान विकास म्हणजेच टी डी आय एल ने कार्यक्रमाची सुरवात केली आहे, कॉर्पोरा आणि डिक्शनरी यासारखे भाषा शास्त्र स्रोत विकसित करणाऱ्या प्रकल्पांना निधीही पुरवण्यात आला आहे, तसेच फॉन्ट, टेक्स्ट एडिटर, स्पेल चेकर, ओ सी आर आणि टेक्स्ट टू स्पीच यासारखी मूलभूत माहिती प्रक्रिया साधनेही विकसित करण्यात आली आहेत.

भारतीय देशात भाषा तंत्रज्ञान उप्तादने आणि सेवा विकसित करण्यासाठी खाजगी, सार्वजनिक तसेच सरकारी अशा विविध पातळयांवर प्रयत्न केले गेले आहेत. स्रोत तसच कॉईलनेट केंद्रांतर्फे विकसित करण्यात आलेली भाषा तंत्रज्ञाने आणि साधने लौकरात लौकर वापरात आणली गेली पाहीजे ज्यामुळे त्यावरील प्रतिक्रिया उपलब्ध होतील आणि उप्तादनासाठी ती उपलब्ध करून देता येतील संशोधन आणि विकासासाठी करण्यात आलेल्या प्रयत्नांचा संपूर्ण समाजावर परिणाम दिसून येणं आवश्यक आहे, कारण हे विकासात्मक प्रयत्न प्रयोग शाळापुरतेच मर्यादीत न रहाता ते अधिकाधिक लोकांपर्यत पोहचले पाहीजेत, ज्यामुळे लोकांच्या (वापरकर्त्यांच्या) प्रतिक्रिया आणि अनुभव मिळून त्यात पुढे आणखी सुधारणा घडवून आणता येतील.

सरकारने पुढील उप्तादन आणि त्यावरील उपाय आगामी एक वर्षात सार्वजनिक ठिकाणी उपलब्ध करूण देण्यासाठीची सर्व तयारी पूर्ण केली आहे:

सर्व भारतीय भाषांमध्येमोफत फॉन्टस् (TTF आणि OFT) वर्ड प्रोसेसर यासाठी उचलण्यात आलेले पहिले पाऊल म्हणजे प्रकाशन उद्योगाशी संपर्क साधून तमिळ आणि हिंदी भाषेतील ट्र. टाईप फॉन्ट (TTF) सार्वजनिक ठिकाणी मोफत उपलब्ध करून देण्यासाठी निवडण्यात आले आहेत. TTF फॉन्टस् विंडोज 95/ विंडोज 98/ विंडोज NT प्लॅटफॉर्म या प्रणालींमध्ये मोठया प्रमाणात वापरले जात आहेत. विंडोज 2000/XP/2003 आणि लिनक्स प्लॅटफॉर्म यासारख्या प्रणालींसाठी ओ टी एफ ( ओपन टाईप फॉन्ट) सादर करण्यात येत आहेत. ड्रा आशातरहेचा पहिलाच प्रयत्न असून, बहुतेक वर्ड प्रोसेसर (अस्तित्वात असलेले व नवीन) या फॉन्टसचा वापर करू शकतील यामुळे तमिळ नेट/तमिळ 99 आणि टाईपरायटर कीबोर्डस् वापरकर्त्यांना डेटा एन्ट्रीसाठी फॉन्ट उपलब्ध होतील.

माहिती गोळा करणे, पुन्हा प्राप्त करणे, आणि अंकियकरणासाठी सर्व भारतीय भाषांमध्ये प्रकाशिक अक्षर ओळख (ORC) ओ आर सी मुळे स्कॅन करण्यात आलेली प्रतिकृतीचे (स्कँनरचा वापर करून छापलेल्या पानाचे स्कँनिंग) संपादित आवृत्तीत रुपांतर करण्यात येते. त्यामुळे त्याचा आवश्यक त्या सुधारणा आणि वापर करता येतो. याचा प्रकाशन व्यवसायाला सर्वाधिक लाभ मिळणार आहे कारण या साफ्टवेअरचा वापर करून, ते पुनर्मुद्रण करून नवीन प्रती छापू शकतील.

रेल्वे माहिती, आरोग्य सेवा, कृषि आपदा व्यवस्थापन आणि इतर सार्वजनिक सोयींसाठी वाणी इंटरफेस प्रणाली यामुळे बहुसंख्य लोक भारतीय भाषांमध्ये अद्ययावत प्रणालीचा लाभ घेउ शाकतील.मानवी आवाज ओळखून त्याचे, माहिती समजून घेण्यासाठी लिखित रुपात रुपांतर करण्यासाठी बोलणे ओळखणाऱ्या इंजिनाचा वापर करण्यासाठी इंटरफेस प्रणाली उपयोगात आणली जाऊ शकते. टेक्स टू स्पीचचा उपयोग दृष्टीहीन लोकांसाठी माहिती मिळविण्यासाठी टेक्स्ट वापरण्यासाठी केला जाऊ शकतो.

ब्राउजर, सर्च इंजिन, तसेच ई-मेल यासारखी इंटरनेट एक्सेस उपकरणे भारतीय भाषांसाठी वापरून भारतीय भाषेत ई-मेल पाठवणे शक्य होईल. तसेच सर्च इंजिन भारतीय भाषात माहिती शोधण्यास मदत करेल त्याच बरोबर कोणत्याही एखाद्या भारतीय भाषेत चौकशी माहिती देखील उपलब्ध करून देईल.

इंग्रजी तसेच इतर भारतीय भाषांमधे ऑनलाईन भाषांतर सेवा उपकरण. यामुळे इंग्रजी भाषेत तसच आपल्या लक्षित भारतीय भाषेत उपलब्ध माहितीचे भाषांतर करून घेण्यास मदत मिळेल.

उप्तादन/सेवा ऑनलईन हेल्प डेस्कसह टी डी आय एल डेटा सेंटरच्या माध्यमातून उपलब्ध करून देण्यात येतील.
पुढील माध्यमांतून संशोधन, उत्पादन, नियोजन यांना चालना देण्यासाठी सरकारपुढे टी डी आय एल-डी सी करता (भाषा तंत्रज्ञान उपयोगिता चॅनल) कालबद्ध मोहीम ओह.

१. विकसित तंत्रज्ञानाला बाजारात उपलब्ध करणे

२. उत्पादन तयार करण्यासाठी तंत्रज्ञानाचा दर्जा वाढविणे किंवा त्यावर संशोधन करणे

३. आवश्यकतेनुसार नविन तंत्रज्ञानाचा विकास करणे

वरील गोष्टी प्राप्त करण्यासाठी पुठील उपाययोजना करण्यात येत आहेत:

टी डी आय एल डेटा केंद्रांच्या माध्यमातून भाषा तंत्रज्ञान/साधनांचे नियोजन बद्ध वितरण
विकसित साधने, तंत्रज्ञान, उप्तादन आणि सेवांचे अधिगृहण
उपलब्ध साधने आणि तंत्रज्ञानाच्या माध्यमातून भारतीय भाषेत सरकारने केलेल्या प्रयत्नांविषयी जागरूकता निर्माण करणे, प्रसार करणे
वापरकर्त्याला साधने, उपयोगिता, उप्तादने निःशुल्क स्वरुपात
भाषा तंत्रज्ञानात खाजगी-सार्वजनिक भागिदारीला चालना देणे.
खास वापरात येणाऱ्या क्षेत्रांमधे मोहीमेची सुरवात करणे.

स्त्रोत : http://ildc.in/Marathi/mintroduction.html#top

Hits: 182
X

Right Click

No right click