Hindi news अब हिंदी से गोंडी अनुवाद के लिए एक अनूठी मशीन उपकरण

Hindi news-

Now a unique machine translation tool from Hindi to Gondi



 लॉकडाउन के दौरान माइक्रोसॉफ्ट रिसर्च लैब, सीजीनेट स्वरा और आईआईआईटी नया रायपुर द्वारा विकसित इस ऐप से गोंडी भाषा सीखने के लिए गोंड आदिवासी समुदाय के युवाओं को प्रेरित करने की उम्मीद है



 इन दिनों, तेलंगाना के अर्का मणिकराव, छत्तीसगढ़ के रेनूराम मरकाम और ओडिशा के रवींद्रनाथ एक साझा परियोजना - एक इंटरएक्टिव न्यूरल मशीन ट्रांसलेशन (INMT) उपकरण से एकजुट हुए हैं, जो हिंदी से गोंडी और इसके विपरीत के वाक्यों का अनुवाद करता है।  यह पहल माइक्रोसॉफ्ट रिसर्च लैब और एक भारतीय वॉइस-बेस्ड ऑनलाइन पोर्टल सीजीनेट स्वरा द्वारा की जा रही है, जो लोगों को केंद्रीय जनजातीय भारत के जंगलों में एक फोन कॉल के माध्यम से स्थानीय समाचार और कहानियों की रिपोर्ट करके अभिव्यक्ति के लिए एक मंच प्रदान करता है।  इंटरनेशनल इंस्टीट्यूट ऑफ इंफॉर्मेशन टेक्नोलॉजी, नया रायपुर के एक युवा छात्र अनुराग शुक्ला इस परियोजना के लिए अपने तकनीकी समर्थन को उधार दे रहे हैं।


 दिलचस्प बात यह है कि ज्यादातर प्रोजेक्ट कोविद -19 प्रेरित लॉकडाउन के दौरान निष्पादित किए गए हैं।  2019 में बेंगलुरु में माइक्रोसॉफ्ट रिसर्च लैब के कार्यालय में हमने एक कार्यशाला की। लेकिन ऐप को लॉकडाउन के दौरान विकसित किया गया था और संभवत: इस महीने के अंत में जारी होने की संभावना है, "पूर्व पत्रकार, जो CGNet तारा की सह-स्थापना करते हैं, शुभ्रांशु चौधरी।"  पिछले चार महीनों से, लगभग 150 से अधिक गोंडी भाषी, महाराष्ट्र के छः राज्यों, छत्तीसगढ़, ओडिशा, आंध्र प्रदेश, तेलंगाना और मध्य प्रदेश में फैले हुए हैं, सभी क्षेत्रों से घर पर बैठे हैं, हिंदी से गोंडी तक के वाक्यों का अनुवाद कर रहे हैं।  और वापस। कुछ उदाहरणों में शामिल हैं: "आग थोरे हमरे भगेवाँ जाई है," जब गोंडी में अनुवाद किया जाता है, तो यह पढ़ता है: "किस थो मावा लेन भगावाँ लेका आयूँ"।



 भले ही भाषा लगभग 12 मिलियन गोंड आदिवासियों द्वारा बोली जाती है, यह मानकीकृत नहीं है, छह राज्यों में विभिन्न संस्करणों में बोली जाती है।  सदियों से मौखिक रूप से पारित होने वाली बोलियों के साथ, भाषा में कोई लिखित साहित्य भी नहीं है।  और इसलिए कोई स्थानीय शिक्षक नहीं हैं, और बाहर से आने वाले केवल हिंदी बोलते हैं।  “परिणामस्वरूप, नई पीढ़ी ज्यादातर हिंदी बोलती है और भाषा गायब हो रही है।  यह उपकरण इसे बचाने का एक प्रयास है, "मध्य प्रदेश के निवासी दिनेश वट्टी कहते हैं, जो समुदाय से रह रहे हैं और सीजीनेट स्वरा की ओर से इस परियोजना का नेतृत्व कर रहे हैं।" उम्मीद है, जब युवाओं के पास यह ऐप होगा, तो आसानी से सुलभ होगा।  मोबाइल, वे भाषा सीखने के लिए प्रेरित होंगे। ”


 यह परियोजना प्राकृतिक भाषा प्रसंस्करण पर माइक्रोसॉफ्ट रिसर्च लैब के काम का एक विस्तार है, जिसके हिस्से के रूप में यह गोंडी जैसी कम-संसाधन भाषाओं पर केंद्रित है, जहां इतना कम डेटा उपलब्ध है।  सीजीनेट स्वरा की विभिन्न अन्य भाषा पहलों के बारे में जानने के बाद टीम ने इस परियोजना को अपनाया।  “गोंडी केस स्टडी के रूप में उपयोग करने के लिए एक बहुत अच्छी भाषा है क्योंकि इसका छह राज्यों में पर्याप्त वक्ता आधार है।  यह खतरे में नहीं है और अभी तक शून्य संसाधन उसी के लिए उपलब्ध हैं।  CGNet Swara के माध्यम से, हम विभिन्न मुद्दों के बारे में अवगत हुए, जो गोंड आदिवासियों का सामना करते हैं, और भाषा तक पहुंच कैसे समुदाय की सांस्कृतिक पहचान में मदद कर सकती है, "कलिका बाली, प्रमुख शोधकर्ता, माइक्रोसॉफ्ट रिसर्च लैब कहते हैं। प्रौद्योगिकी और भाषा को एक साथ लाकर।  और लोगों तक आसानी से पहुंच प्रदान करने के लिए, टीम दूसरों को प्रेरित करने की उम्मीद करती है, जो अन्य समुदायों के साथ समान काम करना चाहते हैं।



 एक टॉप-डाउन दृष्टिकोण के बजाय, जिसमें प्रौद्योगिकीविदों के निर्णय समुदाय पर लगाए जाएंगे, परियोजना ने समुदाय के सदस्यों के विचारों और इच्छाओं पर ध्यान केंद्रित किया।  बेंगलुरु में कार्यशाला, शैक्षणिक भागीदारों, सीजीनेट स्वरा टीम और समुदाय के सदस्यों ने भाग लिया, सभी उपस्थित लोगों के लिए समृद्ध अनुभव रहा।  “लगभग कोई भी गोंड आदिवासी प्रतिनिधि अंग्रेजी नहीं समझता था।  और लैब में हर कोई हिंदी नहीं बोलता।  एक टीम के हिंदी बोलने वाले - एक टीममेट ने मौके पर अनुवाद करने के लिए स्वेच्छा से कहा, "लैब में युवा लोगों को संवाद करने का प्रयास करते हुए देखकर अच्छा लगा।"  ऐप जो गोंडी वक्ताओं को मोबाइल पर भाषा में सामग्री का उपयोग करने की अनुमति देगा। और वहां से, ऐप का विचार अस्तित्व में आया। "हालांकि, एक इंटरएक्टिव न्यूरल मशीन ट्रांसलेशन टूल को काम करने के लिए मॉडल के लिए पर्याप्त मात्रा में डेटा की आवश्यकता होती है।"  उस समय गोंडी में बहुत कम डेटा उपलब्ध था, "बाली जोड़ता है।


 इसलिए, 2019 के बाद, बेंगलुरु की बैठक के बाद, CGNet टीम ने "यात्रा" शुरू की। छत्तीसगढ़ के कोंडागांव जिले के फरासगाँव में समुदाय के प्रतिनिधियों ने डेटा एकत्र करने के तरीकों पर चर्चा की। II बिलासपुर और बस्तर के शिक्षकों ने भी शुरू किया।  उस बिंदु पर मदद करते हुए, "वट्टी कहते हैं।


 जैसे-जैसे आंकड़े आने शुरू हुए, इस परियोजना ने पिछले महीने 20,000 वाक्यों को पार करके अपनी पहली बाधा पार कर ली।  आज, आधार 35,000 वाक्यों तक बढ़ गया है और इसका उद्देश्य कम से कम 1 लाख वाक्यों का अनुवाद करना है।  “ऐप के साथ, समुदाय के लिए एक विंडो खुल जाएगी।  दुनिया की किसी भी प्रमुख भाषा में लिखी गई किसी भी चीज का अनुवाद और फिर उनसे संवाद किया जा सकता है।  इसे एक मोबाइल ऐप बनाकर और ब्राउज़र-आधारित नहीं, विचार यह है कि इसे उन स्थानों पर सुलभ बनाया जाए जहां कई उपकरण उपलब्ध नहीं हैं और असंगत इंटरनेट सेवाओं के साथ हैं।  यह ऑफ़लाइन भी काम कर सकता है, ”बाली कहते हैं।



 ऐप पर काम करने वाले समुदाय के लोग तकनीक-प्रेमी हो सकते हैं या नहीं।  लेकिन सीजीनेट टीम प्रारूप के वीडियो भेजकर और तकनीकी टीम को लगातार कॉल करके प्रक्रिया के माध्यम से उन्हें संभाल रही है।  “विभिन्न सदस्य हिंदी में वाक्य देखते हैं और फिर अनुवाद के ऑडियो प्रस्तुत करते हैं।  वट्टी कहते हैं, "हम मानकीकृत गोंडी में ऐसा करने की कोशिश कर रहे हैं।"


 यह उन कई भाषा परियोजनाओं में से एक है, जिस पर CGNet स्वरा काम कर रही है, जिसमें से एक मानकीकृत गोंडी शब्दकोश है।  पहले से ही 3,000 से अधिक शब्दों को इसमें जोड़ा गया है।  लाउंज के साथ 2018-साक्षात्कार में, चौधरी ने इस तरह की पहल के महत्व के बारे में बात की थी।  “यदि सभी का मानकीकृत शब्दकोश है, तो पत्रकार, प्रशासक या शिक्षक समुदाय के भीतर से उभर सकते हैं।  उन्हें स्कूलों को छोड़ने और बंदूकें उठाने की जरूरत नहीं है।  वे गोंडी में एक समाचार सेवा शुरू करने के लिए ऑल इंडिया रेडियो के साथ काम कर सकते थे, "उन्होंने कहा था। हाल ही में टीम ने एक अन्य परियोजना पर काम किया है, गोंडी में प्रथम पुस्तक द्वारा 400 बच्चों की पुस्तकों का अनुवाद किया है।" छत्तीसगढ़ सरकार ने हाल ही में राज्य में शिक्षा की घोषणा की है।  आदिवासी भाषाओं में शुरू होगा। नई शिक्षा नीति में यह भी कहा गया है कि शिक्षा मातृभाषा में प्रदान की जाएगी। लेकिन गोंडी में कोई किताबें नहीं हैं। इसलिए, हमने प्रथम पुस्तकें के साथ काम किया है और 400 पुस्तकों का अनुवाद किया है। यह अभी तक प्रकाशित नहीं हुई है।  लेकिन तैयार सामग्री है, अगर सरकार चाहती है। यह मानक गोंडी में की गई पहली लिखित सामग्री होगी, "वे कहते हैं।

News updated रहने के लिए हमारा ब्लॉग फॉलो करें।

Thank you.

टिप्पणियाँ

एक टिप्पणी भेजें