तुम्ही पण AI शी हिंदी-मराठीत गप्पा मारताय मग, लागू शकतो ‘लँग्वेज टॅक्स’; वाचा डिटेल्स

What Is AI Language Tax : तुम्ही जर एआयशी संवाद साधण्यासाठी इंग्रजीऐवजी मराठी, हिंदी किंवा अन्य प्रादेशिक भाषांचा वापर करत असाल, तर...

Artificial Intelligence

Artificial Intelligence

What Is AI Language Tax : कृत्रिम बुद्धिमत्ता म्हणजेच एआय (Artificial Intelligence) तंत्रज्ञानाच्या युगात संवाद साधणे सोपे झाले आहे, असे वाटत असतानाच आता एक धक्कादायक माहिती समोर आली आहे. इंग्रजीऐवजी हिंदी, मराठी, अरबी किंवा चिनी भाषेत AI चॅटबॉट्सशी संवाद साधणाऱ्या वापरकर्त्यांना अधिक खर्च करावा लागू शकतो. तंत्रज्ञान विश्वात यालाच आता ‘लँग्वेज टॅक्स’ (Language Tax) असे संबोधले जात आहे.

इंग्रजीपेक्षा इतर भाषांना अधिक टोकन्स

OpenAI, Anthropic आणि Google यांसारख्या कंपन्या त्यांच्या AI मॉडेल्सना सर्व भाषांसाठी समान सक्षम असल्याचा दावा करतात. मात्र, नव्या संशोधनानुसार इंग्रजीव्यतिरिक्त इतर भाषांमध्ये संवाद साधताना AI अधिक ‘टोकन्स’ वापरतो. याचा थेट परिणाम वापरकर्त्यांच्या खर्चावर होऊ शकतो.

एआय मॉडेल्स ज्या पद्धतीने माहितीवर प्रक्रिया करतात, त्यावर हा संपूर्ण खर्च अवलंबून असतो. एआय प्रणाली कोणताही मजकूर वाचण्यासाठी आणि समजून घेण्यासाठी ‘टोकन्स’ या तांत्रिक घटकांचा वापर करते. संशोधनानुसार, इंग्रजी भाषेतील वाक्ये एआय अधिक कार्यक्षमतेने आणि कमी टोकन्समध्ये समजून घेते. मात्र, तेच काम जेव्हा मराठी, हिंदी किंवा इतर प्रादेशिक भाषांमध्ये केले जाते, तेव्हा एआयला जास्त टोकन्स खर्च करावे लागतात. माहिती सांगण्याचा उद्देश एकच असला तरी, तांत्रिक प्रक्रियेतील या फरकामुळे भाषिक वापरकर्त्यांना जास्त ‘टोकन मूल्य’ मोजावे लागते, जो एक प्रकारचा छूपा खर्च ठरत आहे.

संशोधनात काय आढळलं?

OpenAI चे संशोधक Aran Komatsuzaki यांनी केलेल्या प्रयोगात विविध भाषांमधील मजकूर AI टोकनायझर कसा हाताळतो याचा अभ्यास करण्यात आला. AI संशोधक Rich Sutton यांच्या प्रसिद्ध The Bitter Lesson या लेखाचा आधार घेऊन विविध भाषांतील अनुवादांचे विश्लेषण करण्यात आले. OpenAI आणि ॲन्थ्रोपिक सारख्या आघाडीच्या कंपन्यांच्या एआय मॉडेल्सवर केलेल्या प्रयोगातून असे दिसून आले की, हिंदी भाषेतील मजकूर हाताळण्यासाठी एआयला इंग्रजीच्या तुलनेत 1.36 पट अधिक टोकन्सची आवश्यकता भासते. ॲन्थ्रोपिकच्या ‘क्लॉड’ (Claude) मॉडेलमध्ये तर ही तफावत 3.24 पट इतकी मोठी आहे. याचप्रमाणे अरबी आणि चिनी भाषांसाठीही एआयला जास्त टोकन्स खर्च करावे लागत आहेत.

भारतीय वापरकर्त्यांसाठी काय अर्थ?

भारतासारख्या बहुभाषिक देशात AI चा वापर झपाट्याने वाढत आहे. मात्र, जर AI सेवांचे शुल्क टोकन्सवर आधारित असेल, तर हिंदी, मराठी, तमिळ, बंगाली किंवा इतर भारतीय भाषांमध्ये संवाद साधणाऱ्या वापरकर्त्यांना इंग्रजी वापरणाऱ्यांपेक्षा अधिक पैसे मोजावे लागू शकतात. तज्ज्ञांच्या मते, AI तंत्रज्ञान सर्वांसाठी समान संधी उपलब्ध करून देण्याचा दावा करत असले तरी भाषेच्या आधारावर वाढणारा हा खर्च डिजिटल विषमता वाढवू शकतो.

भविष्यात काय बदल होऊ शकतात?

AI कंपन्यांसमोर आता मोठे आव्हान उभे राहिले आहे. जगभरातील अब्जावधी लोक इंग्रजीऐवजी स्थानिक भाषांमध्ये AI वापरत आहेत. त्यामुळे भविष्यात विविध भाषांसाठी अधिक कार्यक्षम टोकनायझेशन तंत्रज्ञान विकसित करण्याची गरज निर्माण झाली आहे. अन्यथा AI च्या युगात इंग्रजी जाणणाऱ्यांना आर्थिक फायदा आणि स्थानिक भाषिकांना अतिरिक्त खर्चाचा सामना करावा लागू शकतो.

एआय कंपन्या नेहमीच त्यांचे तंत्रज्ञान जगभरातील लोकांसाठी समान असल्याचे दावे करतात. मात्र, भाषिक प्रक्रियेतील या तांत्रिक मर्यादांमुळे अप्रत्यक्षपणे भाषिक विषमता निर्माण होत असल्याचे तज्ज्ञांचे म्हणणे आहे. ज्या वापरकर्त्यांची इंग्रजीवर उत्तम पकड नाही, त्यांना माहिती मिळवण्यासाठी जास्तीचा भुर्दंड सोसावा लागत आहे. एआय क्षेत्रातील ही एक मोठी त्रुटी मानली जात असून, भविष्यात कंपन्यांना सर्व भाषांसाठी समान टोकन प्रक्रिया विकसित करून हा ‘लँग्वेज टॅक्स’ कमी करण्याकडे लक्ष द्यावे लागणार आहे.

Exit mobile version