
OpenAI நிறுவனம் சமீபத்தில் 'IndQA' என்ற ஒரு புதிய முயற்சியைத் தொடங்கியுள்ளது. செயற்கை நுண்ணறிவு (AI) மாதிரிகள் இந்தியப் பண்பாடு, மொழிகள் மற்றும் அன்றாட வாழ்க்கை குறித்த அம்சங்களை எவ்வளவு திறம்படப் புரிந்துகொண்டு, அதைப் பகுத்தறியும் என்பதைச் சோதிப்பதே இதன் முக்கிய நோக்கம். இதுவரை பெரும்பாலும் மேற்கத்திய உலகின் தரவுகளின் அடிப்படையிலேயே AI மாதிரிகள் பயிற்சி பெற்று வந்த நிலையில், இந்த IndQA ஒரு திருப்புமுனையாக அமைகிறது. இது AI உலகத்திற்குக் கிடைத்த 'இந்தியப் பார்வை' என்று கூறலாம்.
இந்த IndQA என்பது, 12 இந்திய மொழிகள் மற்றும் 10 பரந்த பண்பாட்டுத் துறைகளை உள்ளடக்கிய, 2,278 கேள்விகளின் மாபெரும் தொகுப்பு ஆகும். இது இந்தியாவிலிருந்து வந்த 261 நிபுணர்களின் பங்களிப்புடன் உருவாக்கப்பட்டுள்ளது. இதன் தனிச்சிறப்பு என்னவென்றால், இந்தக் கேள்விகள் வேறு மொழியிலிருந்து மொழிபெயர்க்கப்படாமல், இந்தியர்கள் அன்றாடம் பேசும் மொழிகளிலேயே 'தாய்மொழித் தன்மையுடன்' (Natively) எழுதப்பட்டுள்ளன. இதனால், கேள்விகள் மிகவும் உள்ளூர்மயமாக்கப்பட்டு மக்கள் சிந்திக்கும் மற்றும் பேசும் விதம் போலவே உள்ளன.
"OpenAI-யில், AI ஒட்டுமொத்த மனிதகுலத்திற்கும் பயனுள்ளதாக இருக்க வேண்டும் என்று நாங்கள் நம்புகிறோம். அதாவது, AI-க்கு மேற்கத்திய உலகம் மட்டுமல்லாமல், உள்ளூர் பண்பாடுகள், மொழிகள், வரலாறுகள் மற்றும் சூழல்கள் பற்றிய புரிதல் அவசியம்" என்று OpenAI-ன் B2B Application பிரிவின் தலைமைத் தொழில்நுட்ப அதிகாரி (CTO) ஸ்ரீனிவாஸ் நாராயணன் தெரிவித்துள்ளார். இந்தியா ஒரு மாபெரும் பன்முகத்தன்மை கொண்ட நாடு; எனவே, இங்குள்ள மொழிகள், மரபுகள் மற்றும் பண்பாட்டு நுணுக்கங்களை AI புரிந்துகொண்டால் மட்டுமே, அது உண்மையாகவே பயனுள்ளதாக இருக்கும் என்றும் அவர் வலியுறுத்தியுள்ளார்.
இந்த IndQA தரவுத்தளம் இந்தியாவின் பண்பாட்டு மற்றும் வரலாற்றுச் சூழலைத் துல்லியமாகப் பதிவு செய்யும் வகையில் வடிவமைக்கப்பட்டுள்ளது என்று நாராயணன் குறிப்பிட்டார். "இந்தத் தரவுத்தொகுப்பு எங்கள் AI மாதிரிகள் இந்திய நுணுக்கங்களை இன்னும் ஆழமாகப் புரிந்துகொள்ள உதவுகிறது. நிபுணர்கள் அளித்துள்ள மதிப்பீட்டு விதிகளின் (Evaluation Rubrics) மூலம், பண்பாட்டு அடிப்படை கொண்ட கேள்விகளுக்கு AI எந்த அளவுக்குச் சிறப்பாகப் பதிலளிக்கிறது என்பதை அளவிட முடியும். இதே அணுகுமுறையை மற்ற நாடுகளிலும் பயன்படுத்த நாங்கள் இலக்கு கொண்டுள்ளோம்" என்றும் அவர் விளக்கினார்.
இந்த IndQA அறிமுகமானது, இந்தியச் சூழல் அமைப்பு மீதான OpenAI-ன் வளர்ந்து வரும் ஈடுபாட்டை அடிக்கோடிட்டுக் காட்டுகிறது. கட்டிடக்கலை மற்றும் வடிவமைப்பு, கலை மற்றும் பண்பாடு, அன்றாட வாழ்க்கை, உணவு மற்றும் சமையல், வரலாறு, சட்டம் மற்றும் நெறிமுறைகள், இலக்கியம் மற்றும் மொழியியல், ஊடகம் மற்றும் பொழுதுபோக்கு, மதம் மற்றும் ஆன்மீகம், விளையாட்டு மற்றும் பொழுதுபோக்கு போன்ற பல முக்கியப் பண்பாட்டுத் தலைப்புகளை இது உள்ளடக்கியுள்ளது. வங்காளம், ஆங்கிலம், இந்தி, ஹிங்கிலிஷ், கன்னடம், மலையாளம், மராத்தி, ஒடியா, தமிழ், தெலுங்கு, குஜராத்தி, மற்றும் பஞ்சாபி ஆகிய 12 மொழிகளில் இக்கேள்விகள் உள்ளன.
ஒவ்வொரு கேள்விக்குமான சரியான பதில், அதை மதிப்பிடுவதற்கான வழிகாட்டுதல்கள் மற்றும் ஆங்கில மொழிபெயர்ப்பு என விரிவான தகவல்களுடன் இந்தத் தளம் உருவாக்கப்பட்டுள்ளது. இந்த முயற்சி, உலகளவில் AI கருவிகள் இந்தியப் பயனர்களுக்கு மிகவும் நெருக்கமானதாகவும், பொருத்தமானதாகவும் மாறுவதற்கு வழி வகுக்கும்.