சாட்ஜிபிடி, ஜெமினியை தூக்கி சாப்பிட்ட எலான் மஸ்கின் க்ரோக் 4 AI : ஏன் இவ்வளவு புகழ்? காரணம் என்ன தெரியுமா?

Published : Jul 12, 2025, 07:10 AM IST

க்ரோக் 4 இன் அற்புதமான செயல்திறனை ஆராயுங்கள். GPT-4 மற்றும் ஜெமினியை விஞ்சி, எலான் மஸ்கின் xAI மாடல் "இதுவரை சிறந்த" AI என ஏன் புகழப்படுகிறது என்பதை அறியுங்கள்.

PREV
17
க்ரோக் 4: அறிமுகமும் எதிர்பார்ப்புகளும்

க்ரோக் 4 ஆனது பல குறிப்பிடத்தக்க அளவுகோல்களில் முன்னணியில் உள்ளது, OpenAI மற்றும் Google போன்ற அனுபவம் வாய்ந்த போட்டியாளர்களைக் கூட இது நெருக்கமாக விஞ்சுகிறது. அறிமுகப்படுத்தப்பட்டதிலிருந்து, க்ரோக் 4 "மிகவும் புத்திசாலித்தனமான மாதிரி" என்று அழைக்கப்படுகிறது. பெரிய மொழி மாதிரிகளின் (LLM) கடலில் இது எப்படி தனித்து நிற்கிறது என்பதை இங்கே விரிவாகப் பார்க்கலாம்.

"இது கிட்டத்தட்ட அனைத்து பட்டதாரி மாணவர்களை விடவும், அனைத்து துறைகளிலும் ஒரே நேரத்தில் புத்திசாலித்தனமானது" என்று எலான் மஸ்க், தனது AI ஸ்டார்ட்அப் xAI இன் மிகவும் மேம்பட்ட க்ரோக் சாட்போட் பதிப்பின் வெளியீட்டு நேரலையின் போது கூறினார்.

27
க்ரோக் 4 இன் சிறப்பு அம்சங்கள்

க்ரோக் 4 என்பது xAI இன் பெரிய மொழி மாதிரியான க்ரோக்-இன் சமீபத்திய பதிப்பாகும், மேலும் இது சிறிய மேம்பாடுகளுடன் மட்டுமல்லாமல், அதன் முன்னோடிகளை விட சில பெரிய மேம்பாடுகளையும் கொண்டுள்ளது. புதிய மாதிரிகளைப் பயன்படுத்தியவர்களின் கூற்றுப்படி, க்ரோக் 4 தொடர் LLM களில் ஒரு பெரிய பாய்ச்சலைக் காட்டுகிறது, இது சரிபார்க்கக்கூடிய வெகுமதிகளுடன் கூடிய வலுவூட்டல் கற்றல் (RLVW) என்ற நுட்பத்தைப் பயன்படுத்துகிறது. RLVW என்பது ஒரு AI முகவர் தனது சூழலுடன் தொடர்பு கொண்டு, அதன் செயல்களுக்கு வெகுமதிகள் அல்லது அபராதங்களைப் பெறுவதன் மூலம் முடிவுகளை எடுக்கக் கற்றுக்கொள்ளும் ஒரு முறையாகும்.

க்ரோக் 2023 இல் ஒரு மாதிரியாக அறிமுகப்படுத்தப்பட்டது, இது அடுத்த-டோக்கன் கணிப்பில் முழுமையாக கவனம் செலுத்தியது, இது மொழி மாதிரியில் ஒரு அடிப்படை கருத்தாகும், அங்கு மாதிரி ஒரு உரை வரிசையில் அடுத்த சொல் அல்லது டோக்கனை கணிக்கிறது. வரிசையில் உள்ள அடுத்தடுத்த மாதிரிகள், குறிப்பாக க்ரோக் 3, கணக்கீட்டில் 10 மடங்கு அதிகரிப்பை வெளிப்படுத்தின, இது சிறந்த முன்-பயிற்சி முடிவுகளுக்கு வழிவகுத்தது. க்ரோக் 3.5 வலுவூட்டல் கற்றலைப் பயன்படுத்தி xAI இன் LLM களுக்கு பகுப்பாய்வு திறன்களை அறிமுகப்படுத்தியது; இருப்பினும், இப்போது க்ரோக் 4 அதை மேலும் எடுத்துச் சென்றுள்ளது. RLVW க்கு அதிக முக்கியத்துவம் அளிப்பதன் மூலம், க்ரோக் 4 ஆனது OpenAI, Google, Anthropic போன்ற முன்னணி மாதிரிகளை விஞ்சிவிட்டதாகத் தெரிகிறது.

AI மாதிரி அறியப்பட்ட பதில்களுடன் (கணித சமன்பாடுகள் அல்லது விஞ்ஞான உண்மைகள் போன்றவை) சிக்கல்களைத் தீர்க்கும்போது, வலுவூட்டல் கற்றல் நுட்பம் அதற்கு வெகுமதி அளிக்கிறது. இங்குள்ள யோசனை என்னவென்றால், நேரடியான சிக்கல்களுடன் மாதிரியை மீண்டும் மீண்டும் பயிற்சி செய்வதன் மூலம் மாதிரியின் பகுப்பாய்வு திறன்கள் மேம்படுத்தப்படுகின்றன. ஆர்ப்பாட்டத்தின் போது, மஸ்க் இன் பொறியாளர் குழு, அத்தகைய சிக்கல்கள் தீர்ந்துவிட்டதாகவும், உண்மையான உலக சூழல்கள் விரைவில் சிறந்த பயிற்சி மையங்களாக இருக்கலாம், வரம்பற்ற சரிபார்க்கக்கூடிய கருத்துக்களை வழங்குவதாகவும் சுட்டிக்காட்டினர்.

37
க்ரோக் 4 ஏன் புத்திசாலித்தனமான LLM?

எந்தவொரு LLM க்கும், அதன் திறன்களின் இறுதி சோதனை, கேள்விகளுக்கு பதிலளிக்கும், தர்க்கரீதியான சிக்கல்களைத் தீர்க்கும், வடிவங்களை அடையாளம் காணும், மற்றும் சில கோடிங் பணிகளில் தேர்ச்சியைக் கூட நிரூபிக்கும் பிரபலமான அளவுகோல்களில் மதிப்பெண்களைப் பெறுவதாகும். கடந்த சில ஆண்டுகளில், பெரிய தொழில்நுட்ப நிறுவனங்கள் தங்கள் AI மாதிரிகளை "ஒன்-அப்மேன்ஷிப்" (ஒருவரை ஒருவர் மிஞ்சுதல்) என்று அழைக்கப்படும் முறையில் அனுப்பி வருகின்றன; ஒருவேளை இதனால்தான் "இதுவரை சிறந்த மற்றும் மிகவும் மேம்பட்ட AI" என்று தங்கள் AI மாதிரிகளை அறிமுகப்படுத்துவதைத் தொடர்ந்து கேட்கிறோம். அளவுகோல் மதிப்பெண்கள் ஒரு AI மாதிரியின் திறன்களை மதிப்பிடுவதற்கு முக்கியம் என்றாலும், அதன் நிஜ உலக தாக்கங்கள் மற்றும் நடைமுறை பயன்பாடுகள் கணிசமாக மாறுபடலாம்.

எலான் மஸ்கின் க்ரோக் 4, xAI கூற்றுப்படி, பல்வேறு வகைகளில் அளவுகோல்களில் குறிப்பிடத்தக்க செயல்திறனைக் காட்டியுள்ளது. LLM ஆனது வெற்றிகரமாக கடந்த ஒரு குறிப்பிடத்தக்க அளவுகோல், உலகின் மிகக் கடினமான AI அளவுகோல்களில் ஒன்றாகக் கருதப்படும் 'மனிதகுலத்தின் கடைசித் தேர்வு' (Humanity's Last Exam) என்ற சோதனையாகும். இந்தச் சோதனை அடிப்படையில் உயிரியல், இயற்பியல், கணினி அறிவியல் மற்றும் பொறியியல் போன்ற கல்வித் துறைகளில் ஒரு மாதிரியின் அறிவு மற்றும் புரிதலை மதிப்பிடுகிறது. இது மிகவும் புத்திசாலித்தனமான மனித வல்லுநர்களுடன் கூட போட்டியிட வடிவமைக்கப்பட்டுள்ளது. இந்தச் சோதனையில், கருவிகள் இல்லாமல், க்ரோக் 4 26.9 சதவீதத்தைப் பெற்றது, கூகிள் ஜெமினி 2.5 ப்ரோவின் 21.6 சதவீதத்தையும் OpenAI இன் GPT-4 மாடல் மதிப்பெண்களையும் (20 சதவீதத்திற்கு அருகில்) விஞ்சிவிட்டது. கருவிகளுடன், இணைய உலாவல், நினைவகம் மற்றும் கோடிங் சூழல்களில் மாதிரி 41 சதவீதத்தைப் பெற்றது. மறுபுறம், ஒரு அளவிடப்பட்ட சோதனை-நேர கணக்கீட்டுடன், சிக்கல்களைத் தீர்க்க பல AI முகவர்களை உருவாக்கும் க்ரோக் 4 ஹெவி, 50.7 சதவீதத்தைப் பெற்றது, இது ஒரு குறிப்பிடத்தக்க பாய்ச்சல். க்ரோக் 4 ஹெவியை பொறுத்தவரை, இந்த மாதிரி முகவர்களை ஒரு குழுவாகச் செயல்பட்டு சிக்கல்களைத் தீர்க்கவும், நுண்ணறிவுகளைப் பகிரவும், பதில்களை கூட்டாகச் செம்மைப்படுத்தவும் பயன்படுத்துகிறது. இந்த கூட்டு பல-முகவர் கட்டமைப்பு க்ரோக் 4 ஹெவி மாதிரியின் தனித்துவமான அம்சமாகும்.

47
க்ரோக் 4 ஏன் புத்திசாலித்தனமான LLM?

மற்றொரு முக்கிய அளவுகோல் ARC-AGI ஆகும், இது ஒரு மாதிரியின் சுருக்கமான பகுப்பாய்வு மற்றும் சிக்கலைத் தீர்க்கும் திறன்களை மதிப்பிட வடிவமைக்கப்பட்டுள்ளது. இதில் வடிவ அங்கீகாரம் மற்றும் மனிதர்களுக்கு எளிதான ஆனால் AI மாதிரிகளுக்கு மிகவும் கடினமான பொதுவான பகுப்பாய்வு திறன்களும் அடங்கும். ARC-AGI V2 இல், க்ரோக் 4 15.9 சதவீதத்தைப் பெற்றது, இது முந்தைய 8 சதவீத மதிப்பெண்ணை (Opus 4) விட இருமடங்காகும்.

ARC பரிசின் நிறுவனர் கிரெக் கம்ராட், X இல் பதிவிட்டபடி, "ARC-AGI-2 தற்போதைய AI மாதிரிகளுக்குக் கடினமானது. சிறப்பாக மதிப்பெண் பெற, மாதிரிகள் பல பயிற்சி எடுத்துக்காட்டுகளிலிருந்து ஒரு மினி-திறனை கற்றுக்கொள்ள வேண்டும், பின்னர் அந்தத் திறனை சோதனை நேரத்தில் நிரூபிக்க வேண்டும். முந்தைய சிறந்த மதிப்பெண் ~8% (Opus 4 ஆல்). 10% க்கும் கீழ் சத்தமானது; 15.9% பெறுவது அந்த சத்தம் தடையைத் தாண்டுகிறது. க்ரோக் 4 பூஜ்யமற்ற அளவிலான திரவ அறிவைக் காட்டுகிறது," என்று குறிப்பிட்டார்.

57
காட்சிப்படுத்தல்கள், விளையாட்டு கணிப்புகள் மற்றும் பல

அளவுகோல்களைத் தவிர, ஆர்ப்பாட்டத்தின் போது, க்ரோக் 4 விளையாட்டு கணிப்புகள், கருந்துளை காட்சிப்படுத்தல்கள் மற்றும் விளையாட்டு வடிவமைப்பு ஆகியவற்றில் திறன் கொண்டது என்பதையும் பொறியாளர்கள் காட்டினர். டெமோவின் போது, க்ரோக் 4 இரண்டு கருந்துளைகள் மோதும் ஒரு விஞ்ஞான ரீதியாக நம்பத்தகுந்த காட்சியைக் உருவாக்கியது. க்ரோக் 4 க்கு உண்மையான நேரத் தரவை அணுகும் வசதி உள்ளது, இது எதிர்வினைகள், செய்தி மேம்பாடுகள் மற்றும் பலவற்றின் காலவரிசைகளை ஒழுங்கமைக்க அனுமதிக்கிறது.

இதற்கிடையில், மற்ற அளவுகோல்கள் க்ரோக் 4 இன் வரம்பையும் பன்முகத்தன்மையையும் காட்டுகின்றன. GPQA, அல்லது பட்டதாரி-நிலை கேள்வி பதிலில், மாதிரி 88.9 சதவீதத்தைப் பெற்றது, இது இதுவரை சிறந்ததாகக் கருதப்படுகிறது. கணித அரங்கில், அது 96.7 சதவீத மதிப்பெண்ணுடன் அனைவரையும் விஞ்சியது. இந்த மாதிரி அமெரிக்க கணித ஒலிம்பியாட்டிலும் ஆதிக்கம் செலுத்தி 79.4 சதவீதத்தைப் பெற்றது. லைவ் கோட் பெஞ்ச் இது ஒரு உயர்-நிலை குறியீட்டாளராகவும் இருக்க முடியும் என்று பரிந்துரைக்கிறது. AI மற்றும் இயந்திர கற்றல் 2025 சவாலுக்கு வரும்போது, க்ரோக் 4 ஒரு சரியான 100 சதவீதத்தைப் பெற்றது.

67
க்ரோக் 4 சிறப்பான பயன்பாட்டு

பாரம்பரிய அளவுகோல்களுடன், க்ரோக் 4 மாடல் சில நிஜ உலக நுண்ணறிவுடனும் சோதிக்கப்பட்டது. வெண்டிங் பெஞ்ச் என்பது ஒரு வெண்டிங் மெஷினை நிர்வகிக்கும் பணியை உருவகப்படுத்தும் ஒரு அளவுகோலாகும், மேலும் இது பட்ஜெட் மற்றும் சரக்கு போன்ற வரம்புகளுடன் வருகிறது. வெண்டிங் பெஞ்ச் சோதனையின் ஒரு பகுதியாக, AI முகவர்கள் ஆர்டர்களைக் கையாளவும், சரக்கு மற்றும் விலையை நிர்வகிக்கவும், அடிப்படையில் பணம் சம்பாதிக்கவும் தேவைப்படுகிறது. இந்தச் சோதனை ஒரு AI மாதிரியின் நீண்ட கால ஒத்திசைவை தீர்மானிக்கிறது. க்ரோக் 4 $4,700 நிகர மதிப்பெண்ணைப் பெற்றது, சிறந்த AI மாதிரிகள் மற்றும் மனித பங்கேற்பாளர்களையும் விஞ்சியது. ஒப்பீட்டளவில், GPT-3.5 $1,800 மதிப்பெண்ணைப் பெற்றது, ஒரு மனித சோதனையாளர் $844 மட்டுமே பெற முடிந்தது. வெண்டிங் பெஞ்ச் சோதனையில் க்ரோக் 4 இன் செயல்திறன் அதன் பகுப்பாய்வு, திட்டமிடல் மற்றும் கணிக்க முடியாத சூழ்நிலைகளில் செயல்படும் திறனை நிரூபிக்கிறது, அங்கு அது முக்கியமான திறன்களைப் பயன்படுத்த வேண்டும்.

பல பயனர்கள் க்ரோக் 4 சிறப்பான சில தனித்துவமான பயன்பாட்டு நிகழ்வுகளைக் காட்டியுள்ளனர். ஒரு xAI குழு உறுப்பினர் வெறும் நான்கு மணி நேரத்தில் ஒரு முதல்-நபர் ஷூட்டர் கேம்மை உருவாக்க இந்த மாதிரியைப் பயன்படுத்தினார். பொறியாளரின் கூற்றுப்படி, மாதிரி சொத்து ஆதாரம், தர்க்கம் மற்றும் காட்சிகள் போன்ற பணிகளை தானியங்குபடுத்தியது, மேம்பாட்டு நேரம் மற்றும் முயற்சிகளை வியத்தகு முறையில் குறைத்தது. சிறிது காலத்திற்கு முன்பு, எலான் மஸ்க், AI முழுமையான AAA தலைப்புகளை உருவாக்கும் என்று கூறினார். இது AAA இல்லாவிட்டாலும், வீடியோ கேம் மேம்பாட்டில் AI எவ்வளவு தூரம் வந்துள்ளது என்பதைக் காட்டுகிறது.

xAI, இது ஒப்பீட்டளவில் ஒரு புதிய நிறுவனம், கடந்த சில ஆண்டுகளில் அபாரமான வளர்ச்சியைக் கண்டுள்ளது. நிறுவனம் தற்போது தனது ஃபவுண்டேஷன் மாடல் v7 க்கு பயிற்சி அளித்து வருவதாகவும், இது விரைவில் நிறைவடையும் என்றும் மஸ்க் கூறியுள்ளார். மேலும், AI நிறுவனம் ஆகஸ்ட் மாதம் கோடிங்-சிறப்பு மாதிரி, செப்டம்பர் மாதம் பலமுனை முகவர் மற்றும் அக்டோபர் மாதம் வீடியோ உருவாக்கும் மாடல் ஆகியவற்றை வெளியிட திட்டமிட்டுள்ளதாக கூறப்படுகிறது.

77
AGI க்கு நெருக்கமாக இருக்கிறோமா?

எழுத்துப்பூர்வமாக, க்ரோக் 4 பல உயர்மட்ட அளவுகோல்களில் அதன் சகாக்களை விஞ்சுகிறது. இருப்பினும், க்ரோக் 4 அனைத்து பட்டதாரி மாணவர்களை விடவும் புத்திசாலித்தனமானது என்று மஸ்க் கூறியபோது, அவரது அறிக்கை ஒரு சிறிய சூழலைக் கொண்டுள்ளது. க்ரோக் 4 மற்றொரு LLM ஆகும், அதாவது இது மாயத்தோற்றங்களுக்கு ஆளாகும் - அல்லது தவறான தகவல்களை வெளியிடும், மற்ற எந்த AI மாதிரியைப் போலவே. சாராம்சத்தில், இது ஒரு புதிய வகை AI அல்ல. 'பட்டதாரி-நிலை' நுண்ணறிவு பற்றிய தனது கருத்து, மாதிரியின் கல்வித் தேர்வுகளில் செய்யப்பட்ட சோதனையின் அடிப்படையில் அமைந்தது என்று மஸ்க் பின்னர் தெளிவுபடுத்தினார். X பயனர்களில் ஒருவர் மதிப்பெண்கள் ஈர்க்கக்கூடியவை என்றும், ஆனால் விளக்கக்காட்சிகள் தவறாக வழிநடத்தலாம் என்றும் குறிப்பிட்டார். உதாரணமாக, xAI ஆல் பகிரப்பட்ட விளக்கப்படங்கள் மாதிரிகளுக்கு இடையிலான வேறுபாடுகளை மிகைப்படுத்தலாம். வியக்க வைக்கும் மதிப்பெண்கள் இருந்தபோதிலும், க்ரோக் 4 காட்சி பணிகளில் சிரமப்படுவதாக பல பயனர்கள் குறிப்பிட்டனர். உரை மற்றும் படங்களை உள்ளடக்கிய ஒரு சோதனையான முழு பலமுனை அளவுகோல்களில் ஜெமினி 2.5 ப்ரோவை விட க்ரோக் 4 ஒரு மிதமான முன்னேற்றத்தைக் கொண்டுள்ளது.

செயற்கை பொது நுண்ணறிவு, அல்லது AGI, மனித-நிலை அறிவாற்றல் திறன்களைக் கொண்ட AI அமைப்புகளின் ஒரு தத்துவார்த்த கருத்தாகும். பெரிய தொழில்நுட்ப நிறுவனங்கள் AGI ஐ அடைவதற்கு பில்லியன் கணக்கான டாலர்களை முதலீடு செய்து போட்டி போடும் அதே வேளையில், இன்னும் உறுதியான காலவரிசை எதுவும் இல்லை. ARC-AGI மற்றும் மனிதகுலத்தின் கடைசித் தேர்வு போன்ற அளவுகோல்களில் க்ரோக் 4 இன் செயல்திறன் AI முன்னேற்றங்களில் நாம் எவ்வளவு தூரம் வந்துள்ளோம் என்பதைக் காட்டுகிறது, ஆனால் இது AGI அல்ல. க்ரோக் 4 ஒரு LLM ஆகும், இது நம்பிக்கையுடன் தகவல்களை உருவாக்கும் வாய்ப்புள்ளது, மேலும் AGI யதார்த்தத்தில் அடிப்படையாக இருக்கும் என்று எதிர்பார்க்கப்படுகிறது. அளவுகோல்களின் அடிப்படையில், க்ரோக் 4 கணிதம், குறியீடு போன்ற கட்டமைக்கப்பட்ட பணிகளில் சிறந்து விளங்குகிறது. இருப்பினும், இது இடஞ்சார்ந்த பகுத்தறிவு மற்றும் நுட்பமான காட்சி புரிதலில் தோல்வியடைகிறது. இதற்கு செயல்பாடு அல்லது இலக்குகள் இல்லாததால் இது ஒரு AGI அல்ல, மேலும் இது தனது தவறுகளிலிருந்து உண்மையில் கற்றுக்கொள்வதில்லை. எளிமையாகச் சொன்னால், க்ரோக் 4 சிந்தனையை பிரதிபலிக்கிறது, ஆனால் இன்னும் ஒரு தன்னாட்சி சிந்தனையாளர் அல்ல.

வியாழக்கிழமை, ஜூலை 10 அன்று, xAI க்ரோக் 4, பல-முகவர் க்ரோக் 4 ஹெவி மற்றும் சூப்பர் க்ரோக் ஹெவி ஆகியவற்றை அறிமுகப்படுத்தியது. இந்த மாதிரிகள் எலான் மஸ்க் மற்றும் xAI இன் பொறியாளர்களால் நடத்தப்பட்ட ஒரு டெமோவுடன் தொடங்கப்பட்டன. புதிய க்ரோக் 4 xAI இன் ஃபவுண்டேஷன் மாடல் v6 ஐ அடிப்படையாகக் கொண்டது. க்ரோக் 4 ஐ xAI இன் தளம் வழியாகவோ அல்லது ஒரு API மூலமாகவோ அணுகலாம். இது 256K சூழல் சாளரம், பலமுனை பகுப்பாய்வு, நிகழ்நேர இணைய அணுகல் மற்றும் நிறுவன-தர பாதுகாப்புடன் வருகிறது. க்ரோக் 4 க்கு ஒரு மாதத்திற்கு $30 விலை நிர்ணயிக்கப்பட்டுள்ளது, அதே நேரத்தில் க்ரோக் 4 ஹெவி ஒரு மாதத்திற்கு $300 அல்லது ஒரு வருடத்திற்கு $3,000 ஆகும்.

Read more Photos on
click me!

Recommended Stories