menu
close

MIT உருவாக்கிய AI பயிற்சியாளர் மொழி மாதிரிகளின் பிரச்சினை தீர்க்கும் திறனை அதிகரிக்கிறது

MIT ஆராய்ச்சியாளர்கள் CodeSteer எனும் புத்திசாலி உதவியாளரை உருவாக்கியுள்ளனர். இது பெரிய மொழி மாதிரிகளை உரை மற்றும் குறியீடு உருவாக்கும் முறைகளுக்கு இடையே மாற்றம் செய்ய வழிகாட்டுகிறது, சரியான பதிலை பெறும் வரை. இந்த அமைப்பு கணிதப் பிரச்சினைகள் மற்றும் பரப்பளவு காரணிகள் போன்ற சின்னவியல் பணிகளில் LLM-இன் துல்லியத்தை 30% க்கும் அதிகமாக உயர்த்தியுள்ளது. இதன் மூலம் குறைந்த திறன் கொண்ட மாதிரிகளும் மேம்பட்ட மாதிரிகளை விட சிறப்பாக செயல்பட முடிகிறது. இந்த கண்டுபிடிப்பு, ரோபோட்டிக்ஸ், வழங்கல் சங்கிலி மேலாண்மை மற்றும் கணக்கீட்டு துல்லியம் தேவைப்படும் பல துறைகளில் AI-யின் பிரச்சினை தீர்க்கும் திறனை பெரிதும் மேம்படுத்தும்.
MIT உருவாக்கிய AI பயிற்சியாளர் மொழி மாதிரிகளின் பிரச்சினை தீர்க்கும் திறனை அதிகரிக்கிறது

பெரிய மொழி மாதிரிகள் (LLMs) சூழலை புரிந்து கொண்டு, தர்க்க ரீதியான பதில்களை உரை வழியாக வழங்குவதில் சிறந்து விளங்குகின்றன. இருப்பினும், தசம எண்களை ஒப்பிடுதல் அல்லது மேம்படுத்தல் பிரச்சினைகளை தீர்க்கும் போன்று குறியீடு பயன்படுத்தி தீர்க்கக்கூடிய கணக்கீட்டு பணிகளில் அவை பெரும்பாலும் தடுமாறுகின்றன.

இந்த குறைபாட்டை சரிசெய்ய, MIT-யைச் சேர்ந்த ஆராய்ச்சியாளர்கள் CodeSteer எனும் புத்திசாலி உதவியாளரை உருவாக்கியுள்ளனர். இது பெரிய மொழி மாதிரிகளுக்கு பயிற்சியாளராக செயல்பட்டு, சரியான பதிலை பெறும் வரை உரை மற்றும் குறியீடு உருவாக்கும் முறைகளுக்கு இடையே மாற்றம் செய்ய வழிகாட்டுகிறது.

"மனிதர்களிடம் இருந்து நாங்கள் ஈர்க்கப்பட்டோம். விளையாட்டுகளில், பயிற்சியாளர் அணியின் நட்சத்திர வீரரை விட சிறந்தவராக இருக்க வேண்டிய அவசியமில்லை. ஆனால் பயிற்சியாளர், வீரருக்கு பயனுள்ள ஆலோசனைகளை வழங்கி அவரை வழிநடத்த முடியும். இந்த வழிகாட்டும் முறை LLM-களுக்கும் வேலை செய்கிறது," என்கிறார் ஹார்வர்டும் MIT-யும் சேர்ந்த பட்டதாரி மாணவர் யோங்சாவ் சென்.

CodeSteer, Llama-3-8B மாதிரியில் நுண்ணியமாகப் பயிற்சி பெற்ற ஒரு சிறிய LLM ஆகும். இது ஒரு கேள்வியை ஆய்வு செய்து, பிரச்சினையை தீர்க்க உரையா அல்லது குறியீடா எது சிறந்தது என்பதை தீர்மானிக்கிறது. பின்னர், பெரிய LLM-க்கு ஏற்ற முறையில் செயல்படுமாறு தூண்டுதல்கள் வழங்குகிறது. பதில் சரியாக இல்லையெனில், CodeSteer தொடர்ந்து LLM-ஐ வேறு முறைகளை முயற்சி செய்ய தூண்டுகிறது, சரியான தீர்வை அடையும் வரை.

GPT-4o-வை CodeSteer-இன் மூலம் மேம்படுத்தியபோது, சின்னவியல் பணிகளில் அதன் துல்லியம் 30% க்கும் அதிகமாக உயர்ந்தது. 37 பணிகளில் அதன் சராசரி செயல்திறன் மதிப்பெண் 53.3-இல் இருந்து 86.4-க்கு உயர்ந்தது. இதன் மூலம், OpenAI-யின் o1 (82.7) மற்றும் DeepSeek R1 (76.8) போன்ற மேம்பட்ட மாதிரிகளையும் மிஞ்சியது. மேலும், CodeSteer மற்ற மாதிரிகள் (Claude, Mistral, GPT-3.5) மீது பயன்படுத்தும்போது சராசரி 41.8% செயல்திறன் உயர்வை வழங்கியது.

CodeSteer-ஐ உருவாக்கவும் சோதிக்கவும், ஆராய்ச்சியாளர்கள் SymBench எனும் விரிவான தரவுத்தளத்தை உருவாக்கினர். இதில் 37 சின்னவியல் பணிகள் உள்ளன, அவற்றின் சிக்கல் அளவை மாற்றக்கூடியது. இந்த பணிகள் கணிதம், பரப்பளவு காரணிகள், தர்க்கம், வரிசை காரணிகள் மற்றும் மேம்படுத்தல் பிரச்சினைகள் ஆகியவற்றை உள்ளடக்கியவை.

இந்த கண்டுபிடிப்பு, உரை வழி தர்க்கம் மட்டும் போதாது என்ற இடங்களில், குறிப்பாக சந்தேகமான சூழல்களில் ரோபோட்டுகளுக்கான பாதைகள் உருவாக்குதல் அல்லது சர்வதேச வழங்கல் சங்கிலிகளில் கப்பல்களை திட்டமிடுதல் போன்ற சிக்கலான பணிகளில், AI-யின் பிரச்சினை தீர்க்கும் திறனை பெரிதும் மேம்படுத்தும்.

"ஒரு LLM-க்கு குறியீட்டை புத்திசாலியாக பயன்படுத்தும் திறனை சேர்க்கும்போது, ஏற்கனவே வலுவான மாதிரியை இன்னும் மேம்படுத்த முடிகிறது," என்கிறார் சென். தற்போது, CodeSteer-இன் தொடர்ச்சியான தூண்டுதல்களை வேகமாக்கும் வகையில் அதை எளிமைப்படுத்தவும், தனி உதவியாளர் இல்லாமல் உரை மற்றும் குறியீடு உருவாக்கும் முறைகளுக்கு இடையே மாறக்கூடிய ஒருங்கிணைந்த மாதிரியை நுண்ணியமாகப் பயிற்சி செய்யும் வழிகளை ஆராயவும், ஆராய்ச்சியாளர்கள் பணியாற்றி வருகின்றனர்.

Source: Techxplore

Latest News