சீன தொழில்நுட்ப நிறுவனமான ஷியோமி, கார்கள் மற்றும் ஸ்மார்ட் ஹோம்களுடன் தொடர்பு கொள்ளும் முறையை மாற்றும் வகையில் தனது அடுத்த தலைமுறை குரல் மாதிரி MiDashengLM-7B-ஐ வெளியிட்டு, செயற்கை நுண்ணறிவில் முக்கிய முன்னேற்றத்தை அடைந்துள்ளது.
2025 ஆகஸ்ட் 4-ஆம் தேதி அறிமுகமான இந்த புதிய மாதிரி, ஷியோமியின் ஏற்கனவே வாகனங்கள் மற்றும் ஸ்மார்ட் ஹோம் சூழலில் பயன்படுத்தப்படும் அடிப்படை குரல் தொழில்நுட்பத்தின் மீது கட்டப்பட்டுள்ளது. இதை தனிப்படுத்துவது, அலிபாபா குழுமத்தின் திறந்த மூல Qwen2.5-Omni-7B மாதிரியை ஒருங்கிணைத்திருப்பதாகும். இதன் மூலம் குரல் அடையாளம் காண்பதும், சூழல் ஒலி செயலாக்கத்திலும் முன்னேற்றமான செயல்திறனை வழங்கும் சக்திவாய்ந்த ஹைபிரிட் அமைப்பு உருவாகியுள்ளது.
பாரம்பரிய குரல் உதவியாளர்கள் பேச்சை மட்டும் அடையாளம் காண்பதை மையமாகக் கொண்டிருக்க, MiDashengLM-7B "பொது ஆடியோ விளக்க" (general audio caption) என்ற புதிய அணுகுமுறையை பயன்படுத்துகிறது. இது ஒரே நேரத்தில் பல்வேறு ஒலி ஆதாரங்களிலிருந்தும் சூழல் தகவலை புரிந்து கொள்ள உதவுகிறது. இதன் மூலம் பேசும் கட்டளைகள் மட்டுமல்லாமல், கண்ணாடி உடைதல், கைதட்டல், பின்னணியில் இசை போன்ற சூழல் ஒலிகளையும் புரிந்து கொள்ளும் திறன் கிடைக்கிறது.
செயல்திறன் அளவுகோள்களில் ஷியோமி சாதனை படைத்துள்ளதாக தெரிவிக்கிறது. 22 பொது மதிப்பீட்டு தரவுத்தொகுப்புகளில் சாதனை முடிவுகளை பெற்றுள்ளது. முன்னணி போட்டியாளர்களை விட நான்கு மடங்கு வேகமாக பதிலளிக்கிறது மற்றும் GPU நினைவகத்தை 20 மடங்கு திறமையாக பயன்படுத்துகிறது. இந்த கணினி திறன், குறைந்த செயலாக்க சக்தி கொண்ட சாதனங்களில் முழுமையாக ஆஃப்லைனில் இயக்குவதற்கான ஷியோமியின் திட்டத்திற்கு முக்கியமானது. இது தனியுரிமை மற்றும் நம்பகத்தன்மையையும் மேம்படுத்துகிறது.
கார் பயன்பாடுகளில், கூடுதல் சென்சார்கள் தேவையில்லாமல் ஒலி அடிப்படையிலான பாதுகாப்பு எச்சரிக்கைகளை வழங்கும் முன்னேற்றமான அம்சங்களை இந்த தொழில்நுட்பம் வழங்கும். ஸ்மார்ட் ஹோம்களில், XiaoAI ஸ்பீக்கர்கள் போன்ற சாதனங்களுடன் இன்னும் இயல்பான தொடர்பை ஏற்படுத்தும். ஸ்கிரிப்ட் உருவாக்குதல் முதல் தேவையான தகவலை உடனடியாக கண்டறிதல் வரை பல சிக்கலான பணிகளை மேற்கொள்ளும் திறன் கிடைக்கும்.
தொழில்நுட்ப துறையில் குறிப்பிடத்தக்க முறையில், ஷியோமி MiDashengLM-7B-ஐ முழுமையாக திறந்த மூலமாக Apache 2.0 உரிமையின் கீழ் வெளியிட்டுள்ளது. இதன் மூலம் வணிக மற்றும் ஆராய்ச்சி பயன்பாடுகளுக்கு திறந்தவையாக உள்ளது. கூகுள் அசிஸ்டன்ட் மற்றும் ஆப்பிளின் சிரி போன்ற போட்டியாளர்களின் மூடப்பட்ட சூழலை இது சவால் செய்கிறது. இது குரல் ஏஐ தொழில்நுட்பத்தில் புதுமையை விரைவுபடுத்தும் வாய்ப்பை உருவாக்குகிறது.
இந்த வெளியீடு, ஸ்மார்ட்போன்கள் அப்பால் மின்சார வாகனங்கள் மற்றும் ஸ்மார்ட் ஹோம் தொழில்நுட்பங்களில் விரிவடையும் ஷியோமியின் பெரிய திட்டத்தின் ஒரு பகுதியாகும். இதில் ஏஐ, அதன் விரிவாகும் தயாரிப்பு சூழலில் இணைப்புக் கருவியாக செயல்படுகிறது.