உட்பொதிக்கப்பட்ட ஏஐ துறையில், டெவலப்பர்கள் எளிமையான மெஷின் லெர்னிங் மாதிரிகளைக் கடந்துவிட்டு, கடுமையாக வளங்கள் கட்டுப்படுத்தப்பட்ட ஹார்ட்வேர் சாதனங்களில் மேம்பட்ட டீப் நியூரல் நெட்வொர்க்குகளை செயல்படுத்தும் புதிய கட்டத்திற்கு நகர்கின்றனர்.
பாரம்பரிய TinyML, மைக்ரோகண்ட்ரோலர்களுக்கான அடிப்படை முடிவு எடுக்கும் செயல்களில் கவனம் செலுத்தியது. ஆனால், தற்போது உருவாகும் Tiny Deep Learning (TinyDL) வழிமுறை, எட்ஜ் கணினி திறன்களில் ஒரு பெரிய முன்னேற்றமாகும். இணையத்துடன் இணைக்கப்பட்ட சாதனங்கள், உடையணியும் சென்சார்கள் முதல் தொழில்துறை கண்காணிப்புகள் வரை, அதிகம் மேம்பட்ட சாதனத்தில் ஏஐ தேவையை உருவாக்குகின்றன. இந்தக் குறைந்த வளங்கள் கொண்ட தளங்களில் சிக்கலான அல்காரிதங்களை செயல்படுத்துவது பல சவால்களை உருவாக்குகிறது. இதனால் மாதிரி சுருக்கம் மற்றும் சிறப்பு ஹார்ட்வேர் போன்ற பகுதிகளில் புதுமை ஏற்படுகிறது. ஆராய்ச்சியாளர்கள் தற்போது 'TinyML' எனப்படும் எளிய மெஷின் லெர்னிங் மாதிரிகளைவிட, சக்திவாய்ந்த மற்றும் சிறிய 'Tiny Deep Learning' (TinyDL) கட்டமைப்புகளை செயல்படுத்த முனைந்துள்ளனர்.
இந்த மாற்றம் பல முக்கிய தொழில்நுட்ப முன்னேற்றங்களால் சாத்தியமாகிறது. TinyDL-ஐ ஆதரிக்கும் முக்கியக் கொள்கை மாதிரி மேம்படுத்தல் ஆகும். டீப் லெர்னிங் மாதிரிகள் பொதுவாக பெரியவை மற்றும் கணிப்பீட்டுத் திறன் அதிகம் தேவைப்படும். எனவே, எட்ஜ் சாதனங்களில் அவற்றை செயல்படுத்துவதற்கு பெரும் மாற்றங்கள் தேவை. மாதிரியில் உள்ள எண்களின் துல்லியத்தை குறைக்கும் 'quantization' போன்ற நுட்பங்கள் முக்கியமானவை. உதாரணமாக, 32-பிட் floating-point எண்களை 8-பிட் integer-களாக மாற்றுவது மாதிரியின் அளவும் கணிப்பீட்டு தேவையும் குறைக்கிறது, ஆனால் சில நேரங்களில் துல்லியத்தைக் குறைக்கலாம். 'Pruning' எனப்படும் நியூரல் நெட்வொர்க்கில் தேவையற்ற இணைப்புகளை systematic-ஆக நீக்கும் செயல்முறையும் மாதிரி சுருக்கத்திற்கும் வேகத்திற்கும் உதவுகிறது.
சிறப்பு நியூரல் ஆக்சிலரேட்டர் ஹார்ட்வேர் இந்த மாற்றத்திற்கு முக்கிய பங்கு வகிக்கிறது. STMicroelectronics நிறுவனம் STM32N6-ஐ அறிமுகப்படுத்தியுள்ளது. இது, ST-வின் கூற்றுப்படி, ஏஐ வேகப்படுத்தலுக்காக தனிப்பட்ட ஹார்ட்வேர் கொண்ட முதல் MCU ஆகும். இது ஏஐ ஹார்ட்வேர் வளர்ச்சியில் ஒரு முக்கிய திருப்புமுனையை குறிக்கிறது. கடந்த காலத்தைப் பார்த்தால், 2017-ல் Apple's A11 Bionic சிப் (முதல் AI வேகப்படுத்தல் கொண்ட application processor) மற்றும் 2016-ல் Nvidia-வின் Pascal கட்டமைப்பு (AI-க்கு GPU-களின் வாக்குறுதியை நிரூபித்தது) ஆகியவை இரண்டு முக்கிய நிகழ்வுகள்.
இன்றைய STM32N6-இல் உள்ள Neural-ART ஆக்சிலரேட்டரில் சுமார் 300 அமைக்கக்கூடிய multiply-accumulate அலகுகள் மற்றும் இரண்டு 64-பிட் AXI மெமரி பஸ்கள் உள்ளன. இது 600 GOPS திறனை வழங்குகிறது. இது NPU இல்லாத மிக வேகமான STM32H7-யை விட 600 மடங்கு அதிகம். STM32N6 தொடர், STMicroelectronics-இன் இதுவரை சக்திவாய்ந்த மைக்ரோகண்ட்ரோலர் ஆகும். இது 800 MHz Arm Cortex-M55 core மற்றும் 1 GHz-ல் இயங்கும் Neural-ART ஆக்சிலரேட்டர் கொண்டது. இது நேரடி AI முடிவு எடுப்பதற்காக 600 GOPS வரை வழங்கும். 4.2 MB RAM மற்றும் தனிப்பட்ட ISP உடன், இது பார்வை, ஒலி மற்றும் தொழில்துறை IoT பணிகளுக்காக வடிவமைக்கப்பட்டுள்ளது.
ஹார்ட்வேர் முன்னேற்றத்துடன், மென்பொருள் கட்டமைப்புகளும் இந்த மாற்றத்திற்கு ஆதரவாக மேம்படுகின்றன. TinyML கட்டமைப்புகள், நிறுவனங்கள் மற்றும் டெவலப்பர்கள் தங்கள் தரவைப் பயன்படுத்தி மேம்பட்ட அல்காரிதங்களை எட்ஜ் சாதனங்களில் திறம்பட செயல்படுத்த உதவும் வலுவான மற்றும் திறமையான அடித்தளத்தை வழங்குகின்றன. இவை Tiny Machine Learning-இல் மூத்த முயற்சிகளை இயக்கும் பல கருவிகள் மற்றும் வளங்களை வழங்குகின்றன. TinyML செயலாக்கத்திற்கு முக்கியமான கட்டமைப்புகளில் TensorFlow Lite (TF Lite), Edge Impulse, PyTorch Mobile, uTensor, மற்றும் STM32Cube.AI, NanoEdgeAIStudio, NXP eIQ, Microsoft Embedded Learning Library போன்றவை அடங்கும்.
இந்த தொழில்நுட்பம் மேலும் வளரும்போது, சிறிய எட்ஜ் சாதனங்களிலேயே நேரடியாக செயல்படும் மேம்பட்ட ஏஐ பயன்பாடுகளை நாம் எதிர்பார்க்கலாம். இது புதிய பயன்பாடுகளை உருவாக்கி, தனியுரிமையை பாதுகாக்கவும், தாமதத்தை குறைக்கவும், மின்சாரம் செலவினத்தை குறைக்கவும் உதவும். Tiny Deep Learning-க்கு மாற்றம், குறைந்த வளங்கள் கொண்ட சூழலில் மேம்பட்ட ஏஐ-யை எளிதாகக் கொண்டு செல்லும் முக்கியமான முன்னேற்றமாகும்.