פרוס במהירות AI ולמידת מכונה עוצמתיות ויעילות המשתמשות במיקרו-בקרי Renesas RA8M1
באדיבות ‎DigiKey's North American Editors
2024-03-20
העליה של בינה מלאכותית (AI), למידת מכונה (ML), ועומסי עבודה עתירי חישובים אחרים בקצה הרשת עבור האינטרנט של דברים (IoT) מטילה עומס עיבוד נוסף על מיקרו-בקרים (MCUs). טיפול בעומסי עבודה חדשים אלה מגדיל צריכת הספק, למרות שמתכננים מתבקשים להקטין למינימום הספק ולהאיץ את זמן היציאה לשוק.
מתכננים צריכים אופציית מחשוב השומרת על הנצילות של מיקרו-בקר, תוך הוספת מאפייני ביצועים-עיליים התפורים במיוחד עבור מקרי הספק-נמוך. על אופציה זו גם לשמור על מודלים פשוטים של פריסה הקשורים עם מיקרו-בקרים מסורתיים, תוך הוספת מאפיינים מספיקים לתמיכה ביישומים המתוחכמים המאופשרים על ידי AI ו-ML, כמו בקרת קול ותחזוקה מנבאת.
מאמר זה דן בגורמים הדוחפים את הדרישה ל-AI ו-ML ומסביר מדוע דרושות ארכיטקטורות מעבד חדשות כדי לספק יכולות אלו ביעילות. אחר כך המאמר מציג את משפחת המיקרו-בקרים RA8M1 מבית Renesas ומראה כיצד ניתן להשתמש בה כדי לענות על דרישות אלו.
הדרישות של AI ו-ML קצה
הדרישות ל-AI ו-ML הולכות וגדלות ביישומי IoT קצה החל מאוטומציה של בניינים והתקנים תעשייתיים עד מכשירי חשמל ביתיים. אפילו שהן קטנות יחסית, על מערכות משובצות הספק-נמוך מוטלים כעת עומסי עבודה כגון איתור מילות מפתח, שליטה קולית ועיבוד אודיו/תמונה. יישומי מטרה כוללים רכזות חיישנים, ניווט ובקרת רחפנים, מציאות רבודה (AR), מציאות מדומה (VR) וציוד תקשורת.
כדי להקטין למינימום שימוש באנרגיה, תקורה ושיהוי תוך שמירה על פרטיות, עיבוד נתונים בקצה עדיף לעיתים קרובות על שליחתו לענן. זה מאתגר מתכננים כיוון שהתקני קצה לרוב מוגבלים-משאב, במיוחד כשמוזנים-סוללה.
מיקרו-בקרים משופרים למחשוב קצה
עומסי עבודה AI ו-ML בדרך כלל כרוכים בביצוע אותה פעולה מתמטית שוב ושוב על ערכת נתונים גדולה. עומסי עבודה אלה ניתנים להאצה באמצעות הוראה יחידה, נתונים מרובים (SIMD). ה-SIMD מבצע מספר פעולות מתמטיות במקביל, לכן מספק תפוקה גבוהה משמעותית ונצילות הספק טובה יותר מעיבוד קונבנציונלי.
בגלל שלמיקרו-בקרים מסורתיים אין פונקציונליות SIMD, הם צריכים עזרה כדי לבצע עומסי עבודה AI ו-ML. פתרון אחד הוא להשתמש במעבד אותות דיגיטלי (DSP) או מאיצי SIMD אחרים לצד ה-MCU. עם זה, גישה מרובת-מעבד זו מסבכת תכנון מערכת.
אפשרות אחרת היא להחליף ליחידת מיקרו-מעבד (MPU) בעלת ביצועים גבוהים יותר המצוידת ביכולות SIMD. אפשרות זו יכולה לספק את הביצועים הדרושים במערך של מעבד יחיד, אך ליחידות MPU יש פשרות בתחומי צריכת הספק וקבוצות מאפיינים. לדוגמה, לא כל יחידות ה-MPU מתוכננות לספק את המחשוב הדטרמיניסטי בעל השיהוי-הנמוך הדרוש ביישומים מוכוונים MCU.
הפעלת AI ו-ML במיקרו-בקרים
תוך הכרה בצורך בחבילה ממוטבת של יחידות מיקרו-בקר כדי לתמוך בעומסי עבודה AI ו-ML, חברת Renesas הציגה את סדרת ה-RA8M1 MCU (איור 1). הסדרה מבוססת על ארכיטקטורת Arm® Cortex®-M85 עם Helium ו-TrustZone, והיא יכולה לרוץ ב-480 מגה-הרץ (MHz) עם צריכת הספק אופיינית של 225 מיקרו-אמפר למגה-הרץ (µA/MHz).
איור 1: ה-Renesas RA8M1 MCU מבוסס על Arm Cortex-M85 וכולל טכנולוגיית Helium כדי להאיץ עיבוד AI ו-ML. (מקור תמונה: Renesas)
מתוכנן עבור ביצועים יעילים וצריכת הספק נמוכה, ל-RA8M1 MCU יש מאפיינים כמו דטרמיניזם, זמני פסק קצרים ותמיכת ניהול הספק עדכנית ביותר. המעבד משיג יעילות ביצועים של 6.39 CoreMark למגה-הרץ (CoreMark/MHz).
ה-Helium היא M-Profile Vector Extension (MVE) SIMD המאיצה משמעותית עיבוד אותות ו-ML. היא מוסיפה 015 פקודות סקלריות ווקטוריות ומאפשרת את העיבוד של אוגרים (registers) של 128-bit (איור 2). היא ממוטבת במיוחד עבור מיקרו-בקרים בהספק נמוך יותר, מוגבלי-משאב. לדוגמה, Helium עושה שימוש-חוזר באוגרי יחידת נקודה-צפה (FPU) במקום להציג אוגרי SIMD חדשים. זה מסייע בהורדת צריכת ההספק של המעבד ומקטין מורכבות תכנון.
איור 2: Helium עושה שימוש-חוזר בבנק האוגרים FPU עבור עיבוד וקטור. (מקור תמונה: Arm)
כמתואר באיור 3, ה-Cortex-M85 של RA8M1 כולל טכנולוגיית TrustZone של Arm. ה-TrustZone מעניקה בידוד חומרה עבור קושחה, נכסים ומידע פרטי קריטיים. ה-Cortex-M85 גם מוסיף יכולות ביטחון ובטיחות חדשות, כמו הרחבת ה-pointer authentication and branch target identification (PACBTI). מאפייני ביטחון אלה הם רבי-ערך במיוחד בהקשר של AI, היכן שהתקן עשוי לקיים אינטראקציה עם נתונים אישיים.
איור 3: ה-TrustZone של Cortex-M85 מספקת בידוד חומרה עבור קושחה, נכסים ומידע פרטי קריטיים. (מקור תמונה: Arm)
תכונות חומרה שיש לחפש ב-MCU התומך ב-AI
על מיקרו-בקר לשלב ביצועים יעילים עם קבוצת מאפיינים חזקה כדי לתמוך ביישומי בינה מלאכותית. ה-RA8M1 מצויד היטב עבור בקרת מנוע, בקרה לוגית ניתנת-לתכנות (PLC) ויישומי IoT ותעשייתיים אחרים.
לדוגמה, אלגוריתמים של AI דורשים זיכרון רב. זיכרון המערכת RA8M1 כולל עד 2 מגה-בייט (Mbytes) של זיכרון Flash ו-Mbyte 1 של זיכרון SRAM. זיכרון ה-SRAM כולל 128 קילו-בייט (Kbytes) של Tightly Coupled Memory (TCM), שמאפשר גישה מהירה לזיכרון עבור חישובים בעלי ביצועים עיליים.
כדי להבטיח עבודה אמינה, 384 קילו-בייט של ה-SRAM משתמש וכל ה-128 קילו-בייט של TCM מוגדרים כזיכרון קוד תיקון שגיאות (ECC). מטמוני ההוראות והנתונים של 32 קילו-בייט גם כן מוגנים ECC.
ה-RA8M1 כולל מאפייני אבטחה מרובים בנוסף לאלה הכלולים בליבת ה-Arm. אלה כוללים את מנוע ההצפנה Reprogrammable Secure Intellectual Property (RSIP) עבור עיבוד נתונים מאובטח, אחסון בלתי משתנה להגנה על נתונים קריטיים ומנגנוני הגנה מפני חבלה.
עבור ממשקי תקשורת, ה-MCU מצויד ב-Ethernet עבור חיבוריות רשת, Controller Area Network Flexible Data Rate (CAN FD) עבור יישומים תעשייתיים ורכב, ו-USB מהירות גבוהה/מהירות מלאה עבור חיבוריות כללית. הוא גם כולל ממשק מצלמה וממשק היקפי טורי (SPI) מתומן עם פענוח תוך כדי העברה (On-the-Fly) עבור זיכרון חיצוני.
ממשקים אנלוגיים כוללים ממירי אנלוגי-לדיגיטלי (ADCs) וממירי דיגיטלי-לאנלוגי (DACs) bit-12, משוונים אנלוגיים מהירות-גבוהה ושלושה מעגלי דגימה-והחזקה (sample-and-hold). עבור תקשורת טורית, ה-RA8M1 תומך בפרוטוקולים מרובים, כולל ממשק תקשורת טורית (SCI) עם SPI, מקמ"ש אסינכרוני אוניברסלי (UART) ו-Inter-Integrated Circuit (I²C). ה-MCU מציע גם את ה-Improved Inter-Integrated Circuit (I3C) עבור קצבי העברת נתונים משופרים ויעילות.
מפתחים הזקוקים לגישה מלאה ליכולות כניסה/יציאה (I/O) אלו יכולים להשתמש במארז Ball Grid Array (BGA) כמו ה-R7FA8M1AHECBD#UC0 בעל ה-22 פינים. אלה המחפשים תהליך תכנון והרכבה יעיל יותר של לוח מעגל מודפס יכולים לשקול את השימוש באפשרות של Low-profile Quad Flat Package (LQFP) כמו ה-R7FA8M1AHECFB#AA0 בעל ה-14 פינים.
סביבות פיתוח עבור יישומי AI
מתכננים המעוניינים להתנסות עם סדרת ה-RA8M1 יכולים להתחיל עם לוח ההערכה EK-RA8M1 R7FA8M (איור 4). לוח זה כולל ממשק Ethernet RJ45 RMII, ממשק USB מהירות-גבוהה מארח והתקן, ופס פינים CAN FD של שלושה פינים. מבחינת זיכרון, הוא כולל 64 מגה-בייט של SPI Flash מתומן.
איור 4: לוח ההערכה EK-RA8M1 הוא בעל תמיכת I/O איתנה כדי להפעיל את ה-RA8M1 MCU. (מקור תמונה: Renesas)
ה-RA8M1 נתמך על ידי ה-Renesas Flexible Software Package (FSP), מסגרת עבודה מקיפה המתוכננת לספק בסיס תוכנה באיכות גבוהה, ידידותי-למשתמש, ניתן-להרחבה, עבור תכני מערכת משובצת.
החבילה מציעה כלי פיתוח, כולל את סביבת הפיתוח המשולבת (IDE) e² studio המבוססת על ה-Eclipse IDE הנפוץ. היא גם כוללת שתי מערכות הפעלה זמן-אמת בולטות, פטורות מתמלוגים: Azure RTOS ו-FreeRTOS.
החבילה כוללת מנהלי-התקנים (Drivers) קלי-משקל, מוכנים לייצור, שתומכים במקרי שימוש נפוצים במערכות משובצות. מנהלי-התקנים אלה בשילוב עם לוח ההערכה נותנים למפתחים מסלול מהיר לביצוע ניסויים עם ה-RA8M1 I/O.
סיכום
ה-RA8M1 נותן למפתחים אופציה חדשה למימוש עומסי עבודה AI ו-ML ביישומי IoT קצה החוסכת הספק, משפרת ביצועים, מקטינה מורכבות ומקצרת את זמן היציאה לשוק.
מיאון אחריות: דעות, אמונות ונקודות מבט המובעות על ידי מחברים שונים ו/או משתתפי פורום באתר אינטרנט זה לא בהכרח משקפות את הדעות, האמונות ונקודות המבט של חברת DigiKey או את המדיניות הרשמית של חברת DigiKey.

