האצת ביצועי הרשת: ההשפעה של RDMA על Ethernet מתכנס (RoCE)
2024-12-27
ההתפתחות המהירה של יישומים עתירי מחשוב הדגישה את הצורך בפתרונות רשת מידרגיים, מהירים ויעילים יותר. בין הטכנולוגיות החדשניות ביותר כדי לענות על דרישה זו היא גישה ישירה לזיכרון מרוחק (RDMA) על-גבי Converged Ethernet (RoCE). טכנולוגיה פורצת-דרך זו מאפשרת העברת נתונים ישירה בין מערכות ללא צורך בהתערבות CPU, מקצרת משמעותית את השיהוי (Latency) ומשפרת את ביצועי המערכת הכוללים. חברת iWave, בית תכנון FPGA בולט, נמצא בחזית פיתוחים אלו, לאחר שהטמיעה פתרון 100G Ethernet חסון על ידי שילוב ה-ERNIC IP (קניין רוחני של בקר ממשק רשת Ethernet RDMA של AMD) בפורטפוליו מודולי המחשוב המשובצים שלה. אינטגרציה זו אמורה לשפר את יכולות ה-RDMA ביישומים בעלי ביצועים גבוהים.
איור 1: טכנולוגיה פורצת-דרך זו מאפשרת העברת נתונים ישירה בין מערכות ללא צורך בהתערבות CPU, מקצרת משמעותית את השיהוי (Latency) ומשפרת את ביצועי המערכת הכוללים. (מקור התמונה: iWave)
הבנת RDMA על-גבי Converged Ethernet (RoCE)
RDMA היא טכנולוגיה קריטית המאפשרת העברות זיכרון ישירות בין מארחים או שרתים, תוך למעשה עקיפת ה-CPU. יכולת זו מאפשרת ל-CPUs להתמקד בביצוע יישומים ובעיבוד נתונים ומוביל לשיפורים בולטים בביצועי הרשת המאופיינים בשיהוי קצר, עומסי CPU נמוכים יותר ורוחב פס מוגדל - הכול בצורה יעילה וחסכונית. RoCE הוא פרוטוקול רשת ספציפי שנועד להקל על פעולות RDMA על-גבי רשתות Ethernet. על ידי מינוף תשתית ה-Ethernet הקיימת, RoCE מציג אפשרות אטרקטיבית עבור ארגונים המעוניינים לשפר את הביצועים מבלי לשנות את מערכי הרשת הקיימים שלהם.
סוגי RoCE
RoCE מסווג לשתי גרסות נפרדות המבוססות על מתאם הרשת בשימוש: RoCE v1 ו-RoCE v2.
- RoCE v1: פרוטוקול זה מאפשר תקשורת בין שני מארחים הממוקמים באותו דומיין שידור Ethernet (VLAN). הוא משתמש ב-Ethertype 0x8915 ומגביל חבילות (Frames) Ethernet סטנדרטיות ל-Bytes 1,500, תוך שהוא מאפשר לחבילות ג'מבו Ethernet להרחיב עד Bytes 9,000.
- RoCE v2: כדי להתמודד עם המגבלות של RoCE v1, RoCE v2 מציג שיפורים ב-Encapsulation של מנות (Packet) על ידי שילוב כותרות IP ו-UDP. שינוי זה מאפשר ל-RoCE v2 לתפקד בצורה חלקה על פני רשתות Layer 2 (Data Link Layer) ו-Layer 3 (Network Layer) כאחד, ובכך לתמוך בניתוב Layer 3 ובמדרגיות על פני מספר תת-רשתות. נקרא לעתים Routable RoCE (RRoCE), RoCE v2 גם מוסיף תמיכה ב-Multicast IP, ומרחיב עוד יותר את הישימות שלו.
ERNIC IP: שיפור יכולות RDMA
ה-ERNIC (Embedded RDMA enabled NIC) הוא ליבת IP של בקר ממשק רשת Ethernet RDMA ניתנת-להתאמה-מיוחדת ומתוכננת עבור אינטגרציה חלקה עם FPGAs של AMD, MPSoC ומימושי MAC IP רך. פתרון זה מתאפיין בתפוקה גבוהה, שיהוי קצר ומנגנון העברת נתונים אמין מחוץ-לחומרה במלואו על גבי Ethernet סטנדרטי. iWave הדגימה את מחויבותה לחידושים טכנולוגיים על ידי מימוש מוצלח של פתרון 100G Ethernet. הישג זה התאפשר הודות לשימוש בערכת הפיתוח מופעלת Zynq UltraScale+ MPSoC של iWave, המשלבת את ה-ERNIC IP של AMD.
ערכת הפיתוח Zynq UltraScale+ MPSoC מותאמת במיוחד עבור בניית אב-טיפוס והערכת פתרונות 100G Ethernet, תוך שימוש במחברי QSFP-28 במהירות גבוהה.
מערך הדגמה
מערך הדגמה טיפוסי (איור 2) מורכב מ-:
- ערכת פיתוח מופעלת ZU19EG Zynq UltraScale+ MPSoC של iWave
- NIC 100G ConnectX-5 Mellanox של Advantech
- NIC 1G מאופשר Sync 1588 PTP
- כבל MTP, מודולי QSFP-28, ו-כבל Ethernet RJ45 CAT6
- PC שרת 22.04 Ubuntu
איור 2: מערך טיפוסי עבור לערכת הפיתוח Zynq UltraScale+ MPSoC. (מקור התמונה: iWave)
סקירת ארכיטקטורת המערכת
ארכיטקטורת המערכת מתוכננת למטב את העברת הנתונים, עם תפקידים מוגדרים בבירור בין רכיבי מערכת העיבוד (PS) והלוגיקה הניתנת-לתכנות (PL). המימוש כולל גם סנכרון של פרוטוקול זמן מדויק (PTP), שהוא חיוני עבור יישומי זמן-אמת. עם מדדי ביצועים מרשימים, כמו היכולת לטפל בוידאו 8K של מעל 100 פריימים לשנייה, היישומים הפוטנציאליים משתרעים על מגזרים שונים, כולל מרכזי נתונים, מולטימדיה ומחשוב עם ביצועים גבוהים, מה שמדגיש את הוורסאטיליות והחשיבות של הטכנולוגיה בסביבות מחשוב מודרניות.
הארכיטקטורה ברמה הגבוהה של המערכת, המתוארת באיור 3, מדגישה את התפקידים המובהקים של רכיבי PS ו-PL בתוך ה-Zynq UltraScale+ MPSoC. ה-PS כולל SoC מבוסס Hard Cortex-A53 של ARM, שהוא חיוני עבור הגדרת תצורת המערכת, בקרה ודיאגנוסטיקה. רכיבי המפתח של ארכיטקטורה זו כוללים:
- דוחף 100G Ethernet MAC: מבטיח ביצועים חסונים והעברת נתונים עם העברת נתונים של Gb/s 100 עם שיהוי (Latency) קצר
- דוחף בקר ERNIC: אחראי על ניהול הנתונים הנכנסים ל-DDR והקלת התקשורת בין אפליקציית המשתמש לבין ERNIC IP באמצעות חילופי Doorbell יעילים
- ספריות ליבה ומרחב משתמש של RDMA: מבטיחים תאימות וביצועים אופטימליים עבור פעולות RDMA על פני מרחבי Kernel ומשתמש כאחד
איור 3: עיקרי התפקידים השונים של מערכת העיבוד ורכיבי הלוגיקה הניתנים-לתכנות בתוך ה-Zynq UltraScale+ MPSoC. (מקור התמונה: iWave)
ה-ERNIC IP של AMD מעביר ביעילות את הנטל של חבילת התוכנה RoCE v2 אל ה-FPGA, כאשר בקר ה-ERNIC מנהל את החלפת הנתונים בין המודולים השונים כדי להקל על העברת הנתונים. הוא מייצר כניסות מחסנית עבודה ושולח הודעות (Doorbells) ל-ERNIC IP. במקביל, תת-המערכת 100G Ethernet של ה-Zynq UltraScale+ MPSoC מנהלת את ה-MAC והשכבות הפיזיות, בעוד שמחולל תבניות הנתונים אחראי על הפקת נתונים גולמיים ותבניות נתוני וידאו.
פרוטוקול זמן מדויק (PTP)
חתימת-הזמן PTP (Precision Time Protocol) (תקן IEEE 1588) ממלאת תפקיד מכריע בסנכרון הזמן בין המערכות ברשת Ethernet. סנכרון זה הוא חיוני עבור שיפור הביצועים של יישומי זמן-אמת, ומאפשר חילופי נתונים מסונכרנים ושיהוי (Latency) קצר ברמה של ננו-שניות.
עיקרי המערך
המאפיינים הבולטים של מערך זה כוללים:
- מימוש 100G Ethernet על-גבי RoCE v2 באמצעות ERNIC IP של AMD
- סוג TransPort חיבור אמין
- פונקציות RDMA SEND, RDMA READ ו-RDMA WRITE עבור טיפול במנות (Packet)
- תמיכה ב-RDMA Send עם סוג הודעות Immediate ו-RDMA Write עם סוג הודעות Immediate
- בדיקת ביצועים עבור RDMA באמצעות יישומי XRPING ו-PERFTEST
- מחולל תבניות נתונים מותאם-במיוחד עבור תבניות נתונים RAW ווידאו
- הכנסת חותמות-זמן PTP לצד נתונים
סטטיסטיקת התפוקה המפורטת עבור העברות נתוני וידאו מערכת הפיתוח Zynq UltraScale+ MPSoC אל PC שרת מציגה ביצועים מרשימים, עם יכולת לטפל בווידאו 8K במהירות של למעלה מ-fps 100 ווידאו 4K ביותר מ-fps 400.
יישומים אפשריים
האינטגרציה של RDMA על גבי Converged Ethernet ו-ERNIC IP פותחת אפיקים חדשים בתעשיות שונות, ומשפרת משמעותית את החיבוריות, הביצועים והיעילות במגוון של יישומים, כולל:
- מרכזי נתונים ומחשוב ענן: תמיכה בתקשורת שרתים יעילה והאצת עיבוד נתונים בארכיטקטורות ענן
- קליטת וידיאו/תמונה והעברה: מועילה עבור יישומי מולטימדיה, שידור פומבי וסביבות מציאות מדומה (VR)
- פתרונות אחסון: אפשור העברת נתונים מהירה יותר בין התקני אחסון ושרתים, ובכך שיפור ביצועי מערכת האחסון
- מחשוב בעל ביצועים גבוהים (HPC): שיפור מהירויות העברת הנתונים וקיצור זמן השיהוי בתוך אשכולות HPC עבור משימות מחשוב וסימולציות מהירות יותר
- התקני קצה IoT: אפשור איסוף והעברת נתוני זמן-אמת מחיישנים והתקנים
ככל שהביקוש לפתרונות העברת נתונים מהירים ויעילים יותר ממשיך לעלות, RDMA על גבי Converged Ethernet עומד למלא תפקיד מרכזי בעתיד של מחשוב בעל ביצועים גבוהים.
סיכום
הפורטפוליו הנרחב של פלטפורמות FPGA ו-SoC FPGA של iWave, בשילוב עם המומחיות הטכנית העמוקה שלה, מאפשר ללקוחות לפתח מוצרים מתקדמים-ביותר הממנפים את הפיתוחים העדכניים ביותר בבינה מלאכותית (AI), למידת מכונה ומחשוב קצה. הודות לשיתוף הפעולה עם iWave, חברות יכולות להאיץ את פיתוח המוצרים שלהן, להפחית סיכונים ולהקדים את המתחרים בנוף טכנולוגי יותר ויותר מורכב.
לפרטים נוספים או לדיון בדרישות התאמה-מיוחדת, אנא פנו אלינו ב-mktg@iwave-global.com
מיאון אחריות: דעות, אמונות ונקודות מבט המובעות על ידי מחברים שונים ו/או משתתפי פורום באתר אינטרנט זה לא בהכרח משקפות את הדעות, האמונות ונקודות המבט של חברת DigiKey או את המדיניות הרשמית של חברת DigiKey.