האצת ביצועי הרשת: ההשפעה של RDMA‏ על Ethernet מתכנס (RoCE‏)

מאת ‎Tawfeeq Ahmad

ההתפתחות המהירה של יישומים עתירי מחשוב הדגישה את הצורך בפתרונות רשת מידרגיים, מהירים ויעילים יותר. בין הטכנולוגיות החדשניות ביותר כדי לענות על דרישה זו היא גישה ישירה לזיכרון מרוחק (RDMA) על-גבי Converged Ethernet‏ (RoCE‏). טכנולוגיה פורצת-דרך זו מאפשרת העברת נתונים ישירה בין מערכות ללא צורך בהתערבות CPU, מקצרת משמעותית את השיהוי (Latency‏) ומשפרת את ביצועי המערכת הכוללים. חברת iWave‏, בית תכנון FPGA בולט, נמצא בחזית פיתוחים אלו, לאחר שהטמיעה פתרון 100G Ethernet‏ חסון על ידי שילוב ה-ERNIC IP‏ (קניין רוחני של בקר ממשק רשת Ethernet RDMA של AMD) בפורטפוליו מודולי המחשוב המשובצים שלה. אינטגרציה זו אמורה לשפר את יכולות ה-RDMA ביישומים בעלי ביצועים גבוהים.

תמונה של RoCE המקל על העברות נתונים ישירות בין מערכותאיור 1‏: טכנולוגיה פורצת-דרך זו מאפשרת העברת נתונים ישירה בין מערכות ללא צורך בהתערבות CPU, מקצרת משמעותית את השיהוי (Latency‏) ומשפרת את ביצועי המערכת הכוללים. (מקור התמונה: iWave‏)

הבנת RDMA‏ על-גבי Converged Ethernet‏ (RoCE‏)

RDMA היא טכנולוגיה קריטית המאפשרת העברות זיכרון ישירות בין מארחים או שרתים, תוך למעשה עקיפת ה-CPU‏. יכולת זו מאפשרת ל-CPUs‏ להתמקד בביצוע יישומים ובעיבוד נתונים ומוביל לשיפורים בולטים בביצועי הרשת המאופיינים בשיהוי קצר, עומסי CPU נמוכים יותר ורוחב פס מוגדל - הכול בצורה יעילה וחסכונית. RoCE הוא פרוטוקול רשת ספציפי שנועד להקל על פעולות RDMA על-גבי רשתות Ethernet. על ידי מינוף תשתית ה-Ethernet הקיימת, RoCE מציג אפשרות אטרקטיבית עבור ארגונים המעוניינים לשפר את הביצועים מבלי לשנות את מערכי הרשת הקיימים שלהם.

סוגי RoCE

RoCE מסווג לשתי גרסות נפרדות המבוססות על מתאם הרשת בשימוש: RoCE v1‏ ו-RoCE v2‏.

  1. RoCE v1: פרוטוקול זה מאפשר תקשורת בין שני מארחים הממוקמים באותו דומיין שידור Ethernet‏ (VLAN‏). הוא משתמש ב-Ethertype 0x8915 ומגביל חבילות (Frames‏) Ethernet סטנדרטיות ל-Bytes‏ 1,500, תוך שהוא מאפשר לחבילות ג'מבו Ethernet להרחיב עד Bytes‏ 9,000‏.
  2. RoCE v2‏: כדי להתמודד עם המגבלות של RoCE v1‏, RoCE v2‏ מציג שיפורים ב-Encapsulation‏ של מנות (Packet‏) על ידי שילוב כותרות IP ו-UDP‏. שינוי זה מאפשר ל-RoCE v2 לתפקד בצורה חלקה על פני רשתות Layer 2‏ (Data Link Layer‏) ו-Layer 3‏ (Network Layer‏) כאחד, ובכך לתמוך בניתוב Layer 3 ובמדרגיות על פני מספר תת-רשתות. נקרא לעתים Routable RoCE‏ (RRoCE‏), RoCE v2‏ גם מוסיף תמיכה ב-Multicast‏ IP‏, ומרחיב עוד יותר את הישימות שלו.

ERNIC IP‏: שיפור יכולות RDMA

ה-ERNIC‏ (Embedded RDMA enabled NIC‏) הוא ליבת IP של בקר ממשק רשת Ethernet RDMA ניתנת-להתאמה-מיוחדת ומתוכננת עבור אינטגרציה חלקה עם FPGAs‏ של AMD‏, MPSoC‏ ומימושי MAC IP רך. פתרון זה מתאפיין בתפוקה גבוהה, שיהוי קצר ומנגנון העברת נתונים אמין מחוץ-לחומרה במלואו על גבי Ethernet סטנדרטי. iWave הדגימה את מחויבותה לחידושים טכנולוגיים על ידי מימוש מוצלח של פתרון 100G Ethernet. הישג זה התאפשר הודות לשימוש בערכת הפיתוח מופעלת Zynq UltraScale+ MPSoC‏ של iWave, המשלבת את ה-ERNIC IP של AMD.

ערכת הפיתוח Zynq UltraScale+ MPSoC מותאמת במיוחד עבור בניית אב-טיפוס והערכת פתרונות 100G Ethernet, תוך שימוש במחברי QSFP-28‏ במהירות גבוהה.

מערך הדגמה

מערך הדגמה טיפוסי (איור 2‏) מורכב מ-:

תרשים של ערכת הפיתוח Zynq UltraScale+ MPSoC‏ של iWave‏איור 2: מערך טיפוסי עבור לערכת הפיתוח Zynq UltraScale+ MPSoC. (מקור התמונה: iWave)

סקירת ארכיטקטורת המערכת

ארכיטקטורת המערכת מתוכננת למטב את העברת הנתונים, עם תפקידים מוגדרים בבירור בין רכיבי מערכת העיבוד (PS) והלוגיקה הניתנת-לתכנות (PL). המימוש כולל גם סנכרון של פרוטוקול זמן מדויק (PTP), שהוא חיוני עבור יישומי זמן-אמת. עם מדדי ביצועים מרשימים, כמו היכולת לטפל בוידאו 8K של מעל 100 פריימים לשנייה, היישומים הפוטנציאליים משתרעים על מגזרים שונים, כולל מרכזי נתונים, מולטימדיה ומחשוב עם ביצועים גבוהים, מה שמדגיש את הוורסאטיליות והחשיבות של הטכנולוגיה בסביבות מחשוב מודרניות.

הארכיטקטורה ברמה הגבוהה של המערכת, המתוארת באיור 3, מדגישה את התפקידים המובהקים של רכיבי PS ו-PL בתוך ה-Zynq UltraScale+ MPSoC. ה-PS כולל SoC‏ מבוסס Hard Cortex-A53 של ARM, שהוא חיוני עבור הגדרת תצורת המערכת, בקרה ודיאגנוסטיקה. רכיבי המפתח של ארכיטקטורה זו כוללים:

  • דוחף 100G Ethernet MAC: מבטיח ביצועים חסונים והעברת נתונים עם העברת נתונים של Gb/s‏ 100‏ עם שיהוי (Latency‏) קצר
  • דוחף בקר ERNIC: אחראי על ניהול הנתונים הנכנסים ל-DDR והקלת התקשורת בין אפליקציית המשתמש לבין ERNIC IP באמצעות חילופי Doorbell‏ יעילים
  • ספריות ליבה ומרחב משתמש של RDMA‏: מבטיחים תאימות וביצועים אופטימליים עבור פעולות RDMA על פני מרחבי Kernel‏ ומשתמש כאחד

תרשים של מערכת העיבוד ורכיבי הלוגיקה הניתנים-לתכנות בתוך ה-iWave Zynq UltraScale+ MPSoCאיור 3: עיקרי התפקידים השונים של מערכת העיבוד ורכיבי הלוגיקה הניתנים-לתכנות בתוך ה-Zynq UltraScale+ MPSoC‏. (מקור התמונה: iWave)

ה-ERNIC IP‏ של AMD‏ מעביר ביעילות את הנטל של חבילת התוכנה RoCE v2 אל ה-FPGA, כאשר בקר ה-ERNIC מנהל את החלפת הנתונים בין המודולים השונים כדי להקל על העברת הנתונים. הוא מייצר כניסות מחסנית עבודה ושולח הודעות (Doorbells‏) ל-ERNIC IP‏. במקביל, תת-המערכת 100G Ethernet של ה-Zynq UltraScale+ MPSoC מנהלת את ה-MAC והשכבות הפיזיות, בעוד שמחולל תבניות הנתונים אחראי על הפקת נתונים גולמיים ותבניות נתוני וידאו.

פרוטוקול זמן מדויק (PTP)

חתימת-הזמן PTP‏ (Precision Time Protocol‏) (תקן IEEE 1588) ממלאת תפקיד מכריע בסנכרון הזמן בין המערכות ברשת Ethernet. סנכרון זה הוא חיוני עבור שיפור הביצועים של יישומי זמן-אמת, ומאפשר חילופי נתונים מסונכרנים ושיהוי (Latency‏) קצר ברמה של ננו-שניות.

עיקרי המערך

המאפיינים הבולטים של מערך זה כוללים:

  • מימוש 100G Ethernet‏ על-גבי RoCE v2‏ באמצעות ERNIC IP‏ של AMD‏
  • סוג TransPort‏ חיבור אמין
  • פונקציות RDMA SEND, RDMA READ ו-RDMA WRITE עבור טיפול במנות (Packet‏)
  • תמיכה ב-RDMA Send עם סוג הודעות Immediate‏ ו-RDMA Write עם סוג הודעות Immediate‏
  • בדיקת ביצועים עבור RDMA באמצעות יישומי XRPING ו-PERFTEST
  • מחולל תבניות נתונים מותאם-במיוחד עבור תבניות נתונים RAW‏ ווידאו
  • הכנסת חותמות-זמן PTP לצד נתונים

סטטיסטיקת התפוקה המפורטת עבור העברות נתוני וידאו מערכת הפיתוח Zynq UltraScale+ MPSoC אל PC‏ שרת מציגה ביצועים מרשימים, עם יכולת לטפל בווידאו 8K במהירות של למעלה מ-fps‏ 100‏ ווידאו 4K‏ ביותר מ-fps‏ 400‏.

יישומים אפשריים

האינטגרציה של RDMA על גבי Converged Ethernet ו-ERNIC IP פותחת אפיקים חדשים בתעשיות שונות, ומשפרת משמעותית את החיבוריות, הביצועים והיעילות במגוון של יישומים, כולל:

  • מרכזי נתונים ומחשוב ענן: תמיכה בתקשורת שרתים יעילה והאצת עיבוד נתונים בארכיטקטורות ענן
  • קליטת וידיאו/תמונה והעברה: מועילה עבור יישומי מולטימדיה, שידור פומבי וסביבות מציאות מדומה (VR)
  • פתרונות אחסון: אפשור העברת נתונים מהירה יותר בין התקני אחסון ושרתים, ובכך שיפור ביצועי מערכת האחסון
  • מחשוב בעל ביצועים גבוהים (HPC): שיפור מהירויות העברת הנתונים וקיצור זמן השיהוי בתוך אשכולות HPC עבור משימות מחשוב וסימולציות מהירות יותר
  • התקני קצה IoT‏: אפשור איסוף והעברת נתוני זמן-אמת מחיישנים והתקנים

ככל שהביקוש לפתרונות העברת נתונים מהירים ויעילים יותר ממשיך לעלות, RDMA‏ על גבי Converged Ethernet‏ עומד למלא תפקיד מרכזי בעתיד של מחשוב בעל ביצועים גבוהים.

סיכום

הפורטפוליו הנרחב של פלטפורמות FPGA ו-SoC FPGA של iWave, בשילוב עם המומחיות הטכנית העמוקה שלה, מאפשר ללקוחות לפתח מוצרים מתקדמים-ביותר הממנפים את הפיתוחים העדכניים ביותר בבינה מלאכותית (AI), למידת מכונה ומחשוב קצה. הודות לשיתוף הפעולה עם iWave, חברות יכולות להאיץ את פיתוח המוצרים שלהן, להפחית סיכונים ולהקדים את המתחרים בנוף טכנולוגי יותר ויותר מורכב.

לפרטים נוספים או לדיון בדרישות התאמה-מיוחדת, אנא פנו אלינו ב-mktg@iwave-global.com‏

מיאון אחריות: דעות, אמונות ונקודות מבט המובעות על ידי מחברים שונים ו/או משתתפי פורום באתר אינטרנט זה לא בהכרח משקפות את הדעות, האמונות ונקודות המבט של חברת DigiKey או את המדיניות הרשמית של חברת DigiKey.

אודות כותב זה

Image of Tawfeeq Ahmad

Tawfeeq Ahmad

Tawfeeq Ahmad מוביל את שיווק המוצרים אצל .Ltd‏ .iWave Systems Technologies Pvt . עם להט לאלקטרוניקה והתעניינות בשיווק ומכירות, Tawfeeq שואף לעזור לארגונים ברחבי העולם לקצר את מחזורי הפיתוח שלהם ולשפר את היעילות בפיתוח מוצרים באמצעות מגוון המומחיות המשובצת של חברת iWave. עם תואר ראשון באלקטרוניקה ותקשורת ותואר שני במנהל עסקים בשיווק, Tawfeeq שואף להפוך את חברת iWave Systems‏ למובילה כלל-עולמית כארגון להנדסת מוצרים.