
งาน Open Compute Project (OCP) Global Summit 2025, Meta ได้เผยโฉมมาตรฐานใหม่ของ Open Rack for AI ซึ่งใช้รูปแบบ Open Rack Wide (ORW) ที่ออกแบบมาเพื่อรองรับศูนย์ข้อมูลยุค AI ขนาดใหญ่โดยเฉพาะ ถือเป็นอีกก้าวสำคัญของนวัตกรรมด้านโครงสร้างพื้นฐานแบบเปิด (open infrastructure)
AMD เข้าร่วมขบวนการนี้ด้วยการเปิดตัว “Helios” — ระบบอ้างอิง (reference system) ระดับ rack ที่ล้ำหน้าที่สุดของบริษัท ซึ่งสร้างขึ้นบนมาตรฐานเปิดของ ORW เต็มรูปแบบ เพื่อขยายแนวคิด “ความเปิดกว้าง” ของ AMD จากระดับชิป ไปจนถึงระบบขนาดศูนย์ข้อมูลครบวงจร
Helios: เปลี่ยนมาตรฐานเปิดให้กลายเป็นความจริงในระดับ Rack
“Helios” ได้รับการออกแบบตามสเปก ORW ที่ Meta เสนอไว้ในงาน OCP 2025 โดยใช้หน่วยประมวลผลกราฟิก AMD Instinct™ MI450 Series GPUs รุ่นใหม่ ที่ขับเคลื่อนด้วยสถาปัตยกรรม CDNA™
GPU แต่ละตัวมาพร้อมหน่วยความจำ HBM4 ขนาด 432 GB และแบนด์วิธหน่วยความจำสูงสุด 19.6 TB/s ซึ่งถือเป็นหนึ่งในระดับที่เร็วที่สุดในอุตสาหกรรม
เมื่อทำงานร่วมกันในระดับ rack ระบบ Helios ที่ติดตั้ง GPU จำนวน 72 ตัว สามารถให้ประสิทธิภาพสูงสุดถึง 1.4 exaFLOPS (FP8) และ 2.9 exaFLOPS (FP4) พร้อมหน่วยความจำรวม 31 TB และแบนด์วิธรวมกว่า 1.4 PB/s ซึ่งเพียงพอสำหรับการเทรนโมเดล AI ที่มีพารามิเตอร์ระดับ “ล้านล้านตัว” (trillion-parameter scale) ได้อย่างมีประสิทธิภาพ เมื่อเทียบกับรุ่นก่อน Helios ให้ประสิทธิภาพสูงขึ้นถึง 36 เท่า และมีหน่วยความจำมากกว่า 50% เมื่อเทียบกับระบบ NVIDIA Vera Rubin ตามข้อมูลจากห้องทดสอบของ AMD
การเชื่อมต่อและระบบเปิดเพื่อศูนย์ข้อมูลยุคใหม่
Helios รองรับการเชื่อมต่อความเร็วสูงทั้งแนวตั้ง (scale-up) และแนวนอน (scale-out) ด้วยแบนด์วิธภายในสูงสุด 260 TB/s แบนด์วิธ Ethernet สำหรับการเชื่อมต่อระหว่าง racks สูงสุด 43 TB/s ทั้งหมดนี้ทำงานบนมาตรฐานเปิดที่สอดคล้องกับเทคโนโลยีจากโครงการอย่าง OCP, UALink™ (Ultra Accelerator Link) และ Ultra Ethernet Consortium (UEC) เพื่อให้เกิดการทำงานร่วมกันได้อย่างราบรื่นในระดับอุตสาหกรรม
พัฒนาเพื่อโลกของศูนย์ข้อมูลยุค AI
ศูนย์ข้อมูลที่รองรับ AI ในยุคใหม่ต้องเผชิญความท้าทายทั้งด้านประสิทธิภาพ ความหนาแน่นของพลังประมวลผล และการระบายความร้อน
Helios ถูกออกแบบมาเพื่อรับมือสิ่งเหล่านี้ด้วยแนวคิดใหม่ เช่น
- แบนด์วิธสูงกว่าเดิมหลายเท่า สำหรับการเทรนและ inference
- ดีไซน์ rack แบบ double-wide ที่เพิ่มความสะดวกในการบำรุงรักษา
- การเชื่อมต่อ Ethernet แบบ multipath เพื่อความทนทาน
- ระบบระบายความร้อนด้วยของเหลวแบบ quick-disconnect ที่ให้ประสิทธิภาพสูงในความหนาแน่นระดับ exascale
ด้วยนวัตกรรมเหล่านี้ Helios พร้อมสำหรับการใช้งานจริงในระดับ production สำหรับองค์กรที่ต้องการระบบ AI ขนาดใหญ่ที่ยั่งยืนและประหยัดพลังงาน
สร้างระบบนิเวศเปิดร่วมกับพันธมิตรทั่วโลก
Helios ไม่ใช่แค่ฮาร์ดแวร์อ้างอิง แต่เป็น “พิมพ์เขียวแห่งความร่วมมือ” สำหรับอุตสาหกรรม AI ทั้งระบบนิเวศ ผู้ผลิต OEM และ ODM สามารถ:
- นำดีไซน์ของ Helios ไปต่อยอดและลดเวลาเข้าสู่ตลาด
- ผสานเทคโนโลยี AMD Instinct™ GPUs, EPYC™ CPUs, และ Pensando™ DPUs เข้ากับโซลูชันของตน
- เข้าร่วมระบบนิเวศแบบเปิดที่เน้นความเข้ากันได้และนวัตกรรมระยะยาว
ผลลัพธ์คืออุตสาหกรรมจะได้โครงสร้างพื้นฐาน AI ที่เปิดกว้าง ยืดหยุ่น และลดการพึ่งพาเทคโนโลยีเฉพาะเจ้า
กำหนดการสู่ปี 2026
AMD จะเริ่มเปิดให้พันธมิตร OEM และ ODM เข้าถึง Helios ในรูปแบบ reference design ภายในปลายปี 2025 โดยคาดว่าจะเริ่มใช้งานจริงในระดับศูนย์ข้อมูลเชิงพาณิชย์ ภายในปี 2026
Helios จึงไม่เพียงแต่สะท้อนถึง ความมุ่งมั่นของ AMD ต่อแนวคิด open innovation เท่านั้น
แต่ยังเป็นหลักฐานสำคัญว่า “เมื่ออุตสาหกรรมสร้างร่วมกัน — ทุกฝ่ายก็เร่งก้าวหน้าไปด้วยกัน”


COMMENTS