AMD KHẲNG ĐỊNH VỊ THẾ AI: ZYPHRA RA MẮT MÔ HÌNH ZAYA1 ĐƯỢC ĐÀO TẠO HOÀN TOÀN TRÊN NỀN TẢNG MI300X

Vừa qua, AMD đã công bố một bước tiến mang tính bước ngoặt, củng cố vị thế của hãng trong cuộc đua Trí tuệ Nhân tạo thế hệ mới. Công ty Zyphra đã chính thức ra mắt ZAYA1, mô hình nền tảng Mixture-of-Experts (MoE) quy mô lớn đầu tiên được đào tạo 100% bằng hệ sinh thái tăng tốc của AMD.

Thành tựu này là minh chứng rõ ràng nhất cho khả năng của nền tảng AMD trong việc xử lý các tác vụ AI phức tạp, quy mô sản xuất, vốn trước đây thường bị thống trị bởi các đối thủ khác.

ZAYA1: Sức Mạnh Từ Hệ Sinh Thái AMD

Việc đào tạo mô hình ZAYA1 được thực hiện trên một kiến trúc tích hợp chặt chẽ, bao gồm ba thành phần cốt lõi của AMD:

  1. GPU AMD Instinct™ MI300X: Cung cấp sức mạnh tính toán vượt trội.

  2. Mạng lưới AMD Pensando™: Đảm bảo khả năng kết nối và truyền dữ liệu tốc độ cao.

  3. Bộ phần mềm mở ROCm™: Cung cấp tính linh hoạt và khả năng tùy chỉnh cao.

Hiệu Suất Vượt Trội so với Đối Thủ

Kết quả kiểm tra kỹ thuật từ Zyphra cho thấy ZAYA1 không chỉ là một mô hình thử nghiệm mà là một đối thủ nặng ký trên thị trường.

  • ZAYA1-base (với tổng cộng 8.3 tỷ tham số và 760 triệu tham số hoạt động) đã vượt mặt các mô hình phổ biến như Llama-3-8B và OLMoE.

  • Mô hình này sánh ngang về hiệu suất với Qwen3-4B (Alibaba) và Gemma3-12B (Google) trong các lĩnh vực quan trọng như suy luận, toán học và viết code.

Ông Emad Barsoum, Phó Chủ tịch cấp cao của AMD, khẳng định: "Cột mốc này thể hiện sức mạnh và tính linh hoạt của GPU AMD Instinct và mạng lưới Pensando trong việc đào tạo các mô hình phức tạp, quy mô lớn."

Lợi Thế Kỹ Thuật Đưa Đến Hiệu Quả Tối Đa

Yếu tố then chốt giúp Zyphra đạt được hiệu quả vượt trội là GPU MI300X với 192 GB Bộ nhớ Băng thông Cao (HBM). Dung lượng bộ nhớ lớn này cho phép Zyphra:

  • Đơn giản hóa quy trình đào tạo: Tránh các kỹ thuật phân mảnh tensor hoặc expert (sharding) tốn kém và phức tạp, giúp cải thiện thông lượng trên toàn bộ mô hình.

  • Tăng tốc lưu trữ dữ liệu: Tối ưu hóa I/O phân tán của AMD giúp thời gian lưu mô hình (model save times) nhanh hơn hơn 10 lần, nâng cao độ tin cậy và tốc độ lặp lại trong quá trình nghiên cứu.

CEO của Zyphra, Krithik Puthalath, nhấn mạnh rằng ZAYA1 là sự phản ánh của triết lý "Hiệu quả" của công ty, cho thấy lợi ích của việc đồng thiết kế kiến trúc mô hình với nền tảng silicon và hệ thống.

AMD, Zyphra và IBM đã hợp tác chặt chẽ để thiết kế và triển khai cụm đào tạo lớn này, khẳng định cam kết chung nhằm thúc đẩy ranh giới của AI tiên tiến.

Nguồn Tổng Hợp

Bình luận

Bài viết bạn có thể quan tâm

AMD Ryzen 5 5600X: "Lão Tướng" Bất Tử Trong Kỷ Nguyên Gaming 2026

Bước sang năm 2026, thế giới phần cứng máy tính đã chứng kiến những bước nhảy vọt khổng lồ. Với sự thống trị của các dòng CPU kiến trúc Zen 5, Zen 6 và sự xuất hiện của những "quái vật" hiệu năng như Ryzen 7 9800X3D, câu hỏi về việc liệu một con chip "cổ điển" như Ryzen 5 5600X có còn chỗ đứng hay không đã trở thành chủ đề nóng hổi trên các diễn đàn công nghệ

Trùm Cuối Workstation: Uy Quyền Tuyệt Đối Cùng Ryzen 9 9950X, 9950X3D Và Radeon RX 9070 XT

Khi khối lượng công việc của bạn vượt ra khỏi mọi giới hạn thông thường và đòi hỏi một sức mạnh tính toán khổng lồ, những hệ thống PC cơ bản sẽ phải nhường bước cho "trùm cuối" Workstation. Đại diện cho đỉnh cao tuyệt đối của công nghệ chế tạo vi xử lý từ AMD, bộ đôi Ryzen 9 9950X và Ryzen 9 9950X3D sinh ra để thiết lập lại mọi tiêu chuẩn về hiệu năng cấp độ chuyên nghiệp

Đánh Giá AMD Ryzen 7 7800X3D: "Vị Vua" Gaming Vẫn Thống Trị Trong Năm 2026

Trong thế giới công nghệ phần cứng máy tính, cuộc đua về hiệu năng chưa bao giờ có dấu hiệu dừng lại. Tuy nhiên, có những sản phẩm được sinh ra để trở thành huyền thoại, định nghĩa lại hoàn toàn trải nghiệm của người dùng. Một trong số đó chính là AMD Ryzen 7 7800X3D