AWS ra mắt chip Trainium3: Tăng tốc độ AI gấp 4 lần và tiết kiệm năng lượng 40%

Mây Trắng

Intern Writer
Amazon Web Services (AWS) vừa giới thiệu phiên bản chip đào tạo AI mới mang tên Trainium3, với nhiều thông số kỹ thuật ấn tượng. Sự kiện này được công bố tại hội nghị AWS re:Invent 2025, nơi AWS cũng đã hé lộ về sản phẩm tiếp theo trong lộ trình đào tạo AI của mình: Trainium4, hiện đang trong quá trình phát triển và sẽ tương thích với các chip của Nvidia.

Tại hội nghị công nghệ thường niên, AWS đã chính thức ra mắt hệ thống Trainium3 UltraServer, được trang bị chip Trainium3 tiên tiến với kích thước chỉ 3 nanomet và công nghệ mạng tự phát triển. Như mong đợi, chip thế hệ thứ ba này mang lại hiệu suất vượt trội cho việc đào tạo và suy diễn AI so với thế hệ trước đó.

Theo AWS, hệ thống này nhanh hơn gấp 4 lần và có bộ nhớ gấp 4 lần, không chỉ cho việc đào tạo mà còn cho việc cung cấp ứng dụng AI trong thời điểm cao điểm. Hơn nữa, hàng nghìn UltraServers có thể được kết nối với nhau, cung cấp cho một ứng dụng lên đến 1 triệu chip Trainium3, gấp 10 lần so với thế hệ trước. Mỗi UltraServer có thể chứa 144 chip.
1764749986796.png

Điều quan trọng hơn, AWS cho biết các chip và hệ thống này cũng tiết kiệm năng lượng hơn 40% so với thế hệ trước. Trong khi thế giới đang chạy đua xây dựng các trung tâm dữ liệu lớn hơn với lượng điện tiêu thụ khổng lồ, AWS đang cố gắng phát triển các hệ thống tiêu thụ ít năng lượng hơn. Điều này không chỉ có lợi cho AWS mà còn giúp khách hàng của họ tiết kiệm chi phí.

Nhiều khách hàng của AWS như Anthropic (mà Amazon cũng là nhà đầu tư), LLM Karakuri của Nhật Bản, SplashMusic và Decart đã sử dụng chip và hệ thống thế hệ thứ ba này và giảm đáng kể chi phí suy diễn.

AWS cũng đã trình bày một chút về lộ trình cho chip tiếp theo, Trainium4, hứa hẹn sẽ mang lại bước tiến lớn về hiệu suất và hỗ trợ công nghệ kết nối chip tốc độ cao NVLink Fusion của Nvidia. Điều này có nghĩa là các hệ thống sử dụng Trainium4 sẽ có khả năng tương tác và mở rộng hiệu suất với các GPU của Nvidia, trong khi vẫn sử dụng công nghệ giá đỡ máy chủ tự phát triển của Amazon.

Cũng cần lưu ý rằng, kiến trúc CUDA (Compute Unified Device Architecture) của Nvidia đã trở thành tiêu chuẩn de facto mà tất cả các ứng dụng AI lớn đều được xây dựng để hỗ trợ. Các hệ thống sử dụng Trainium4 có thể giúp thu hút các ứng dụng AI lớn được thiết kế cho GPU của Nvidia đến với đám mây của Amazon.

Hiện tại, Amazon chưa công bố thời gian ra mắt Trainium4. Nếu công ty tuân theo các thời gian phát hành trước đó, chúng ta có thể sẽ nghe thêm thông tin về Trainium4 tại hội nghị năm sau.

Nguồn: Techcrunch
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back