Các card đồ họa Intel ARC dựa trên GPU Xe-HPG Alchemist được thiết lập để ra mắt vào năm sau và dựa trên thông số kỹ thuật, chúng ta có thể xem xét các con số hiệu suất rất cạnh tranh so với GPU AMD và NVIDIA.
Các card đồ họa ARC hàng đầu của Intel với GPU Xe-HPG Alchemist để cạnh tranh cao với NVIDIA GA104 và AMD Navi 22
Các card đồ họa Intel ARC đầu tiên sẽ được trang bị GPU Alchemist dựa trên kiến trúc Xe-HPG. Intel vẫn chưa đã xác nhận Các card đồ họa rời đầu tiên sẽ được bán lẻ vào quý đầu tiên của năm 2022 và sẽ dựa trên tiến trình TSMC 6nm. Intel cũng chi tiết thông số kỹ thuật cho GPU Alchemist và các khối xây dựng cơ bản bao gồm Xe-Core.
GPU nhà giả kim Intel ARC Xe-HPG – Khối xây dựng
Để làm tròn những gì chúng ta đã học, GPU Intel Xe-HPG Alchemist có tính năng Xe-Core, là DNA cốt lõi của thế hệ đầu tiên của dòng ARC. Xe-Core là một khối số học bao gồm 16 động cơ vectơ (mỗi bộ 256 bit) và 16 ổ đĩa mảng (mỗi ổ 1024 bit). Mỗi động cơ vector bao gồm 8 ALU, tổng cộng, chúng tôi đang xem xét 128 ALU trên mỗi Xe-Core. Mỗi khối động cơ Matrix còn được gọi là khối XMX sẽ xử lý các hoạt động của bộ căng ở cả hai chế độ FP16 và INT8. Xe-Core cũng có bộ nhớ đệm L1 chuyên dụng.
Intel kết hợp bốn Xe-Core với nhau để tạo thành một chip kết xuất bao gồm 4 đơn vị dò tia, bốn đơn vị mẫu, động cơ Geometry / Rasterize / HiZ và hai khối Pixel Backend với 8 đơn vị trên mỗi khối. Các chip hiển thị này được nhóm lại với nhau để tạo thành các GPU chính. Chiếc flagship này bao gồm cấu hình màn hình 8 phân đoạn với 32 Xe-Core, 512 Động cơ Vector và 4.096 ALU. Sẽ có các cấu hình khác nhau với 2, 4, 6 phân đoạn hiển thị nhưng chúng tôi đang tập trung vào phần chính trong báo cáo này.
Intel ARC Alchemist so với GPU NVIDIA GA104 và AMD Navi 22
Tên GPU | Nhà hóa học DG-512 | Nvidia GA104 | AMD Navi 22 |
---|---|---|---|
Kỹ thuật kiến trúc | Xe- HPG | Ampe | RNA 2 |
Nút hoạt động | TSMC 6 nm | Samsung 8nm | TSMC 7 nm |
sản phẩm chính | ARC (sẽ được công bố) | GeForce RTX 3070 Ti | Radeon RX 6700 XT |
ổ điểm | số 8 | 6 | 2 |
FP32. Lõi | 32 lõi | 48 SM. Đơn vị | 40 đơn vị số học |
FP32. Đơn vị | 4096 | 6144 | 2560 |
Tài khoản FP32 | ~ 16 TFLOP | 21,7 TFLOPs | 12,4 TFLOPs |
TMU | 256 | 192 | 160 |
Cảnh sát Hoàng gia Oman | 128 | 96 | 64 |
Lõi RT | 32 RT. Đơn vị | 48 lõi RT (V2) | 40 đơn vị RA. |
màu sắc chuỗi | 512 màu XMX | 192 lõi tensor (V3) | Không có sẵn |
Tính toán tensor | ~ 131 TFLOPs FP16 ~ 262 TOPS INT8 |
87 TFLOPs FP16 174 TOPS INT8 |
25 TFLOPs FP16 50 đỉnh INT8 |
Bộ nhớ đệm L2 | Được công bố | 4 MB | 3 MB |
Bộ nhớ đệm bổ sung | Bộ nhớ đệm thông minh 16 MB? | Không có sẵn | 96MB tiền mặt vô cực |
Bus bộ nhớ | 256 bit | 256 bit | 192 bit |
Dung lượng bộ nhớ | 16 GB GDDR6 | 8 GB GDDR6X | 16 GB GDDR6 |
phóng | Quý I năm 2022 | Quý II năm 2021 | Quý I năm 2021 |
GPU Intel ARC Xe-HPG Alchemist – So với GA104 của NVIDIA và Navi 22 của AMD
Một bản tóm tắt các thông số kỹ thuật và so sánh được thực hiện bởi 3DCenter Điều này cho chúng tôi ý tưởng về hiệu suất lý thuyết mà GPU Intel mới sẽ cung cấp. Vì vậy, thật tuyệt vời, ARC Xe-HPG Alchemist hàng đầu của Intel sẽ cung cấp nhiều TMU và ROP hơn các đối thủ cạnh tranh NVIDIA và AMD. Số lõi ở mức 4.096 cao hơn Navi 22 và Navi 21 của AMD (RX 6800) nhưng thấp hơn so với GA104 của NVIDIA. NVIDIA sử dụng phương pháp đánh số FP32 kép và về mặt lý thuyết phải là 3072.
Các GPU ARC Alchemist của Intel có ít đơn vị dò tia hơn so với các đối thủ cạnh tranh, nhưng chúng ta không biết chính xác cách triển khai dò tia của chúng hoạt động như thế nào. Ví dụ: trong khi Navi 22 cung cấp nhiều lõi RT hơn so với GPU GA106 Ampere, tích hợp cấp phần cứng trong lõi RT của NVIDIA vượt trội hơn về mọi mặt so với việc triển khai của AMD. Vì vậy, hiệu suất cuối cùng sẽ phụ thuộc vào sự tích hợp Intel ở cấp độ phần cứng và tối ưu hóa ở cấp độ phần mềm cho các ứng dụng dò tia.
Một trong những yếu tố quan trọng nhất mà Intel có thể có trong cuộc cạnh tranh, đặc biệt là NVIDIA vì AMD thiếu trong bộ phận này, là sự hỗ trợ của AI với các kỹ thuật lấy mẫu ưu việt của nó. Intel đã có Trình diễn ấn tượng về công nghệ XeSS của anh ấy Và dựa trên các con số dự kiến, GPU Intel có thể hoạt động tốt hơn việc triển khai Tensor Core (DLSS) của NVIDIA với kiến trúc XMX của chúng. Intel cũng dự kiến sẽ có một bộ nhớ cache chơi game nhỏ nhưng hữu ích trên GPU của mình và nó sẽ đi kèm với dung lượng VRAM cao hơn lên đến 16GB (GDDR6) thông qua giao diện bus 256-bit. Đây sẽ là bộ nhớ gấp đôi so với RTX 3070 và RTX 3070 Ti của NVIDIA, vì vậy họ có thể phải chuẩn bị bản cập nhật để chống lại nó.
Cuối cùng, hiệu suất của phép tính FP32 trên lý thuyết được tính với tốc độ xung nhịp cao nhất dự kiến là 2 GHz. Đây là kịch bản có khả năng xảy ra nhất đối với nút quy trình TSMC 6nm do đồng hồ được đo tốt như thế nào trên nút quy trình TSMC 7nm. Dựa trên điều này, GPU Intel Xe-HPG Alchemist có thể cung cấp sức mạnh tính toán khoảng 16-17 TFLOP. Con số này thấp hơn một chút so với FLOP tạo ra GA104 từ NVIDIA nhưng cần lưu ý rằng không phải tất cả FLOP đều phải được đo lường như nhau vì kiến trúc chơi game hoạt động rất khác so với chip trung tâm dữ liệu.
Dựa trên các thông số kỹ thuật ban đầu này, chúng tôi đang xem xét một card đồ họa Intel có thể dễ dàng kết thúc nhanh hơn Radeon RX 6700 XT của AMD và RTX 3070 của NVIDIA. Để đẩy mạnh card đồ họa thế hệ đầu tiên vào phân khúc người tiêu dùng, Intel có thể sẽ đưa ra mức giá rất cạnh tranh so với những gã khổng lồ nổi tiếng như AMD và NVIDIA. Và kết hợp với một loạt các cải tiến cấp phần mềm vững chắc, họ có thể nắm chắc phần thắng trong tay và điều này sẽ chỉ được thúc đẩy với các thế hệ GPU ARC trong tương lai.
Intel ARC Alchemist so với GPU NVIDIA GA104 và AMD Navi 22
Tên GPU | Nhà hóa học DG-512 | Nvidia GA104 | AMD Navi 22 |
---|---|---|---|
Kỹ thuật kiến trúc | Xe- HPG | Ampe | RNA 2 |
Nút hoạt động | TSMC 6 nm | Samsung 8nm | TSMC 7 nm |
sản phẩm chính | ARC (sẽ được công bố) | GeForce RTX 3070 Ti | Radeon RX 6700 XT |
ổ điểm | số 8 | 6 | 2 |
FP32. Lõi | 32 lõi | 48 SM. Đơn vị | 40 đơn vị số học |
FP32. Đơn vị | 4096 | 6144 | 2560 |
Tài khoản FP32 | ~ 16 TFLOP | 21,7 TFLOPs | 12,4 TFLOPs |
TMU | 256 | 192 | 160 |
Cảnh sát Hoàng gia Oman | 128 | 96 | 64 |
Lõi RT | 32 RT. Đơn vị | 48 lõi RT (V2) | 40 đơn vị RA. |
màu sắc chuỗi | 512 màu XMX | 192 lõi tensor (V3) | Không có sẵn |
Tính toán tensor | ~ 131 TFLOPs FP16 ~ 262 TOPS INT8 |
87 TFLOPs FP16 174 TOPS INT8 |
25 TFLOPs FP16 50 đỉnh INT8 |
Bộ nhớ đệm L2 | Được công bố | 4 MB | 3 MB |
Bộ nhớ đệm bổ sung | Bộ nhớ đệm thông minh 16 MB? | Không có sẵn | 96MB tiền mặt vô cực |
Bus bộ nhớ | 256 bit | 256 bit | 192 bit |
Dung lượng bộ nhớ | 16 GB GDDR6 | 8 GB GDDR6X | 16 GB GDDR6 |
phóng | Quý I năm 2022 | Quý II năm 2021 | Quý I năm 2021 |