Tất tật những điểm mới trong thiết kế GPU Mali-G72 của ARM

    Nguyễn Hải,  

    Mặc dù vẫn dùng chung kiến trúc Bifrost như người tiền nhiệm Mali-G71, Mali-G72 lại có hàng trăm các tinh chỉnh nhỏ giúp cải thiện đáng kể về hiệu suất và năng lượng.

    Đồng thời với việc tiết lộ công nghệ CPU mới nhất, ARM cũng giới thiệu bộ xử lý đồ họa thế hệ tiếp theo của họ - Mali-G72 - và có lẽ không lâu nữa chúng ta sẽ được chứng kiến nó xuất hiện trên những chiếc smartphone trong tương lai. Nhìn vào cách đặt tên của ARM, không khó để nhận ra đây chính là người kế nhiệm cho thiết kế GPU cao cấp hiện tại của công ty, Mali-G71 và nó cũng dựa trên kiến trúc Bifrost.

    Mali-G72 hứa hẹn cải thiện 25% về hiệu quả năng lượng và tiết kiệm 20% về mật độ hiệu suất, khi sử dụng cùng điểm nút xử lý như thiết kế của G71. Về mặt hiệu suất, các nhà thiết kế SoC sẽ sử dụng 25% năng lượng tiết kiệm được theo hướng gia tăng hiệu năng trong khi vẫn giữ nguyên mức tiêu thụ năng lượng như trước.

    Các thước đo khác lại phụ thuộc nhiều vào trường hợp sử dụng, khi ARM tuyên bố rằng Mali-G72 sẽ mang tới cải thiện đến 17% đối với GEMM (general matrix multiplication: khuếch đại ma trận tổng hợp) và các cải tiến khác, ví dụ như thay đổi với kích thước bộ nhớ và các tập lệnh mới, để có thể gia tăng khả năng xử lý trong những tình huống cụ thể.

    Khi kết hợp với các chip có số lõi nhiều hơn trong tương lai, khả năng xử lý có thể còn hiệu quả hơn nữa cùng với hàng loạt các cải thiện về vi kiến trúc. Do vậy, ARM cho rằng các thiết bị sử dụng Mali-G72 trong tương lai có thể cải thiện khả năng xử lý đồ họa lên tới 40% so với các thiết bị điển hình trong năm 2017. Mặc dù con số thực tế có thể có đôi chút khác biệt với giá trị này.

    Các cải thiện về thiết kế

    Không giống như các lõi CPU mới nhất của ARM, Mali-G72 giống một bản tinh chỉnh bổ sung hơn là một bước chuyển đổi lớn về công nghệ đồ họa như cách ARM đang tuyên bố. GPU mới này đã chứng kiến hàng trăm các tinh chỉnh vi kiến trúc nhỏ hơn, giúp tăng thêm một số cải tiến nổi bật về thiết kế.

    Đầu tiên, kích thước bộ nhớ đệm (tile buffer) đã được gia tăng, giúp con chip có thể tăng cường hiệu suất thêm 40% trong những trường hợp sử dụng nhất định. ARM cũng đã cân bằng lại các ống dẫn thực thi để phù hợp hơn với trường hợp có nhiều ứng dụng cùng sử dụng, bao gồm cả việc tối ưu cho các tập lệnh FMA và ADD.

    Việc ARM gia tăng kích thước bộ nhớ đệm (tile buffer) là một thay đổi quan trọng với GPU, khi nó cho phép tiết kiệm được bộ nhớ bên trong các lõi riêng lẻ. Cùng với các tối ưu khác cho các lõi riêng lẻ, thay đổi này đã cho phép ARM thu nhỏ kích thước các lõi của Mali-G72, khi so với G71 trên cùng điểm nút xử lý. Vì vậy, với một sự gia tăng nhỏ cho kích thước miếng đệm, các nhà thiết kế SoC giờ có thể bổ sung thêm các lõi riêng biệt vào cùng một khuôn chip với G72.

    Mali-G72 cũng gia tăng kích thước bộ nhớ đệm cache L1, và tăng gấp đôi thông lượng cho các hoạt động phức tạp. Ví dụ, thuật toán khai căn bình phương nghịch đảo thông thường (inverse square root) được tối ưu để nó có thể hoàn thành chỉ trong một chu kỳ duy nhất. ARM cũng bổ sung thêm một số tập lệnh GPU nội bộ để giảm bớt những nút thắt cổ chai phổ biến mà công ty phát hiện ra, và điều này sẽ được xử lý bởi một bộ driver đã nâng cấp cho G72.

    Điều này có nghĩa là các nhà sản xuất có thể tăng cường hiệu suất với cùng chi phí cho một silicon, khi họ tăng thêm số lõi. Hoặc họ cũng có thể đưa những con chip nhiều lõi trước đây xuống được các thiết bị có chi phí thấp khi tiết kiệm chi phí silicon.

    Với G71 thế hệ mới nhất, ARM hướng đến việc tạo ra tấm nền silicon có từ 16 đến 20 lõi để có hiệu suất cao và hiệu quả năng lượng, nhưng giờ họ tin rằng kiến trúc Bifrost có thể hỗ trợ tối đa đến 32 lõi. Để xác nhận điều này, cả Mali-G71 và Mali-G72 đều hỗ trợ đến 32 lõi, nhưng hiệu suất, hiệu quả năng lượng và chi phí sẽ giảm đi khi số lõi tăng lên. Mali-G72 được thiết kế một phần để gia tăng giới hạn này cho phép các nhà sản xuất tăng cường hiệu năng xử lý mà không phải lo ngại về năng lượng tiêu thụ và chi phí.

    Tăng cường khả năng hiển thị với kiến trúc Mali-Cetus

    Đầu tháng này, ARM cũng thông báo về kiến trúc hiển thị Cetus mới của họ, có thể kết hợp với ARM Mali hay các GPU từ những nhà cung cấp khác để giảm tải các tác vụ hiển thị thông thường. Cho dù nó không phải bắt buộc đi cùng với các GPU Mali của ARM, Cetus vẫn mang lại cho các nhà phát triển một số tính năng hữu ích và thậm chí khả năng cải thiện hiệu năng rất đáng kể.

    Đầu tiên, Cetus là giải pháp hiển thị HDR đầu tiên của ARM, có thể hỗ trợ cho các công nghệ hiển thị di động mới nhất. Công nghệ này có thể biểu diễn màu sắc với độ chính xác đến 12-bit và sẽ hỗ trợ các chuẩn tương phản động mở rộng (high dynamic range) mở, ví dụ như HDR10, và một số định dạng độc quyền cũng có thể được hỗ trợ trong tương lai.

    Cetus cũng có thể được tích hợp dễ dàng với công nghệ ARM Assertive Display, có khả năng điều chỉnh độ sáng hiển thị và màu sắc phu thuộc vào các điều kiện ánh sáng, để tận dụng tối đa các nội dung HDR ngay cả trong khi đang xem ở trong các tình huống kém lý tưởng hơn. Khả năng hỗ trợ HDR kết hợp tốt với các tối ưu của Cetus để hiển thị 4K, 2K với các tần số 90/120Hz, một đặc tính có thể trở nên phổ biến hơn trong tương lai do đáp ứng nhu cầu của các ứng dụng thực tế ảo.

    Về các tối ưu cho 4K, Cetus còn có thể xử lý các hình ảnh 4K với mức tiêu thụ điện năng thấp nhờ khả năng xử lý song song. Một hình ảnh 4K được chia thành hai nửa, với mỗi bên phải trái được xử lý song song thông qua các bước Xử lý Lớp (Layer Processing), Sắp xếp bố cục (Composition) và Đơn vị Hiển thị đầu ra (Display Output Units).

    Bằng cách thực hiện hai khối lượng công việc song song, năng lượng có thể được giữ trong giới hạn nghiêm ngặt của bộ xử lý trong di động.

    Về mặt hiệu năng, việc sử dụng một DPU chuyên dụng có thể giúp giảm tải một số tác vụ cho GPU, ví dụ sắp xếp hiển thị đa màn hình. Cetus cũng có thể sử dụng định dạng nén hình ảnh lossless Frame Buffer Compression do ARM tự phát triển, giúp giảm việc sử dụng bộ nhớ trên các ống dẫn đồ họa.

    Nói cách khác, sử dụng Cetus kết hợp với một GPU Mali có thể tăng cường hiệu năng bằng cách sử dụng kỹ thuật nén qua nhiều thành phần này, mà không cần có một bộ phận chuyển đổi. Điều này đặc biệt hữu dụng khi các bộ phận xử lý việc hiển thị có thể tiêu tốn đến 60% băng thông bộ nhớ của chip SoC và các màn hình có độ phân giải cao hơn sẽ còn đòi hỏi nhiều bộ nhớ hệ thống hơn nữa.

    Cuối cùng, Cetus cũng có thể được sử dụng như một bộ điều khiển nhúng để giao tiếp với các tấm panel có tốc độ refresh khác nhau. Công nghệ này đã xuất hiện trong vài năm gần đây trên những TV màn hình lớn và các tấm panel cho monitor và giờ nó đang nhắm đến sân chơi di động.

    Công nghệ này sẽ lưu lại ít nhất một khung hình phía trước tấm panel để làm mượt bất kỳ quãng dừng nào giữa các khung hình và cũng có thể kết nối trực tiếp với tốc độ khung hình GPU để giảm hiện tượng tụt tốc độ khung hình và bóng mờ trong khi chơi game.

    Tổng kết

    Tóm lại, Mali-G72 là một phiên bản tinh chỉnh cho kiến trúc Bifrost của ARM. GPU mới này nổi bật với hàng trăm các tinh chỉnh nhỏ giúp bổ sung các cải thiện đáng kể về hiệu năng. Nhưng có lẽ điều quan trọng hơn cả là thiết kế này giúp thu gọn kích thước chip và tiết kiệm điện năng hơn so với trước đây.

    Điều này mở đường cho các nhà thiết kế SoC gia tăng số lõi GPU mà không phải tăng thêm chi phí cho tấm silicon hay ảnh hưởng tới khả năng tiêu thụ năng lượng của thiết bị. Vì vậy, gần như chắc chắn chúng ta sẽ thấy các GPU mạnh mẽ hơn trong chip SoC vào năm tới. Còn nếu muốn được trải nghiệm chúng trên các thiết bị mới, có lẽ chúng ta sẽ phải đợi đến đầu năm 2018.

    Tin cùng chuyên mục
    Xem theo ngày

    NỔI BẬT TRANG CHỦ