SoC là con chip khá nhỏ nằm trên bo mạch của smartphone và vì GPUnằm bên trong SoC nên chúng ta không thể nhìn thấy GPU. Tất nhiên nếubạn cố tình thì vẫn có thể tìm được vị trí của GPU bằng cách mổ tung SoCra để tìm hiểu các thành phần bên trong nó.


GPU là phần "xử lý đồ họa 2D/3D" (2D/3D graphics processor) trong SoC Tegra 2
Trên máy tính để bàn hoặc xách tay, GPU và CPU được tích hợp trên haikhu vực riêng biệt trên bo mạch. Nhưng trên smartphone, hai chip xử lýnày được đặt cùng nhau bên trong SoC. Có ba lý do để làm như vậy: đầutiên là vì smartphone và máy tính bảng không có nhiều khoảng trống bêntrong nên các thành phần cơ bản phải đóng gói cùng nhau để bo mạch củathiết bị có kích thước nhỏ nhất có thể và dành diện tích để cải thiệndung lượng pin. Hai là việc tích hợp GPU và CPU giúp làm giảm chi phísản xuất do chỉ phải sản xuất một con chip thay vì làm hai con chipriêng. Cuối cùng là việc tích hợp chặt chẽ CPU và GPU vào một nơi còn cótác dụng làm giảm tiêu thụ điện và nhiệt độ phát ra.
GPU dùng để làm gì?
Công dụng của GPU lệ thuộc vào nhiều yếu tố: kiến trúc của SoC và cả hệđiều hành được sử dụng trên thiết bị. Trước đây, SoC thường không cóchip xử lý hình ảnh riêng nên GPU được dùng để xử lý các hình ảnh videođộ nét cao.
Trên các hệ điều hành, GPU được dùng để xử lý cácgame và ứng dụng 3D. CPU không được thiết kế để xử lý những tác vụ đónên trong tất cả các hệ điều hành, GPU gánh trách nhiệm này. CPU cũng hỗtrợ trong việc tính toán (nhất là với các game 3D) nhưng người thực thichính là chip đồ họa.
Hầu hết chip đồ họa còn hỗ trợ cả xử lýhình ảnh 2D ở một số chức năng như phóng to thu nhỏ hình ảnh và xử lý đồhọa máy tính (animation). CPU cũng thường xử lý những tác vụ này do đótùy vào hệ điều hành của thiết bị mà GPU có tham gia vào xử lý hình ảnh2D hay không.
Chơi game Asphalt 6 trên Galaxy Note rất khó khăn vì không có GPU mạnh
Windows Phone thường chứa nhiều yếu tố đồ họa nặng trong khi các SoCđược dùng trong các điện thoại Windows Phone có cấu hình yếu không đủkhả năng xử lý mượt mà nếu chỉ dựa vào CPU. Vì vậy, GPU đóng vai trò lớntrong việc xử lý giao diện đồ họa, mang lại cho người dùng trải nghiệmrất mượt.
Android là câu chuyện khác. Trong thời kỳ đầu, cácthiết bị thấp cấp chạy Android không có GPU mạnh bên trong nên nó khôngtham gia vào xử lý hình ảnh 2D. Google đã quyết định như vậy để Androidcó sự tương thích tốt hơn với nhiều loại thiết bị nhưng đổi lại, khảnăng xử lý đồ họa của nhiều điện thoại Android kém hẳn. Điều này đã đượcchỉnh sửa trong phiên bản Android 4.0 bởi vì các SoC hiện nay đều cóGPU mạnh. Vì vậy, Google cho phép các thiết bị chạy phiên bản Androidmới nhất xử lý các yếu tố giao diện bằng GPU.
iOS trên iPhone vàiPod Touch hoạt động rất mượt bởi nó xử lý hầu hết các yếu tố giao diệnbằng GPU. So với Android, Apple có lợi thế là chỉ phải làm việc với mộtsố ít lựa chọn phần cứng nên họ có thể tích hợp hệ điều hành iOS vớiphần cứng chặt chẽ hơn, do đó giảm thiểu được các vấn đề cần tăng GPU đểđạt hiệu quả.
GPU Adreno của Qualcomm
Bộ vi xử lý đồ họa Adreno là chip đồ họa độc quyền được sử dụng trongcác SoC của Qualcomm. Các GPU Adreno từng được gọi là Imageon và đượcsản xuất bởi ATI (đơn vị con của hãng bán dẫn AMD) đến khi Qualcomm mualại và đổi tên thành Adreno. Các dòng Adreno 1xx cũ được sử dụng trongcác SoC Qualcomm 7xxx, còn dòng Adreno 2xx mới hơn được tích hợp trongcác dòng SoC Snapdragon.
Trong dòng SoC Snapdragon hiện nay, bạncó thể thấy 3 dòng GPU Adreno được sử dụng: Adreno 200 (tích hợp trongSnapdragon S1), Adreno 205 (Snapdragon S2) và Adreno 220 (SnapdragonS3). Nhìn vào logic trên bạn có thể dễ dàng đoán được các dòng có sốcàng lớn thì GPU càng mạnh. Qualcomm cho rằng mỗi GPU đời mới có tốc độnhanh gấp hai lần đời trước đó, nghĩa là Adreno 220 nhanh hơn gấp 4 lầnso với Adreno 200.
Hiệu năng xử lý của các dòng Adreno
Các GPU Adreno tích hợp trong Snapdragon S3 hỗ trợ cả OpenGL ES 2.0 và1.1 cùng với Direct3D 9.3; các GPU Adreno trước đó, gồm Adreno 205, hỗtrợ SVG và Adobe Flash. Đó là những API (giao diện lập trình ứng dụng)cần để đảm bảo các game di động hiện đại hoạt động trên smartphone tíchhợp GPU Adreno. Hiện nay, rất hiếm game thực sự dùng nền tảng mới OpenGLES 3.0 hoặc Direct3D 11.
Trong tương lai, Qualcomm đã tiết lộGPU Adreno 225 sẽ xuất hiện đầu tiên trong SoC Snapdragon S4, nền tảngSoC sử dụng bộ vi xử lý Krait mới của hãng này. Qualcomm cho rằng GPUAdreno 225 sẽ có tốc độ nhanh hơn Adreno 220 khoảng 50% và sánh ngangvới bộ vi xử lý đồ họa PowerVR SGX543MP2 (có trong Apple A5), với khảnăng thực hiện 19,2 tỷ phép tính mỗi giây (GFLOPS) ở tốc độ xung nhịp300 MHz.
GPU PowerVR của Imagination Technologies
Hãng chip đồ họa lớn thứ hai là Imagination Technologies, nhà sản xuấtGPU PowerVR cho di động. Có rất nhiều dòng GPU PowerVR GPU nhưng cácthiết bị hiện nay thường sử dụng các dòng PowerVR SGX 5 hoặc 5XT.
Các GPU PowerVR được bán cho các nhà sản xuất SoC nên chúng xuất hiệntrong nhiều loại thiết bị. Các SoC OMAP của Texas Instruments (TI) chỉsử dụng GPU PowerVR và bạn cũng có thể thấy chúng trong một số SoCExynos của Samsung và Apple A4 hoặc A5. GPU PowerVR còn được tích hợptrong các vi xử lý x86 của Intel được sử dụng trong các laptop cấp thấp.
Dòng PowerVR SGX 5 chứa nhiều loại GPU nhưng chỉ có một vài loại đượcsử dụng phổ biến. PowerVR SGX530 được dùng trong OMAP 3 của TI và có thểthấy trong một số smartphone lõi đơn như Motorola Droid và Nokia N9.Với tốc độ xung nhịp 200 MHz, PowerVR SGX530 có khả năng xử lý 1,6GFLOPS. PoweVR SGX535 (được dùng trong iPhone 3GS và iPhone 4) có kíchcỡ nhỏ hơn PowerVR SGX530 và hỗ trợ DirectX 9.0c (PowerVR 530 không hỗtrợ) nhưng tốc độ xử lý vẫn tương tự.
Hình ảnh kiến trúc dòng PowerVR SGX 5XT
GPU nổi tiếng nhất của dòng 5 là PowerVR SGX540 được sử dụng trong SoCExynos tên mã Hummingbird của Samsung (tích hợp bên trong điện thoạiGalaxy S) cùng với các dòng OMAP 4 của TI. Nó có hỗ trợ DirectX10 và cókhả năng thực hiện 3,6 GFLOPS ở xung nhịp 200 MHz, gấp đôi so vớiPowerVR SGX530. Không như PowerVR SGX530, PowerVR SGX540 có thể ép xunglên 400 MHz và do đó trên lý thuyết thì GPU này có thể đạt khả năng thựchiện tới 7,2 GFLOPS.
Một số người có thể băn khoăn tại saoSGX540 xuất hiện trong SoC Hummingbird đời cũ (dùng trong Galaxy S)nhưng cũng xuất hiện trong các SoC hai lõi OMAP 4460 được sử dụng trongGalaxy Nexus. Lý do là tốc độ xung nhịp giữa hai SoC này khác nhau:Hummingbird sử dụng trong Galaxy S có tốc độ xung nhịp 200 MHz (khả năngthực hiện 3,2 GFLOPS), trong khi OMAP 4430 sử dụng trong Droid Razr cótốc độ 304 MHz ( tương đương 4,8 GFLOPS) và OMAP 4460 có tốc độ 384 MHz(tương đương 6,1 GFLOPS).
Dòng 5XT chưa xuất hiện trong nhiềuthiết bị, mới chỉ được tích hợp trong SoC Apple A5 được dùng trong iPad2, iPhone 4S và PlayStation Vita. Nếu dòng 5 chỉ có GPU lõi đơn, dòng5XT hỗ trợ tới 16 lõi, mỗi lõi có tốc độ gấp hai lần SGX540. Các GPUtrong dòng 5XT sử dụng hậu tố MPx, trong đó "x" chỉ số lõi: ví dụSGX543MP2 sử dụng trong Apple A5 có hai lõi.
SGX543 hiện là chipduy nhất được tích hợp trong các SoC, còn SGX544 dự kiến sẽ được đưavào dòng OMAP 5 của TI. SGX543 có khả năng thực hiện 6,4 GFLOPS mỗi lõi ởxung nhịp 200 MHz, nghĩa là ở mức 200 MHz, SGX543MP2 trong Apple A5 cókhả năng thực hiện 12,8 GFLOPS.
Chúng tôi đoán sẽ không nhiềunhà sản xuất sử dụng quá hai lõi trong SGX543 vì tăng số lõi của GPU sẽngốn điện nhiều hơn. Tuy nhiên, Sony là ngoại lệ vì hãng này đã quyếtđịnh sử dụng SGX543MP4+ bốn lõi trong PlayStation Vita. Với tốc độ xungnhịp 200 MHz, GPU của PlayStation Vita có khả năng thực hiện tới 25,6GFLOPS, tăng lên xung nhịp 300 MHz thì GPU của nó có khả năng thực hiệntới 38,4 GFLOPS. Tương tự Apple, Sony không công bố tốc độ xung nhịp củaGPU.
PowerVR SGX543MP16 (16 lõi) hoạt động ở xung nhịp 400 MHzsẽ có khả năng thực hiện tới 204,8 GFLOPS (204 tỷ phép tính mỗi giây).Đó là con số rất lớn và chắc chắn sẽ ngốn rất nhiều điện nhưng đến naychưa có GPU 16 lõi nào được tích hợp trong smartphone bán ra thị trường.
GPU Mali của ARM
Phạm vi ứng dụng của GPU Mali hiện khá hẹp bởi nó hiện chỉ được dùngtrong một loại SoC: Samsung Exynos 4210 có trong Samsung Galaxy S II,Galaxy Note và Galaxy Tab 7.7. GPU Mali là sản phẩm của ARM, do đó nó làsản phẩm lý tưởng để tích hợp với các bộ vi xử lý Cortex được dùngtrong Exynos.
Mặc dù trên lý thuyết có nhiều GPU Mali nhưng thựctế chỉ có một loại được dùng là Mali-400 MP4 bốn lõi được tích hợptrong SoC Exynos 4210. Tuy ARM nói rằng Mali-400 MP4 có bốn lõi nhưng nókhông thực sự là bốn lõi xử lý giống như PowerVR SGX543MP4 mà đơn giảnlà bốn bộ vi xử lý đổ bóng điểm (pixel shader processor) được đặt cạnhnhau. Đó là lý do tại sao Mali-400 MP4 không có khả năng đồ họa mạnh nhưGPU PowerVR bốn lõi thực sự.
Kiến trúc bên trong GPU Mali của ARM
Hiệu năng của Mali-400 MP4 có khả năng thực hiện 7,2 GFLOPS ở xung nhịp200 MHz, nghĩa là nhanh hơn PowerVR SGX543 lõi đơn. Tốc độ xung nhịpđược sử dụng trong Exynos 4210 là 275 MHz, nghĩa là GPU này có khả năngthực hiện 9,9 GFLOPS và là GPU nhanh nhất hiện nay trong các smartphoneAndroid.
GPU Mali-400 MP4 trong Galaxy S II nhanh gấp hai lầnGPU PowerVR SGX540 trong Droid Razr và nhanh hơn gần 75% so với GPU đượcdùng trong Galaxy Nexus. Ngược lại, GPU PowerVR SGX543MP2 trong iPhone4S có khả năng xử lý nhanh gấp hai lần GPU Mali-400 MP4.
Samsungđã tuyên bố sẽ tiếp tục sử dụng GPU Mali trong các SoC Exynos 5xxx thếhệ mới. Theo Samsung, GPU trong chip Exynos thế hệ mới sẽ có tốc độnhanh gấp bốn lần so với GPU trong Exynos 4210.
GPU ULP GeForce của Nvidia
Mặc dù là nhà sản xuất card đồ họa khổng lồ trong lĩnh vực máy tínhnhưng GPU của Nvidia tích hợp trong các SoC cho smartphone của họ khôngthực sự ấn tượng. Trong thực tế, ULP GeForce trong Tegra là GPU chậm hơncác đối thủ cạnh tranh.
ULP GeForce được dùng trong hai SoCTegra 2: Tegra 250 AP20H (dùng cho smartphone) và Tegra 250 T20 (dùngcho máy tính bảng). ULP GeForce có khả năng thực hiện 4,8 GFLOPS ở xungnhịp 300 MHz với SoC Tegra 250 AP20H và 5,33 GFLOPS ở xung nhịp 320 MHzvới SoC Tegra 250 T20.
Hình ảnh 5 lõi chip của Tegra 3, GPU ẩn bên trong chip xử lý
Như vậy, số đơn vị GFLOPS của Tegra 2 trong smartphone bằng với PowerVRSGX540 ở xung nhịp 300 MHz. Tuy nhiên, tốc độ xung nhịp tối đa củaPowerVR SGX540 trong thiết Galaxy Nexus là 384 MHz, nghĩa là có khả năngthực hiện tới 6,1 GFLOPS. Con số này nhanh hơn cả GPU của Tegra 2 dùngcho máy tính bảng (333 MHz), biến Tegra 2 trở thành GPU có khả năng xửlý thấp nhất.
Tất nhiên, nhận định trên chỉ thuần túy dựa trênthông số và trên thực tế có nhiều yếu tố ảnh hưởng đến hiệu năng của GPUnhư tốc độ xung nhịp của CPU và kích cỡ màn hình.
Trong xuhướng chuyển sang nền tảng xử lý đa lõi, Nvidia là hãng đầu tiên ra mắtthị trường bộ vi xử lý Tegra 3 bốn lõi. Tuy nhiên, chip xử lý đồ họatích hợp trong Tegra 3 có cải thiện khả năng xử lý không được như kỳvọng.
Chip xử lý đồ họa Kal-El GeForce của Tegra 3 có khả năngthực hiện 4,8 GFLOPS ở tốc độ xung nhịp 200 MHz, như vậy bạn có thể thấyngay là nó thấp hơn Mali-400 MP4 và PowerVR SGX543MP2. NVIDIA khôngtiết lộ tốc độ xung nhịp của GPU dùng trong Tegra 3 (tích hợp trong ASUSTransformer Prime) nhưng chắc hẳn tốc độ đó lớn hơn trong Tegra 2. Giảsử nó chạy ở tốc độ xung nhịp 400 MHz, GPU của Tegra 3 chỉ có khả năngthực hiện 9,6 GFLOPS, vẫn thấp hơn Mali-400 MP4.
So sánh các GPU dùng trên smartphone
Dưới đây là bảng so sánh tốc độ xử lý của các GPU bên trong cácsmartphone cao cấp đã được bán ra trên thị trường. Lưu ý là con số nàykhông phản ánh hiệu năng thực tế của các GPU. Bởi như trên đã nói, hiệunăng đồ họa thực sự của smartphone còn phụ thuộc vào nhiều yếu tố nhưtốc độ xung nhịp của CPU, loại và tốc độ RAM, độ phân giải màn hình…
Các con số được gắn dấu sao (*) là dựa trên tốc độ xung nhịp ước đoán của SoC chứ không được nhà sản xuất công bố.

BÌNH LUẬN - ĐẶT CÂU HỎI

Mới hơn Cũ hơn