지포스 gtx 480 비교. NVIDIA GTX480 검토 및 테스트

엔비디아 지포스 GTX 480:

비디오 카드 설명 및 합성 테스트 결과

카드에 추가 전원이 필요하고 두 개의 커넥터가 필요하며 그 중 하나는 8핀이고 두 번째는 6핀입니다. 후자에 문제가 없다면 모든 최신 PSU에는 이미 이러한 "꼬리"가 있으므로 8핀 커넥터를 통해 전원을 공급하려면 직렬 비디오 카드와 함께 제공되어야 하는 특수 어댑터가 필요합니다.

칩은 올해 넷째 주, 즉 1월 말에 받았습니다.

냉각 시스템에 대해.

엔비디아 지포스 GTX 480 1536MB PCI-E
기본적으로 쿨러는 GTX 제품군의 이전 솔루션과 다르지 않습니다. 원통형 팬은 라디에이터를 통해 공기를 구동하고 시스템 장치 외부의 열을 제거합니다. 그러나 신제품의 과도한 에너지 소비 및 그에 따른 가열의 관점에서, CO는 히트 파이프를 사용하여 방열을 향상시키는 측면에서 개선되었습니다. 보시다시피, 튜브가 있는 중앙 라디에이터는 코어만 냉각합니다. 메모리 칩이 케이스 아래에 있는 플레이트에 의해 냉각될 때. 아마도 이러한 유형의 CO를 검색할 가능성은 이미 소진되어 소음 없이 강하게 가열된 코어에 대처할 수 있습니다. 따라서 CO가 시끄러운 것으로 판명되었다고 말해야합니다. 2D 모드에서도 냉각기는 최대값의 44%로 작동하지만 이전에는 이 수치가 약 20-25%였습니다. 소음은 50% 이후에 시작됩니다. 따라서 쿨러는 가청 소음 직전에 작동하며 이것은 유휴 시간입니다! 부하에 대해 말할 수 있는 것은 CO가 터빈 회전 속도를 점진적으로 증가시키기 시작하여 카드가 3D 모드에서 실행 중일 때 평균 70-80%에 이를 때입니다.

엔비디아 지포스 GTX 480 1536MB PCI-E

기본적으로 쿨러는 GTX 제품군의 이전 솔루션과 다르지 않습니다. 원통형 팬은 라디에이터를 통해 공기를 구동하고 시스템 장치 외부의 열을 제거합니다. 그러나 신제품의 과도한 에너지 소비 및 그에 따른 가열의 관점에서, CO는 히트 파이프를 사용하여 방열을 향상시키는 측면에서 개선되었습니다. 보시다시피, 튜브가 있는 중앙 라디에이터는 코어만 냉각합니다. 메모리 칩이 케이스 아래에 있는 플레이트에 의해 냉각될 때.

아마도 이러한 유형의 CO를 검색할 가능성은 이미 소진되어 소음 없이 강하게 가열된 코어에 대처할 수 있습니다. 따라서 CO가 시끄러운 것으로 판명되었다고 말해야합니다. 2D 모드에서도 냉각기는 최대값의 44%로 작동하지만 이전에는 이 수치가 약 20-25%였습니다. 소음은 50% 이후에 시작됩니다. 따라서 쿨러는 가청 소음 직전에 작동하며 이것은 유휴 시간입니다! 부하에 대해 말할 수 있는 것은 CO가 터빈 회전 속도를 점진적으로 증가시키기 시작하여 카드가 3D 모드에서 실행 중일 때 평균 70-80%에 이를 때입니다.

EVGA Precision 유틸리티(A. Nikolaychuk AKA Unwinder 제공)를 사용하여 온도 연구를 수행한 결과 다음과 같은 결과를 얻었습니다.

엔비디아 지포스 GTX 480 1536MB PCI-E

그리고 이것은 코어의 가열이 95도에 도달하기 때문에 놀라운 일이 아니며 CO의 매우 시끄러운 작동을 희생하여 높은 수치조차도 달성됩니다. 따라서 가장 발전되고 빠른 3D 게임 그래픽 팬은 게임이나 테스트를 할 때 침묵이 무엇인지 잊어버려야 합니다. 2D에서도 카드에 온갖 복잡한 콘텐츠(예: 플래시 또는 비디오)가 로드되어 있으면 쿨러 소리가 상당히 들립니다.

장비.

참고 상품이므로 번들이나 포장이 없습니다.

이제 테스트로 넘어갑시다. 먼저 테스트 벤치의 구성을 보여줍니다.

설치 및 드라이버

테스트 벤치 구성:

Intel Core I7 CPU 920(소켓 1366 LGA) 기반 컴퓨터
- 프로세서 Intel Core I7 CPU 920(2667MHz);
- Intel X58 칩셋 기반 Asus P6T Deluxe 마더보드;
- RAM 3GB DDR3 SDRAM Corsair 1066MHz;
- 하드 드라이브 WD Caviar SE WD1600JD 160GB SATA;
- Tagan TG900-BZ 900W 전원 공급 장치.
운영 체제 Windows 7 32비트; 다이렉트X11;
모니터 Dell 3007WFP(30");
ATI 드라이버 버전 CATALYST 10.3; 엔비디아 버전 197.17.

vsync가 비활성화되었습니다.

합성 테스트

우리가 사용하는 합성 테스트 패키지는 여기에서 다운로드할 수 있습니다:

D3D RightMark 베타 4(1050)사이트 http://3d.rightmark.org에 대한 설명과 함께.
D3D RightMark 픽셀 셰이딩 2 및 D3D RightMark 픽셀 셰이딩 3— 픽셀 셰이더 버전 2.0 및 3.0 링크 테스트 .
RightMark3D 2.0간단한 설명과 함께: , .

자체 합성 DirectX 11 테스트가 없기 때문에 다양한 SDK 및 데모 프로그램의 예제를 사용해야 했습니다. 첫 번째는 DirectX SDK(2010년 2월)의 HDRToneMappingCS11.exe 및 NBodyGravityCS11.exe입니다.

우리는 또한 Nvidia와 AMD의 두 제조업체에서 각각 두 가지 예를 선택하여 어느 누구의 편견도 주장하지 않도록 했습니다. DetailTessellation11.exe 및 PNTriangles11.exe 예제는 ATI Radeon SDK에서 가져왔습니다(그런데 DX SDK에도 있음). Nvidia는 사실적인 캐릭터 헤어와 사실적인 수중 지형이라는 두 가지 데모 프로그램을 발표했습니다. 이 프로그램은 곧 회사 웹사이트에서 다운로드할 수 있습니다.

합성 테스트는 다음 비디오 카드에서 수행되었습니다.

지포스 GTX 480 GTX 480)
지포스 GTX 295표준 매개변수(이하 GTX 295)
지포스 GTX 285표준 매개변수(이하 GTX 285)
라데온 HD 5970표준 매개변수(이하 HD 5970)
라데온 HD 5870표준 매개변수(이하 HD 5870)

새로운 모델 Geforce GTX 480의 결과를 비교하기 위해 이러한 비디오 카드는 다음과 같은 이유로 선택되었습니다. Radeon HD 5870 및 HD 5970은 경쟁 회사인 AMD의 가장 생산적인 단일 칩 및 이중 칩 모델이며 가격은 다음과 같습니다. GTX 480. Nvidia 솔루션을 사용하면 모든 것이 훨씬 더 간단해집니다. Geforce GTX 285는 이전 세대 GPU에서 가장 생산적인 단일 칩 카드이며 아키텍처 변경 사항을 기준으로 판단하며 GTX 295는 이전에 Nvidia에서 출시한 가장 강력한 2칩 카드입니다. 새로운 솔루션의 출시.

Direct3D 9: 픽셀 채우기 테스트

이 테스트는 FFP 모드에서 픽셀당 적용된 다양한 텍스처에 대한 최고 텍스처 샘플링 성능(텍셀 속도)을 결정합니다.

우리의 테스트는 약간 구식이며 그 안의 비디오 카드는 이론적으로 가능한 값에 도달하지 않지만 여전히 서로에 대한 비디오 카드의 최고 텍스처링 속도를 보여줍니다. 평소와 같이 합성의 결과는 피크 값에 도달하지 않습니다. GTX 480은 이 테스트에서 쌍선형 필터링을 사용하여 32비트 텍스처에서 사이클당 최대 40개의 텍셀을 선택하는 것으로 나타났습니다. 60개의 필터링된 텍셀의 이론적 수치.

이것은 텍스처 데이터를 5-7% 더 빠르게 선택하는 GTX 285에 도달하기에도 충분하지 않습니다. 거의 모든 모드에서 1.5배 이상 생산성이 높은 경쟁사 HD 5870을 추월하는 것은 말할 것도 없고 DX9 합성으로 판단합니다. 듀얼 GPU Nvidia 카드는 분명히 소프트웨어 문제의 희생양이 되었지만 HD 5970은 HD 5870보다 훨씬 강력합니다.

GTX 480과 GTX 285의 차이는 메모리 대역폭의 제한이 더 확연한 텍스처 수가 적은 경우를 제외하고 거의 항상 동일합니다. 그리고 HD 5870은 이 테스트에서 그다지 앞서 있지 않습니다. 그러나 4-8 텍스처에서는 차이가 더 커지며, 이는 구식 게임 애플리케이션에서 항상 경쟁자보다 앞서기 위해 GF100의 텍스처링 속도가 부족함을 암시합니다. 필레이트 테스트에서 동일한 결과를 살펴보겠습니다.

두 번째 합성 테스트는 필 레이트를 보여주고 그 안에서 우리는 같은 상황을 볼 수 있지만 이미 프레임 버퍼에 쓰여진 픽셀 수를 고려하고 있습니다. 최대 결과는 더 많은 수의 TMU가 있고 합성 테스트에서 고효율을 달성하는 데 더 효율적인 AMD 솔루션에 남아 있습니다. 오버레이 텍스처가 0-3개인 경우 솔루션 간의 차이가 훨씬 작습니다. 이러한 모드에서 성능은 우선 메모리 대역폭에 의해 제한됩니다.

Direct3D 9: 픽셀 셰이더 벤치마크

우리가 고려하고 있는 픽셀 셰이더의 첫 번째 그룹은 최신 비디오 칩에 대해 매우 간단하며 비교적 복잡성이 낮은 다양한 버전의 픽셀 프로그램(오래된 게임에서 볼 수 있는 1.1, 1.4 및 2.0)을 포함합니다.

이 테스트는 최신 아키텍처에 대해 매우 간단하고 최신 GPU의 모든 기능을 보여주지는 않지만 텍스처 가져오기와 수학적 계산 사이의 균형을 평가하는 데는 흥미롭습니다. 특히 이번에 Nvidia에서 발생한 아키텍처를 변경할 때 그렇습니다.

이 테스트에서 성능은 주로 텍스처 단위의 속도에 의해 제한되지만 이미 실제 작업에서 블록 및 텍스처 데이터 캐싱의 효율성을 고려하고 있습니다. GT200과 비교했을 때 아키텍처의 변화가 어떤 영향을 미쳤는지 볼까요? 아키텍처가 변경되었음을 분명히 알 수 있으며 새로운 GTX 480 카드는 이전 아키텍처를 기반으로 한 단일 칩 카드보다 성능이 좋습니다. 게다가 대부분의 테스트에서 GTX 480은 듀얼칩 GTX 295를 따라잡는데, 그 자체로는 나쁘지 않다.

이 테스트의 메모리 대역폭은 새로운 솔루션을 약간만 제한하고 속도는 텍스처링에 따라 달라집니다. 이는 듀얼 GPU AMD는 말할 것도 없고 Radeon HD 5870 수준에서도 GF100 기반 카드가 결과를 표시하지 못하게 합니다. 해결책. Nvidia 칩을 기반으로 하는 비디오 카드는 이 테스트 세트에서 분명히 뒤쳐져 있습니다. 이는 텍스처링 속도가 중요한 다른 테스트에 대한 경고입니다. 중간 버전의 다소 복잡한 픽셀 프로그램의 결과를 살펴보겠습니다.

픽셀 셰이더 버전 2.a의 테스트에서는 경쟁업체의 속도와 비교할 때 상황이 훨씬 더 나쁩니다. 텍스처 의존도가 높은 Water 절차적 렌더링 테스트는 높은 중첩 수준에서 텍스처의 종속 샘플링을 사용하며 맵은 항상 텍스처링 속도로 정렬되지만 다른 TMU 사용 효율성에 맞게 조정됩니다.

RV870 칩을 기반으로 한 카드는 최대의 결과를 보여주지만 GTX 480의 속도는 이전 아키텍처의 GPU에서 단일 칩 모델과 듀얼 칩 모델 사이 어딘가에 있는 것으로 나타났습니다. 물론 약하지만 최소한 GTX 285보다 빠릅니다. 이는 사용 가능한 TMU를 보다 효율적으로 사용함을 나타냅니다.

두 번째 테스트의 결과는 계산 집약도가 더 높지만 계산 단위가 많은 AMD 아키텍처에 항상 더 적합했지만 거의 동일합니다. 최신 AMD 솔루션, 특히 2칩 버전이 훨씬 앞서 있습니다.

GTX 480은 GTX 285를 25%만 능가하며 듀얼 칩 모델보다 거의 같은 양으로 뒤떨어져 있습니다. 이는 GTX 480이 차세대 아키텍처에 비해 적은 수의 TMU로 인한 성능 제한을 분명히 나타냅니다. 우리의 두려움은 GF100 아키텍처의 주요 단점의 형태로 확인됩니다.

Direct3D 9: 픽셀 셰이더 2.0 테스트

DirectX 9 픽셀 셰이더에 대한 이러한 테스트는 이전 테스트보다 더 복잡하며 현재 다중 플랫폼 게임에서 볼 수 있는 것과 비슷하며 두 가지 범주로 나뉩니다. 더 간단한 버전 2.0 셰이더부터 시작하겠습니다.

시차 매핑- 기사에서 자세히 설명하는 대부분의 현대 게임에서 익숙한 텍스처 매핑 방법.
냉동 유리— 제어된 매개변수가 있는 얼어붙은 유리의 복잡한 절차적 텍스처.

이러한 셰이더에는 두 가지 변형이 있습니다. 하나는 수학 중심이고 다른 하나는 텍스처에서 샘플링 값을 선호하는 것입니다. 미래의 응용 프로그램 측면에서 더 유망한 수학 집약적인 옵션을 고려하십시오.

이것은 ALU 장치의 속도와 텍스처링 속도 모두에 의존하는 보편적인 테스트이며, 칩의 전반적인 균형이 중요합니다. Frozen Glass 테스트에서 비디오 카드의 성능은 수학뿐만 아니라 텍스처 가져오기 속도에 의해 제한됨을 알 수 있습니다. 그 안의 상황은 우리가 Cook-Torrance에서 조금 더 높게 본 것과 비슷하지만, 이번에 새로운 GTX 480은 구형 Nvidia 아키텍처의 GPU를 기반으로 하는 듀얼 GTX 295에 훨씬 더 가깝습니다. 반면에 단일 칩 HD 5870조차도 여전히 훨씬 앞서 있습니다.

두 번째 "시차 매핑" 테스트에서 결과는 이전과 매우 유사합니다. 그러나 이번에 HD 5870은 첫 번째 테스트에서만큼 Nvidia 카드에서 벗어나지 않았습니다. 다음에 무슨 일이 일어나는지 봅시다. 그러나 게임은 일반적으로 합성보다 더 다면적이며 텍스처링에만 의존하지 않습니다. 그러나 여전히 이러한 구식 작업의 경우 GF100의 텍스처 모듈 수는 분명히 부족합니다. 마지막으로 중간 결론을 확인하기 위해 텍스처에서 수학적 계산에 이르기까지 샘플을 선호하여 수정에서 동일한 테스트를 고려합시다.

그림은 다소 비슷하지만 AMD 카드가 텍스처 가져오기에서 분명히 더 낫습니다. 특히 듀얼 칩 HD 5970이 여기에서 좋습니다! GTX 480 형태의 오늘날의 영웅은 다시 GTX 285와 GTX 295 사이의 평균 결과를 보여줍니다. 여기서 텍스처 단위의 속도에 대한 성능에 대한 강조가 훨씬 더 명확하게 표시되고 GF100의 수에 대한 새롭고 강력한 그래픽 아키텍처는 여전히 분명히 불충분합니다.

그러나 그것들은 텍스처링에 중점을 둔 구식 작업이었고 특별히 어렵지 않았습니다. 이제 우리는 픽셀 셰이더에 대한 두 가지 추가 테스트의 결과를 살펴볼 것입니다. 버전 3.0은 Direct3D 9에 대한 픽셀 셰이더 테스트 중 가장 어려운데, 이는 최신 독점 PC 게임 측면에서 훨씬 더 많이 드러납니다. 테스트는 ALU와 텍스처 유닛을 더 많이 로드한다는 점에서 다릅니다. 두 셰이더 프로그램은 모두 복잡하고 길며 많은 분기를 포함합니다.

가파른 시차 매핑- 기사에서도 설명된 시차 매핑 기술의 훨씬 더 "무거운" 버전입니다.
털- 모피를 렌더링하는 절차적 셰이더.

드디어! 여기에 완전히 다른 문제가 있습니다. 두 PS 3.0 테스트는 모두 매우 복잡하고 메모리 대역폭과 텍스처링에 전혀 의존하지 않으며 순전히 수학적이지만 새로운 GF100 아키텍처가 완벽하게 대처하는 것처럼 보이는 많은 전환과 분기가 있습니다.

이 테스트에서 GTX 480은 실제 강점을 보여주고 경쟁사의 새로운 듀얼 칩을 제외한 모든 솔루션을 능가합니다. 게다가 GTX 295는 이 가장 어려운 테스트에서 거의 2배 느리고 GTX 285는 심지어 3배 더 느립니다! 결과는 컴퓨팅 효율성 향상을 목표로 하는 새 GPU의 아키텍처 변경에 의해 분명히 영향을 받았습니다.

따라서 새로운 GF100 아키텍처를 사용하면 가장 어려운 PS 3.0 테스트에서 매우 큰 성능 향상을 볼 수 있습니다. 여기서 가장 중요한 것은 AMD 솔루션이 가진 최고의 수학적 능력이 아니라 전환 및 분기가 있는 복잡한 셰이더 프로그램을 실행하는 효율성입니다. 글쎄요, GT200에 비해 2배의 수학적 능력도 영향을 미쳤습니다. ALU 실행 단위가 더 많은 AMD 아키텍처의 솔루션을 추월할 가치가 있기 때문에 매우 좋은 결과입니다.

Direct3D 10: PS 4.0 픽셀 셰이더 테스트(텍스처링, 루핑)

RightMark3D의 두 번째 버전에는 DirectX 10용으로 다시 작성된 Direct3D 9용 PS 3.0 테스트 2개와 새로운 테스트 2개가 추가로 포함되어 있습니다. 첫 번째 쌍은 셀프 섀도잉 및 셰이더 수퍼샘플링을 활성화하는 기능을 추가하여 비디오 칩의 부하를 추가로 증가시킵니다.

이 테스트는 많은 수의 텍스처 샘플(가장 무거운 모드에서 픽셀당 최대 수백 개의 샘플)과 비교적 작은 ALU 로드를 사용하여 주기로 픽셀 셰이더를 실행하는 성능을 측정합니다. 즉, 픽셀 셰이더에서 텍스처 가져오기의 속도와 분기 효율성을 측정합니다.

첫 번째 픽셀 셰이더 테스트는 Fur입니다. 가장 낮은 설정에서는 하이트맵에서 15~30개의 텍스처 샘플을 사용하고 기본 텍스처에서 2개의 샘플을 사용합니다. 효과 세부 정보 - "높음" 모드는 샘플 수를 40-80으로 증가시키고 "쉐이더" 슈퍼샘플링 포함 - 최대 60-120개 샘플, SSAA와 함께 "높음" 모드는 최대 "무거움"이 특징입니다. - 높이 맵에서 160~320개의 샘플.

먼저 슈퍼샘플링이 활성화되지 않은 모드를 확인하고 비교적 간단하며 "낮음" 및 "높음" 모드의 결과 비율이 거의 같아야 합니다.

이 테스트의 성능은 TMU의 수와 효율성, 그리고 메모리 대역폭의 채우기 비율에 따라 달라집니다. "높음"의 결과는 이론상으로 "낮음"보다 약 1.5배 낮습니다. 많은 수의 텍스처 가져오기가 포함된 Direct3D 10 절차적 모피 테스트에서 Nvidia의 솔루션은 전통적으로 강력하지만 최신 AMD 아키텍처는 이미 이에 근접했습니다.

GTX 480은 GTX 285보다 거의 3분의 1 정도 빠르지만 DX9 테스트에서도 본 GTX 295에는 미치지 못합니다. 이것은 새로운 Nvidia 솔루션이 이전 시리즈의 단일 칩 카드에 비해 이점이 있는 필레이트 및 메모리 대역폭의 영향에 대한 것입니다. GF100의 속도는 RV870을 기반으로 한 2개의 카드와 비교할 때 거의 같습니다. 동일한 테스트의 결과를 살펴보겠습니다. "셰이더" 슈퍼샘플링을 켜서 작업을 4배로 늘리면 이 상황에서 무언가가 변경될 수 있으며 채우기 속도가 있는 대역폭은 영향을 덜 받습니다.

슈퍼샘플링을 활성화하면 이론적으로 부하가 4배 증가하며, 이번에는 Geforce GTX 480이 이상하게도 지지를 잃고 있습니다. 그리고 두 Radeon 모두 조금 더 강해졌습니다. GTX 480과 GTX 285의 차이는 매우 작아서 여전히 텍스처링에 초점이 맞춰져 있음을 나타냅니다. 또는 GTX 480에서 GTX 285와 관련하여 많이 증가하지 않은 메모리 대역폭. ALU 성능과 분기의 효율적인 실행의 영향은 이 테스트에서 명확하게 표시되지 않습니다.

많은 수의 텍스처 가져오기로 복잡한 루핑 픽셀 셰이더를 실행하는 성능을 측정하는 두 번째 테스트를 가파른 시차 매핑이라고 합니다. 낮은 설정에서는 하이트맵에서 10~50개의 텍스처 샘플을 사용하고 기본 텍스처에서 3개의 샘플을 사용합니다. 셀프 섀도잉이 있는 무거운 모드를 켜면 샘플 수가 두 배가되고 수퍼샘플링은 이 숫자를 네 배로 늘립니다. 수퍼샘플링 및 셀프 섀도잉이 있는 가장 복잡한 테스트 모드는 80~400개의 텍스처 값을 선택합니다. 즉, 단순 모드보다 8배 더 많습니다. 먼저 슈퍼샘플링 없이 간단한 옵션을 확인합니다.

이 테스트는 시차 매핑 종류가 게임에서 오랫동안 사용되어 왔으며 가파른 시차 매핑과 같은 무거운 변형이 예를 들어 Crysis 및 Lost Planet과 같은 많은 프로젝트에서 사용되기 때문에 실용적인 관점에서 더 흥미롭습니다. . 또한 테스트에서 수퍼 샘플링 외에도 비디오 칩의 부하를 약 두 배로 늘리는 셀프 섀도잉을 켤 수 있으며 이 모드를 "높음"이라고 합니다.

다이어그램은 이전의 다이어그램을 거의 완전히 반복하며 가까운 결과는 절대 숫자로도 표시됩니다. 슈퍼샘플링 없는 테스트의 업데이트된 D3D10 버전에서 GTX 480은 이전 세대의 단일 칩 상단보다 약간 더 나은 성능을 보이지만 듀얼 칩 GTX 295 카드에는 뒤쳐져 있습니다. 듀얼 칩 변형이 절대적인 측면에서 승자가 되는 라이벌 HD 5870입니다.

슈퍼샘플링의 포함을 변경하는 것이 무엇인지 봅시다. Nvidia 카드에서 항상 약간 더 큰 속도 저하가 발생합니다.

슈퍼샘플링과 셀프 섀도잉이 활성화되면 작업이 더 어려워지고 두 옵션을 동시에 포함하면 카드의 부하가 거의 8배 증가하여 성능이 크게 저하됩니다. 여러 비디오 카드의 속도 표시기 간의 차이가 변경되었으며 슈퍼샘플링을 포함하면 이전 경우와 동일한 효과가 나타납니다. AMD 카드는 Nvidia의 솔루션에 비해 성능이 분명히 향상되었습니다.

두 개의 듀얼 칩 카드 모두 GTX 480보다 앞서 있지만 이번에는 새로운 솔루션이 직접적인 경쟁자 HD 5870에 약간 뒤처져 있습니다. 게임 테스트에서는 이것이 가능할 것으로 보입니다. 어딘가에서는 GTX 480이 훨씬 앞서 있을 것이며, 어딘가에 조금 뒤처질 것입니다. 그러나 GF100의 카드는 라이트 모드에서 눈에 띄게, 하드 모드에서 약간만 이전 모델을 능가합니다. 불행히도 Nvidia의 새로운 GPU의 아키텍처 변경은 실제로 이러한 테스트에서 많은 이점을 제공하지 못했습니다.

Direct3D 10: PS 4.0 픽셀 셰이더 벤치마크(컴퓨팅)

다음 몇 가지 픽셀 셰이더 테스트에는 TMU 성능의 영향을 줄이기 위한 최소 텍스처 가져오기 수가 포함됩니다. 그들은 많은 수의 산술 연산을 사용하며 비디오 칩의 수학적 성능, 픽셀 셰이더에서 산술 명령의 실행 속도를 정확하게 측정합니다.

첫 번째 수학 시험은 미네랄입니다. 이것은 2개의 텍스처 데이터 샘플과 65개의 sin 및 cos 명령어만 사용하는 복잡한 절차적 텍스처링 테스트입니다.

그러나 수학 벤치마크에서는 GF100 GPU가 GT200보다 두 배의 ALU 성능을 갖기 때문에 큰 변화를 볼 수 있습니다. 그러나 이론적으로 현대 AMD 아키텍처는 복잡한 계산 작업에서 Nvidia 경쟁자보다 분명한 이점이 있기 때문에 합성 테스트의 AMD 솔루션은 훨씬 더 빨라야 합니다. 이번에도 새로운 GTX 480 보드가 엔비디아와 AMD 카드 간 격차를 좁혀왔지만 1.5배 이상 유지되고 있는 상황이지만 이번에도 그 입장이 확인됐다.

하지만 GTX 285, GTX 295와의 비교는 흥미로운 것으로 밝혀졌다. 이번에 Nvidia는 이전 단일 칩 카드와 차이를 두 배로 늘리거나 이전 세대의 이전 듀얼 칩 카드를 추월하지 못했습니다. 결론은 이 테스트가 ALU 속도에 완전히 의존하는 것은 아니지만 그 결과가 메모리 대역폭의 차이에 기인할 수도 없다는 점을 확인했다. GF100은 GTX 285보다 38%만 더 빠르며, 이는 우리의 의견으로는 매우 이상하고 매우 작습니다.

Fire라고 하는 셰이더 계산의 두 번째 테스트를 살펴보겠습니다. ALU의 경우 더 무겁고 텍스처 가져오기가 하나만 있으며 sin 및 cos 명령어 수가 최대 130개로 두 배로 증가했습니다. 로드가 증가함에 따라 변경된 사항을 보겠습니다.

두 번째 테스트에서 렌더링 속도는 거의 전적으로 셰이더 장치의 성능에 의해 제한되지만 여전히 GTX 285와 GTX 480의 차이는 너무 작습니다. 이론적으로는 2배 차이에 가까워야 하지만 58%에 불과합니다. 그러나 새로운 솔루션은 이전 테스트와 달리 적어도 듀얼 칩 GTX 295를 따라 잡았습니다. 그러나 Radeon HD 5870으로 대표되는 경쟁업체와 이 테스트에서 HD 5970은 훨씬 더 빠른 속도를 보여줍니다.

수학적 D3D10 테스트를 요약합니다. 모든 Nvidia 비디오 카드는 훨씬 뒤쳐져 있으며, 새로운 GF100도 최대 합성 작업에서 경쟁 제품보다 거의 두 배 느립니다! 그리고 이 모든 것은 GTX 480이 이론적으로 단일 칩 GTX 285보다 거의 두 배 빠르다는 사실에도 불구하고. 현실은 훨씬 낮은 수치를 보여주고 Nvidia는 간단한 수학 테스트에서 AMD 카드에 근접하지도 못했습니다.

일반적으로 궁극의 수학적 계산에 대한 결과는 변함이 없고, 이번에는 GTX 400 라인도 변함이 없는 AMD 솔루션의 분명하고 틀림없는 장점이다.

Direct3D 10: 기하 셰이더 테스트

RightMark3D 2.0에는 두 가지 지오메트리 셰이더 속도 테스트가 있습니다. 첫 번째 옵션은 "갤럭시"라고 하며 이 기술은 이전 버전의 Direct3D의 "포인트 스프라이트"와 유사합니다. GPU에서 파티클 시스템을 애니메이션으로 만들고 각 지점의 지오메트리 셰이더는 파티클을 형성하는 4개의 정점을 만듭니다. 향후 DirectX 10 게임에서도 유사한 알고리즘이 널리 사용되어야 합니다.

지오메트리 셰이더 테스트에서 균형을 변경해도 최종 렌더링 결과에는 영향을 미치지 않으며 최종 이미지는 항상 정확히 동일하며 장면 처리 방법만 변경됩니다. "GS load" 매개변수는 계산이 수행되는 셰이더(정점 또는 지오메트리)를 결정합니다. 계산 횟수는 항상 동일합니다.

세 가지 기하학적 복잡성 수준에 대해 정점 셰이더에서 계산이 포함된 "Galaxy" 테스트의 첫 번째 버전을 살펴보겠습니다.

장면의 기하학적 복잡성이 다른 속도의 비율은 모든 솔루션에서 거의 동일하며 성능은 포인트 수에 해당하며 각 단계에서 FPS 하락은 약 2배입니다. 최신 비디오 카드의 작업은 특별히 어렵지 않으며 전체 성능은 지오메트리 처리 속도에 의해 제한되며 메모리 대역폭에 의존하지 않습니다.

이것이 새로운 GPU의 진정한 강점을 보여주는 곳입니다. 모든 모드에서 GeForce GTX 480은 경쟁사의 듀얼 칩 솔루션에 가까운 결과를 보여주며 HD 5870 및 GT200 기반 듀얼 칩 카드를 1.5배 능가합니다. 우수한 결과! 예상대로 GF100의 지오메트리 셰이더 실행은 GT200보다 약 2.5배 더 빠르고 매우 효율적입니다. 계산의 일부를 지오메트리 셰이더로 전송할 때 상황이 변경되는지 봅시다.

아니요, 이 테스트에서 부하가 변경되었을 때 숫자가 많이 변경되지 않았습니다. 이 테스트의 모든 카드는 계산의 일부를 지오메트리 셰이더로 전송하는 역할을 하는 GS 로드 매개변수의 변경을 감지하지 못하고 이전 다이어그램과 유사한 결과를 보여줍니다. 지오메트리 셰이더에 과부하가 걸린다고 가정하는 다음 테스트에서 무엇이 변경되는지 봅시다.

"Hyperlight"는 인스턴싱, 스트림 출력, 버퍼 로드와 같은 여러 기술을 한 번에 사용하는 방법을 보여주는 지오메트리 셰이더의 두 번째 테스트입니다. Direct3D 10의 새로운 기능인 스트림 출력뿐만 아니라 두 개의 버퍼에 그려서 동적 지오메트리 생성을 사용합니다. 첫 번째 셰이더는 광선의 방향, 성장 속도 및 방향을 생성하고 이 데이터는 버퍼에 저장되며 두 번째 셰이더는 렌더링에 사용합니다. 빔의 각 지점에 대해 14개의 정점이 원 안에 구축되어 총 백만 개의 출력 지점이 생성됩니다.

새로운 유형의 셰이더 프로그램은 "광선"을 생성하는 데 사용되며 "GS load" 매개변수가 "Heavy"로 설정된 상태에서도 광선을 그립니다. 즉, "Balanced" 모드에서 기하 셰이더는 광선을 생성 및 "성장"하는 데만 사용되며 출력은 "인스턴싱"을 사용하여 수행되며 "Heavy" 모드에서는 기하 셰이더도 출력에 포함됩니다. . 먼저 easy 모드를 살펴보겠습니다.

이 테스트, Geforce GTX 295 및 Radeon HD 5970에서 두 개의 듀얼 칩 구성이 모두 평소와 같이 수행되었습니다. 분명히 이 테스트는 AFR 다중 칩 렌더링 방법과 전혀 호환되지 않습니다. 그렇지 않으면 다른 모드의 상대적 결과가 부하에 해당합니다. 모든 경우에 성능이 잘 확장되고 이론적인 매개변수에 가깝습니다. 이에 따라 각 다음 다각형 수 수준은 2배 미만이어야 합니다.

이 테스트에서 새로운 Geforce GTX 480의 성능은 하드 모드에서 Radeon HD 5870을 약간 능가하지만 그 차이는 라이트 모드에서 더 두드러집니다. GTX 480을 이전 세대 GPU 기반의 GTX 285와 비교하는 것은 일반적으로 말도 안 되는 일이며 새 비디오 칩은 약 2배 빠릅니다.

숫자는 지오메트리 셰이더를 보다 적극적으로 사용하는 테스트에서 다음 다이어그램에서 변경되어야 합니다. "Balanced" 및 "Heavy" 모드에서 얻은 결과를 서로 비교하는 것도 흥미로울 것입니다.

GF100의 지오메트리 처리 기능과 지오메트리 셰이더 실행 속도에 다시 한 번 경탄할 때입니다. 이것은 정확히 GF100 그래픽 파이프라인에서 글로벌 변경이 이루어진 결과입니다. 지오메트리 셰이더 성능은 GT200과 RV870 모두에서 상당히 개선되었지만 GF100은 이 작업에서 단순히 이들을 분해합니다.

이 테스트에서 새로운 GTX 480은 Radeon HD 5870보다 거의 2배, 단일 칩 이전 제품인 GTX 285보다 최대 2.75배 더 빠릅니다. Nvidia 엔지니어는 이전 지오메트리 처리 아키텍처의 효율성을 개선하기 위해 노력했으며, 분명히 성공했다. 이전의 모든 솔루션은 지오메트리 셰이더를 효율적으로 동일하게 실행할 수 없습니다. 이론상 더 큰 차이를 보여야 할 테셀레이션 테스트에서는 어떤 일이 벌어질까요? 하지만 너무 앞만 보지는 말자.

Direct3D 10: 정점 셰이더에서 텍스처 가져오기 속도

"정점 텍스처 가져오기" 테스트는 정점 셰이더에서 가져온 많은 수의 텍스처 속도를 측정합니다. 테스트는 본질적으로 유사하며 "Earth" 및 "Waves" 테스트의 카드 결과 간의 비율은 거의 같아야 합니다. 두 테스트 모두 텍스처 샘플링 데이터를 기반으로 하지만 "Waves" 테스트는 조건부 점프를 사용하지만 "Earth" 테스트는 사용하지 않는다는 유일한 차이점이 있습니다.

"Effect detail Low" 모드에서 첫 번째 테스트 "Earth"를 고려하십시오.

이전 연구에서는 텍스처링 속도와 메모리 대역폭이 모두 이 테스트의 결과에 영향을 미치는 것으로 나타났습니다. 그러나 솔루션 간의 차이는 매우 작습니다. GTX 480은 듀얼 GTX 295와 비슷한 결과를 보여, HD 5870을 약간 능가하지만, 이번 테스트에서 가장 생산적인 Radeon HD 5970에 비해 모든 모드에서 약간 열등한 결과를 보였다. 동일한 테스트에서 텍스처 가져오기 수가 증가했습니다.

다이어그램에서 카드의 상호 배열이 약간 변경되었습니다. 이는 거의 모든 카드의 약간 악화된 지표에서 볼 수 있습니다. 오늘 리뷰하는 GTX 480을 제외하고는 동일한 조명 조건에서 테스트했을 때와 비교하여 성능이 거의 떨어지지 않았습니다. 이것이 의미하는 바입니다. 텍스처 모듈, 특히 캐싱 하위 시스템의 효율성이 향상되었습니다. 이제 새로운 GF100 카드는 중간에서 높은 폴리곤 수에서 가장 빠르며 가장 쉬운 모드에서 듀얼 칩 카드와 동등합니다.

정점 셰이더에서 텍스처를 가져오는 두 번째 테스트의 결과를 살펴보겠습니다. Waves 테스트는 샘플 수가 적지만 조건부 점프를 사용합니다. 이 경우 이중선형 텍스처 샘플의 수는 정점당 최대 14개("효과 세부 정보 낮음") 또는 최대 24개("효과 세부 정보 높음")입니다. 기하학의 복잡성은 이전 테스트와 유사하게 변경됩니다.

흥미롭게도 "파도" 테스트의 결과는 이전 차트에서 본 것과 유사하지 않습니다. AMD 제품의 장점이 다소 높아져 이제 GTX 480은 HD 5870 및 Geforce GTX 295와 유사한 성능을 보여 헤비 모드에서 경쟁자에게 약간 밀리고 있습니다. 단일 칩에 대한 이전 최고의 Nvidia 솔루션은 뒤쳐져 있고, Geforce GTX 400 제품군의 새 모델이 몇 배는 아니지만 앞서 있습니다. 동일한 테스트의 두 번째 버전을 고려하십시오.

조건의 복잡성이 증가함에 따라 두 번째 정점 샘플링 테스트에서 최신 Nvidia GPU의 결과가 AMD 비디오 카드의 속도에 비해 약간 더 좋아졌지만 다시 변경 사항은 거의 없습니다. HD 5870보다 작지만 가장 쉬운 모드를 제외하고는 새로운 단일 칩 카드가 Geforce GTX 295에 대처했습니다.

3DMark Vantage: 기능 테스트

이 리뷰에서 우리는 다시 3DMark Vantage 패키지의 합성 테스트를 포함하기로 결정했습니다. 패키지가 새로운 것은 아니지만 기능 테스트는 D3D10을 지원하며 우리와 다르기 때문에 흥미롭습니다. 이 패키지에서 Nvidia의 새로운 솔루션의 결과를 분석할 때 RightMark 제품군의 테스트에서 우리가 빠져 나온 새롭고 유용한 몇 가지 결론을 도출할 수 있을 것입니다.

기능 테스트 2: 색상 채우기

충전율 테스트. 성능을 제한하지 않는 매우 간단한 픽셀 셰이더를 사용합니다. 보간된 색상 값은 알파 혼합을 사용하여 오프스크린 버퍼(렌더링 대상)에 기록됩니다. HDR 렌더링을 사용하는 게임에서 가장 일반적으로 사용되는 16비트 FP16 오프스크린 버퍼를 사용하므로 이 테스트는 시기적절합니다.

이 테스트의 성능은 다른 형식을 사용하더라도 유사한 테스트에서 본 것과 일치하지 않습니다. 구성 요소당 8비트의 정수 버퍼를 사용하지만 Vantage 테스트에서는 16비트 부동 소수점을 사용합니다. Vantage 숫자는 ROP의 성능이 아니라 대략적인 메모리 대역폭 양을 표시할 가능성이 더 큽니다. 듀얼 칩 카드의 경우 상황이 다소 복잡합니다. GTX 295는 예상보다 낮은 수치를 보여줍니다.

테스트 결과는 이론적 수치와 대략 일치하며 메모리 버스 폭, 유형 및 주파수에 따라 다릅니다. GTX 285는 512비트 메모리를 사용하기 때문에 성능이 좋고, GDDR5 메모리가 특별히 높은 주파수에서 동작하지 않고 메모리 버스 폭이 384비트에 해당한다는 점에서 GTX 480도 크게 앞서지 않는다. 글쎄, Radeon HD 5870도 근처 어딘가에 있지만 256비트 메모리 버스만 있지만 GDDR5는 상당히 빠릅니다.

더 높은 메모리 대역폭을 가진 GDDR5 메모리를 사용함에도 불구하고 HD 5870과 함께 Nvidia의 새로운 솔루션은 512비트 버스와 GDDR3 메모리가 있는 GTX 285 수준보다 약간 높은 성능을 보입니다. 이것은 현대 게임에서 널리 관찰되는 FP16 형식의 렌더 버퍼를 사용할 때 잠재적인 성능 제한으로 작용할 수 있습니다.

기능 테스트 3: 시차 오클루전 매핑

이 기술은 이미 게임에서 사용되기 때문에 가장 흥미로운 기능 테스트 중 하나입니다. 복잡한 기하학을 모방하는 특별한 Parallax Occlusion Mapping 기술을 사용하여 하나의 사변형(더 정확하게는 두 개의 삼각형)을 그립니다. 리소스를 많이 사용하는 광선 추적 작업과 고해상도 깊이 맵이 사용됩니다. 이 표면은 또한 무거운 Strauss 알고리즘을 사용하여 음영 처리됩니다. 이것은 광선 추적, 동적 분기 및 복잡한 Strauss 조명 계산 동안 수많은 텍스처 가져오기를 포함하는 비디오 칩에 대한 매우 복잡하고 무거운 픽셀 셰이더의 테스트입니다.

테스트는 셰이더 파워, 브랜치 실행의 효율성, 텍스처 가져오기 속도가 따로따로 좌우될 뿐만 아니라 모든 것에 약간 의존한다는 점에서 다른 테스트와 다릅니다. 그리고 고속을 달성하기 위해서는 GPU 유닛과 비디오 메모리 대역폭의 유능한 균형이 중요합니다. 테스트와 셰이더의 분기 효율성에 큰 영향을 줍니다.

불행히도 GTX 480은 이 테스트에서 평범하지 않은 성능을 보이며 이전 단일 칩 솔루션인 GTX 285보다 23%만 더 빠릅니다. 오늘날의 Nvidia 그래픽 카드는 듀얼 칩 GTX 295와 최대 라이벌인 Radeon HD 5870에 뒤처지는 반면 듀얼 칩 HD 5970은 일반적으로 손이 닿지 않는 곳에 있었습니다.

무엇이 이 테스트의 결과에 그렇게 부정적인 영향을 미쳤는지 명확하지 않습니다. GF100의 분기 효율성이 상당히 높기 때문에 테스트에서 적극적으로 사용되는 낮은 텍스처 가져오기 속도가 원인일 수 있습니다. 이는 버전 3 픽셀 셰이더 테스트에서 입증되었습니다. Nvidia 솔루션은 이 테스트에서 항상 효과적이었지만 HD 5870은 새로운 GTX 480보다 성능이 뛰어납니다. 아마도 GF100이 물리 시뮬레이션 테스트에서 최고를 보여줄 것입니까?

기능 테스트 4: GPU 천

이 테스트는 비디오 칩을 사용하여 물리적 상호 작용(천 모방)을 계산한다는 점에서 흥미롭습니다. 정점 시뮬레이션은 정점 및 형상 셰이더의 결합된 작업을 사용하여 여러 패스와 함께 사용됩니다. 스트림 아웃을 사용하여 한 시뮬레이션 패스에서 다른 시뮬레이션 패스로 정점을 전송합니다. 따라서 정점 및 기하 도형 셰이더의 실행 성능과 스트림 출력 속도가 테스트됩니다.

듀얼 칩 카드의 성능을 즉시 버릴 수 있습니다. 단일 칩 아날로그의 속도와 분명히 일치합니다(HD 5970 및 GTX 295의 각 칩은 HD 5870 및 GTX 285보다 낮은 주파수에서 작동함). 여기서 렌더링 속도는 지오메트리 처리 성능과 지오메트리 셰이더 실행에 따라 달라집니다. 이번 테스트에서는 GTX 285도 HD 5870에 약간 뒤처지는 등 좋은 성능을 보여 새로운 GTX 480이 다시 한 번 강점을 보였다.

이 테스트에서 GF100은 이전 솔루션보다 거의 2배의 생산성을 보이며 이는 새 칩의 2배 향상된 셰이더 성능과 잘 일치합니다. 경쟁사인 Radeon HD 5870에 비해 이점은 인상적입니다. 일반적으로 오늘날의 영웅은 기하학적 셰이더 실행과 일반적으로 기하학적 처리 속도에서 리더의 지위를 부여받을 수 있습니다.

기능 테스트 5: GPU 입자

비디오 칩을 사용하여 계산된 입자 시스템을 기반으로 하는 효과의 물리적 시뮬레이션 테스트입니다. 정점 시뮬레이션도 사용되며 각 정점은 단일 입자를 나타냅니다. Stream out은 이전 테스트와 같은 용도로 사용됩니다. 수십만 개의 입자가 계산되고 모두 별도로 애니메이션되며 높이 맵과의 충돌도 계산됩니다. RightMark3D 2.0 테스트 중 하나와 유사하게 입자를 형성하기 위해 각 점에서 4개의 정점을 생성하는 기하학 셰이더를 사용하여 입자를 그립니다. 그러나 테스트는 무엇보다도 정점 계산이 포함된 셰이더 블록을 로드하고 스트림 아웃도 테스트합니다.

더 강력한 결과가 있습니다. 지오메트리 셰이더가 사용되는 Vantage의 합성 직물 및 입자 시뮬레이션 테스트에서 새로운 GF100은 단순히 모든 경쟁자를 먼지 속에 남겨둡니다. 이번에는 이전 Nvidia GPU보다 거의 3배 정도 성능이 뛰어나며, 경쟁사인 Radeon HD 5870은 입자 시뮬레이션 테스트에서 약 2배의 성능을 보입니다.

멀티칩 결과는 다시 동일합니다. AMD 카드와 Nvidia에는 분명히 멀티칩 렌더링 방법이 없습니다. 현재 프레임의 계산 결과가 다음 프레임에서 사용되기 때문에 현재 렌더링이 완료되었습니다. 이것은 듀얼 칩 카드의 명백한 약점이며 이전 카드의 데이터가 프레임에 사용될 때 효과적으로 작동하지 않습니다.

기능 테스트 6: Perlin 노이즈

Vantage 패키지의 마지막 기능 테스트는 수학적으로 집중적인 비디오 칩 테스트이며 픽셀 셰이더에서 Perlin 노이즈 알고리즘의 여러 옥타브를 계산합니다. 각 색상 채널은 자체 노이즈 기능을 사용하여 비디오 칩의 부하를 높입니다. Perlin 노이즈는 절차적 텍스처링에 자주 사용되는 표준 알고리즘이며 많은 수학을 사용합니다.

Futuremark 테스트 제품군의 수학적 기능 테스트는 극한 작업에서 비디오 칩의 순수한 성능을 보여줍니다. 여기에 표시된 성능은 이론에 따라 얻어야 하는 것과 잘 일치하며, 부분적으로는 RightMark 2.0의 자체 수학적 테스트에서 본 것과 일치합니다. 그러나 이 테스트에서는 솔루션 간의 차이가 훨씬 더 큽니다.

그래서 이번 수학적 테스트에서 신형 GF100을 기반으로 하는 GTX 480이 드디어 GTX 285를 정확히 2배 추월해 이론에 부합했다. 그러나 새로운 솔루션과 HD 5870 사이의 격차는 1.7배로 너무 커졌습니다. 우리는 아직 듀얼칩 HD 5970을 고려하지 않고 있습니다...

일반적으로 AMD 비디오 카드는 이 테스트에서 자연스럽게 Nvidia 경쟁사를 능가하지만 Nvidia GF100 그래픽 프로세서를 기반으로 하는 새로운 솔루션은 여전히 이에 근접했습니다. 이 수학적 테스트는 매우 간단하며 이론적 피크에 가까운 성능을 나타내도록 설계되었습니다. 물리적 계산과 같은 보다 복잡한 계산 테스트에서는 약간 다른 그림이 나타납니다. 그러나 간단하지만 집중적인 수학은 AMD 카드에서 훨씬 더 빠르게 수행됩니다.

Direct3D 11: 계산 및 기하 도형 셰이더

DirectX 11 기능을 사용하는 작업에서 Nvidia 및 AMD의 새로운 솔루션을 테스트하기 위해 Microsoft, AMD 및 Nvidia SDK의 샘플과 이들 회사의 일부 데모 프로그램을 사용했습니다.

먼저 새로운 유형의 셰이더인 Compute를 사용하는 테스트를 살펴보겠습니다. 그들의 모양은 최신 버전의 DX API에서 가장 중요한 혁신 중 하나이며 후처리, 시뮬레이션 등 다양한 작업에 사용됩니다. 첫 번째 테스트는 픽셀 또는 컴퓨팅 셰이더를 사용한 사후 처리를 통해 DirectX SDK에서 HDR 렌더링을 매핑하는 예를 보여줍니다.

우리는 이 테스트에서 새로운 Nvidia Geforce GTX 480 비디오 카드에 대한 AMD의 단일 칩 솔루션의 명백한 승리를 인정해야 합니다. 오늘 발표된 새로운 GF100 칩을 기반으로 하는 보드는 픽셀 및 컴퓨팅 셰이더 모드 모두에서 경쟁 제품인 Radeon HD 5870보다 뒤쳐져 있습니다. 또한 지연은 최대 1.5 배까지 상당히 눈에.니다. 듀얼 칩 HD 5970은 이 테스트에서 하나의 GPU만 실행하므로 HD 5870보다 점수가 훨씬 낮습니다.

두 번째 컴퓨트 셰이더 테스트는 Microsoft의 DirectX SDK에서 가져온 것으로 중력과 같은 물리적 힘에 영향을 받는 동적 입자 시스템의 시뮬레이션인 N-바디(N-바디) 중력 계산 문제를 보여줍니다.

그리고 이 계산 테스트에서 새로운 Nvidia 솔루션은 가장 가까운 경쟁자인 Radeon HD 5870에 다시 한 번 졌습니다. 이 경우에도 약 25%로 상당히 많은 양입니다. 듀얼칩 HD 5970은 다시 한번 그 능력을 발휘하지 못하고, 보드에 설치된 두 개의 GPU 중 하나의 작업으로 제한됩니다.

다음 테스트는 사실적인 캐릭터 헤어라는 Nvidia의 데모입니다. 계산 또는 기하 셰이더의 순수한 합성 코드가 아니라 기하 및 계산 셰이더와 테셀레이션의 복합물을 사용하므로 처음 두 테스트의 순수한 합성보다 실제 문제에 다소 가깝습니다.

그러나 이 테스트에서 Nvidia의 새로운 GPU는 두 번째 GPU가 다시 실패한 단일 칩 Radeon HD 5870 및 이중 칩 HD 5970보다 훨씬 앞서서 좋은 성능을 보였습니다. 동시에 단일 칩 카드 간의 성능 차이가 최대 1.5~1.8배일 뿐만 아니라 하드웨어 테셀레이션이 활성화되었을 때의 다른 동작도 흥미롭습니다.

이 경우 GF100 칩을 기반으로 하는 새로운 Geforce GTX 480 비디오 카드는 테셀레이션이 활성화될 때 15% 가속되는 반면 RV870 기반 AMD 솔루션은 거의 5% 느려집니다. 즉, 이 경우 테셀레이션은 Nvidia의 솔루션에 유리하지만 AMD에는 그렇지 않습니다. 분명히 기하학적 컨베이어의 다른 구성은 우리가 지금 진행하고 있는 성능을 고려하는 데 영향을 미칩니다.

Direct3D 11: 테셀레이션 성능

Direct3D 11의 가장 중요한 혁신은 하드웨어 테셀레이션으로 간주됩니다. 우리는 Nvidia GF100에 대한 이론적인 기사에서 이를 매우 자세히 고려했습니다. 그래픽 프리미티브(테셀레이션)를 분할하는 여러 가지 방식이 있습니다. 예를 들어, 퐁 테셀레이션, PN 삼각형, Catmull-Clark 세분화.

테셀레이션은 STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033과 같은 최초의 DirectX 11 게임에서 이미 사용되기 시작했습니다. 그 중 일부에서는 테셀레이션이 캐릭터 모델(목록에 있는 모든 FPS 게임)에 사용됩니다. 기타 - 사실적인 수면 시뮬레이션(DiRT 2). PN 삼각형 구성표는 Metro 2033 - Phong 테셀레이션의 STALKER: Call of Pripyat에서 사용됩니다. 이러한 방법은 게임 개발 프로세스와 기존 엔진에 비교적 빠르고 쉽게 구현되어 있습니다.

첫 번째 테셀레이션 테스트는 ATI Radeon SDK의 Detail Tessellation 예제가 될 것입니다. 실제로 테셀레이션뿐만 아니라 두 가지 다른 범프 매핑 기술인 노멀 맵의 노멀 오버레이와 시차 오클루전 매핑도 보여줍니다. 다른 조건에서 Nvidia와 AMD의 DirectX 11 솔루션을 비교해 보겠습니다.

첫 번째 결론은 다음과 같이 제안됩니다. 픽셀별 시차 오클루전 매핑 기술(다이어그램의 중간 막대)은 테셀레이션(아래 막대)보다 Geforce GTX 480 및 RADEIN HD 5870 모두에서 테셀레이션보다 덜 효율적입니다. 즉, 픽셀 계산을 사용하여 형상을 시뮬레이션하면 테셀레이션을 사용하여 렌더링된 실제 형상보다 성능이 떨어집니다. 그건 그렇고 현재 시차 매핑이 사용되는 테셀레이션의 전망에 대한 것입니다.

다음으로, GTX 480과 AMD 카드의 상대적인 성능에 대해. 듀얼 칩 HD 5970은 단일 칩 옵션보다 앞서 있으므로 이해할 수 있습니다. 그러나 GTX 480은 HD 5870보다 5~15% 앞서 있습니다. 테셀레이션이 활성화되면 더 많고 픽셀당 계산은 더 적습니다. 이는 우리의 기대와 일치합니다. DX9 또는 DX10만 지원하는 게임에서 GTX 480과 HD 5870의 차이는 테셀레이션이 있는 DX11 게임보다 작아야 합니다.

두 번째 테셀레이션 성능 테스트는 ATI Radeon SDK - PN Triangles의 3D 개발자를 위한 또 다른 예입니다. 실제로 두 예제 모두 DX SDK의 일부이기 때문에 많은 게임 개발자가 이를 기반으로 자체 코드를 생성합니다. 전체 성능에 얼마나 영향을 미치는지 알아보기 위해 다른 테셀레이션 요소로 이 예를 테스트했습니다.

이 예에서 아마도 GF100 그래픽 아키텍처의 진정한 기하학적 힘을 처음으로 보았을 것입니다. 예, 이것은 합성 테스트일 뿐이며 이러한 극단적인 분할 요소는 처음에는 사용되지 않을 것입니다. 그러나 미래 작업에서 솔루션의 전망을 평가하는 데 도움이 되도록 합성 물질이 필요합니다.

그리고 여기에서 Geforce GTX 480은 GF100이 테셀레이션 작업에서 할 수 있는 것을 완벽하게 보여줍니다. 단일 칩은 경쟁사의 2칩 카드보다 몇 배나 앞서 있습니다. HD 5970에 대한 이점은 4배에 이르며 단일 칩 HD 5870은 이 테스트에서 단순히 엄청난 점수로 패배했습니다. 실제로 GF100을 사용하면 RV870보다 몇 스톱 더 테셀레이션을 사용할 수 있습니다. 이것이 테셀레이션의 형태로 새로운 API의 기능을 고려하도록 특별히 설계된 아키텍처입니다.

그러나 한 가지 더 테스트를 살펴보겠습니다. Nvidia의 사실적인 수중 지형 데모 프로그램(아일랜드라고도 함)입니다. 그건 그렇고, 이 프로그램의 작성자는 3D 애호가에게 알려진 Smalltim으로 알려진 Timofey Cheblokov입니다. 그의 Island 데모는 테셀레이션 및 변위 매핑을 사용하여 사실적으로 보이는 바다 표면과 지형을 렌더링합니다. 그녀는 멋져 보인다:

일반적으로 Island는 테셀레이션을 위한 순수한 합성 테스트가 아니라 다소 복잡한 픽셀 및 계산 셰이더를 포함하므로 성능의 차이가 이전의 경우보다 적을 수 있지만 이 상황이 현실에 더 가깝습니다.

이 경우 네 가지 테셀레이션 요소로 데모를 테스트했습니다. 여기에서 이 설정을 동적 테셀레이션 LOD라고 합니다. 가장 낮은 분할 비율에서 GF100 카드가 AMD의 단일 칩 버전보다 약간 앞서고 HD 5970보다 열등한 경우 분할 비율이 증가하고 결과적으로 장면이 복잡해지면 GTX의 성능이 향상됩니다. 480은 경쟁 솔루션의 렌더링 속도만큼 감소하지 않습니다.

그 결과 새로운 Nvidia 그래픽 아키텍처의 GF100 칩이 장면 복잡성이 크게 다른 RV870과 유사한 테셀레이션 성능을 제공하는 상황이 다시 발생했습니다. 따라서 이 프로그램에서 최대 LOD 계수가 100이면 GTX 480은 Radeon HD 5870과 동일한 성능을 나타내지만 계수가 25에 불과합니다. 경우). 그것은 단지 큰 차이입니다!

합성 테스트에 대한 결론

GF100 GPU 기반의 새로운 Nvidia Geforce GTX 480 모델의 합성 테스트 결과와 주요 비디오 칩 제조업체의 다른 비디오 카드 모델의 결과를 기반으로 하면 이것이 매우 강력한 Nvidia 그래픽 아키텍처라는 결론을 내릴 수 있습니다. , 크게 향상된 성능과 기회를 제공합니다. 새로운 GF100 기반 그래픽 카드는 모든 단일 칩 카드 중에서 가장 빠른 카드 중 하나가 되었습니다.

지오메트리 처리 장치의 수가 증가하고 병렬 작업이 가능해지면서 테셀레이션 및 지오메트리 셰이더의 성능이 크게 향상되었습니다. 합성 테셀레이션 작업에서 Nvidia의 새로운 솔루션은 비교할 수 없습니다. 2칩 솔루션도 경쟁사에 도움이 되지 않으며, 비디오 카드를 단일 GPU와 비교할 때도 이러한 테스트에서 GF100 기반 솔루션은 RV870 기반 최고의 카드보다 성능이 최대 4~6배 더 우수합니다. 그리고 지오메트리의 효율적인 처리를 위해 특별히 개선된 경쟁사의 아키텍처가 출시될 때까지 상황은 변하지 않을 것입니다.

테셀레이션이 없는 3D 응용 프로그램의 성능을 판단하면 게임 테스트에서 합성 테스트와 동일할 것이라고 가정할 수 있습니다. 어디선가 Geforce GTX 480이 경쟁업체보다 앞서고 어딘가에서는 약간 뒤처질 것입니다. 또한 수학적 계산이나 텍스처 샘플링 성능에 의해 완전히 제한되는 게임이 없기 때문에 너무 큰 손실은 없어야 합니다. GF100 아키텍처에 대해 몇 가지 질문이 있는 유일한 매개변수입니다.

테셀레이션, 지오메트리 셰이더 및 물리적 계산(Vantage 패키지의 섬유 및 입자 시뮬레이션, 지오메트리 셰이더도 사용)의 합성 테스트에서 새로운 Nvidia GF100 칩은 다른 칩보다 훨씬 강력합니다. 복잡한 프로그램을 사용한 다른 계산 테스트에서와 같이. 그러나 예상대로 RightMark 또는 Vantage의 순수한 계산 테스트와 같은 직선 수학은 AMD 솔루션에 실패했으며 Nvidia는 여전히 훨씬 뒤쳐져 있습니다. GF100은 기능면에서 CPU에 더 가깝고 훨씬 더 다양해졌지만(C++ 및 CPU와 같은 캐싱을 기억하십시오) RV870에 비해 "숫자 분쇄" 능력이 다소 적습니다. GPU는 항상 CPU와 다릅니다.

우리 기사에서 언급한 상대적으로 낮은 피크 컴퓨팅 및 텍스처 성능은 일부 인공 테스트에서 경쟁자보다 뒤쳐지지만 일반적으로 GTX 480은 매우 괜찮은 결과를 보여주었으며 이는 우리 자료의 다음 부분에서 확인해야 합니다. 여기에서 가장 현대적인 게임 응용 프로그램에서 새로운 GPU를 기반으로 하는 Nvidia의 최신 솔루션 테스트에 대해 알게 될 것입니다.

게임 결과는 합성 테스트 결과를 분석할 때 내린 결론과 대략 일치한다고 가정합니다. 게임의 렌더링 속도는 종종 한 번에 여러 비디오 카드의 특성에 의존하고 합성보다 채우기 속도와 메모리 대역폭에 훨씬 더 많이 의존하기 때문에 때때로 차이가 없을 것입니다. 우리는 Geforce GTX 480 모델이 테셀레이션이 없는 게임에서 단일 칩 경쟁자 Radeon HD 5870보다 약간 앞서야 하며 테스트에서 확실히 앞서 있을 것이라고 생각합니다.

최근에 오랜 준비와 수많은 약속 끝에 NVidia는 새로운 비디오 어댑터를 대중 시장에 출시했습니다: GeForce GTX 480 및 GeForce GTX 470. 우리는 이미 첫 번째 리뷰에서 각각의 신제품에 대해 알게 되었습니다. 이것은 오늘날 매우 신중하게 연구하는 작업이 의제에 있지 않다는 것을 의미하며 주요 매개 변수만 간단히 기억할 것입니다. "이 기사에서는 무엇을 할 것입니까?" - 친애하는 독자 여러분, 묻습니다. 그리고 이 기사에서는 "오버클럭킹"을 할 것입니다. 예, 저자는 너무 많은 소음이 있었기 때문에 상황을 수정하기로 결정했습니다.

GTX 480 내부 및 외부(간단히)

광고하는

내가 약속했듯이 비디오 어댑터의 구조와 아키텍처에 대한 자세한 연구는 없을 것입니다. 우리는 첫 번째 리뷰를 부주의하게 읽거나 특성을 다듬고 싶은 사람들에게 핵심 사항만 기억할 것입니다. 지도의 외부 보기부터 시작하겠습니다.

우리 앞에는 첫 번째 검토에 있었던 ZOTAC의 동일한 비디오 어댑터가 있습니다. 사실 ZOTAC의 스티커만 있고, 비디오 카드는 아무런 변경 없이 레퍼런스 디자인의 샘플입니다. 비디오 어댑터의 크기는 길이 27cm, 깊이 12cm입니다. ZOTAC 프린트는 냉각 시스템의 두 부분을 분리합니다. 오른쪽에는 소프트웨어 속도 제어가 가능한 터빈이 있습니다. 왼쪽에는 알루미늄 방열판의 상단과 4개의 방열판이 있습니다. 사실, 5개의 튜브가 있으며, 비디오 카드 케이스 아래에 하나만 숨겨져 있습니다. 보드 뒷면은 특별하지 않습니다. 우리가 관심을 갖는 유일한 칩은 비디오 어댑터의 전원 관리를 담당하는 CHL8266이라고 표시된 칩입니다. 이 마이크로 회로의 기능을 사용하여 특수 유틸리티를 사용하여 GPU에 공급되는 전압을 수동으로 조정할 수 있습니다.

NVIDIA GeForce GTX 480 - 제국의 역습!

루머와 추측 끝! Fermi 아키텍처를 기반으로 하는 최신 NVIDIA 그래픽 카드가 마침내 공식적으로 발표되었습니다. 그들이 무엇이며 가장 강력한 3D 그래픽 가속기의 왕관을위한 싸움에서 보여줄 전투 특성을 알아낼 때입니다.

⇣ 콘텐츠

우리 주변의 모든 사건은 주기적으로 발전하고 일부 변화와 함께 시간이 지남에 따라 반드시 반복된다는 의견이 있습니다. Fermi 그래픽 아키텍처와 이를 기반으로 하는 비디오 칩 주변의 사건 전개를 살펴보면, 이 말의 타당성을 무의식적으로 확신하게 됩니다. 사실은 GPU Fermi를 기반으로 한 비디오 카드를 시장에 출시할 때 NVIDIA가 현재 직면한 문제의 결과는 3년 전 AMD의 주력 솔루션인 Radeon HD 2900 XT 비디오 카드를 중심으로 발전된 상황을 매우 연상시킵니다. . 그렇게 되었어요. 2006년 말, NVIDIA는 GeForce 비디오 카드의 8세대를 출시했습니다. 이 라인의 주력은 당시 AMD의 최고 모델인 Radeon X1900 XTX보다 성능과 제조 가능성 면에서 훨씬 앞서 있던 강력한 가속기 NVIDIA GeForce 8800 GTX였습니다. NVIDIA와 성공적으로 경쟁하기 위해 AMD는 새로운 최고급 가속기를 만들어야 했지만 일련의 기술적인 문제로 인해 새로운 Radeon HD 2900 XT가 약 반년 정도 늦게 출시되었습니다. 2009년 말 NVIDIA에서도 비슷한 상황이 발생했습니다. AMD Radeon HD 5xxx 제품군의 첫 번째 가속기인 Radeon HD 5870의 출시로 NVIDIA는 단일 칩 Hi-End 솔루션 중 "리더의 저지"를 잃었고, AMD 그래픽 가속기 라인이 확장되면서 시작되었습니다. 데스크탑 시장의 거의 모든 부문에서 입지를 잃습니다. 그리고 6개월이 지난 지금, NVIDIA는 마침내 새로운 아키텍처의 충분한 수의 그래픽 칩을 생산할 수 있게 되었습니다. 2010년 3월 26일 오늘, 최신 그래픽 가속기 NVIDIA GeForce GTX 470 및 GeForce GTX 480이 발표되었으며 이러한 비디오 카드 중 가장 오래된 것이 우리의 세심한 관심의 대상이 되었습니다. 얼마 전에 우리는 이미 Fermi 아키텍처의 기능에 대한 자료를 게시했으므로 이제 이미 말한 것을 반복하지 않고 그 이후로 변경된 사항에 대해서만 이야기할 것입니다. 예상과 달리 NVIDIA GeForce GTX 480 제품군의 시니어 액셀러레이터는 이전에 언급한 대로 512개의 CUDA 코어가 아니라 480개만 받았습니다. 또한 변경 사항은 텍스처 단위에 영향을 미치며 이전에 발표된 64개 대신 60개입니다. 그러나 모든 48개 유닛 ROP와 384비트의 약속된 메모리 버스 폭은 그대로 유지되었습니다. 새로운 NVIDIA GeForce GTX 470 및 GTX 480 가속기의 특성에 대한 자세한 내용은 다음 표를 참조하십시오.

	지포스 GTX 285	지포스 GTX 470	지포스 GTX 480
GPU 제조 공정, nm	55	40	40
그래픽 처리 클러스터, PC		4	4
스트리밍 멀티프로세서의 수		14	15
CUDA 코어 수	240	448	480
텍스처 블록의 수	80	56	60
ROP 수	32	40	48
GPU 주파수, MHz	648	607	700
CUDA 코어의 주파수, MHz	1476	1215	1401
유효 비디오 메모리 주파수, MHz	2484	3348	3696
비디오 메모리 크기, Mb	1024	1280	1536
메모리 버스 너비, 비트	512	320	384
비디오 메모리 대역폭, GB/s	159	133.9	177.4
다이렉트X 지원	10	11	11
최대 TDP, W	183	215	250
권장 PSU 전원, W	550	550	600
GPU 온도 제한, °C	105	105	105
발표 당시 권장소비자가격, USD	399	349	499

이 표는 GeForce GTX 480이 거의 모든 특성에서 이전 최고 모델인 GeForce GTX 285보다 훨씬 우수함을 보여줍니다. 특히 주목할 가치가 있는 것은 두 배의 CUDA 코어이며, 이는 의심할 여지 없이 복잡한 셰이더의 속도에 긍정적인 영향을 미칠 것입니다. 또한 새로운 NVIDIA 가속기는 오랫동안 기다려온 DirectX 11 지원을 받았습니다. 또한 GeForce GTX 470/480은 ATI Eyefinity와 유사한 NVIDIA Surround라는 기술을 지원합니다. NVIDIA Surround를 사용하면 3개의 모니터를 단일 작업 공간으로 동시에 사용할 수 있습니다. 그러나 가상 세계에 완전히 몰입할 수 있는 기술 버전을 구현하는 데 있어 캘리포니아 주민들은 더 나아가 NVIDIA 3D Vision Surround라고 하는 NVIDIA 3D Vision과 NVIDIA Surround의 "기술적 혼합"을 만들기로 결정했습니다. 이 "칵테일"의 본질은 세 개의 모니터와 3D Vision 안경을 동시에 사용하여 존재감의 최대 효과를 만들 수 있다는 것입니다. 그러나 우리는 향후 자료에서 이에 대해 더 많이 이야기할 것입니다. 자, 최신 액셀러레이터에 대해 더 자세히 알아가야 할 때입니다. NVIDIA GeForce GTX 480을 만나보세요!

⇡ 외모. 설계. 특색

GeForce GTX 480이 출시되기 훨씬 전에 GeForce GTX 480과 유사한 비디오 카드의 사진이 다양한 인터넷 리소스 페이지에 나타났지만 발표 전에야 새로운 NVIDIA 플래그십의 실제 사진을 볼 수 있었습니다. 그래서 이전에 NVIDIA GeForce GTX 480의 참고 샘플입니다. 플라스틱 케이스는 이미 친숙한 스타일로 만들어졌지만 이전 세대의 솔루션과 달리 GTX 480에서는 전면의 절반 정도만 덮고 있습니다. 비디오 카드이고 두 번째 카드는 GeForce가 새겨진 금속 방열판으로 채워져 있습니다. 플라스틱 케이스 상부에는 4개의 히트파이프(총 5개)가 돌출되어 있으며, 터미널 패널 가까이에는 가열된 공기의 일부를 제거하기 위한 환기 슬롯이 있습니다. GeForce GTX 480의 길이는 27cm인 반면 Radeon HD 5870의 길이는 PCB 너머로 돌출된 냉각 시스템으로 인해 약 2cm 더 깁니다. GeForce GTX 480 그래픽 카드가 작동하려면 2개의 PCI-Express 전원 커넥터가 필요합니다. 하나는 6핀이고 다른 하나는 8핀입니다. GeForce GTX 480의 출력 패널에는 2개의 DVI 커넥터와 1개의 HDMI 포트가 있습니다. 시스템 장치 외부의 뜨거운 공기를 제거하기 위한 통풍구도 있습니다. 우리는 냉각 시스템을 분해합니다. GeForce GTX 480 쿨러는 13개의 나사로 PCB에 부착됩니다. 라디에이터와 보드의 전원 하위 시스템 요소 및 비디오 메모리 칩과의 접촉은 특수 열 패드를 통해 수행됩니다. 그래픽 칩은 얇은 열 페이스트 층을 통해 방열판과 접촉합니다. 메모리 칩과 전원 시스템 요소가 접촉하는 금속판은 플라스틱 래치를 사용하여 GeForce GTX 480 냉각 시스템의 케이스에 부착됩니다. 플레이트의 "꼬리" 부분에는 라디에이터 핀을 통과하고 시스템 장치 외부로 배출되는 공기 흐름을 펌핑하는 터빈이 있습니다. GeForce GTX 480의 가장 뜨거운 요소는 GPU입니다. 냉각을 위해 직접 접촉 기술을 사용하여 만든 5개의 히트 파이프가 있는 라디에이터가 사용됩니다. 얇은 열 페이스트 층을 통과하는 5개의 모든 튜브는 그래픽 코어를 보호하는 금속 덮개와 접촉합니다. GPU 전원 시스템은 6단계를 사용하며 CHL8266 PWM 컨트롤러를 기반으로 합니다. 불행히도 제조업체 웹 사이트에서 해당 문서를 찾을 수 없습니다. 하나의 패키지로 조립되는 볼테라의 파워 소자와 달리 지포스 GTX 480 파워 서브시스템의 파워 소자는 개별 회로에 따라 만들어집니다. 각 전원 위상에 대해 3개의 트랜지스터가 있습니다(상단 암에 1개, 하단 암에 2개). 이 접근 방식을 사용하면 전원 하위 시스템의 요소에서 열을 더 잘 제거할 수 있습니다. 비디오 메모리 전원 공급 시스템은 2상입니다. PWM 메모리 컨트롤러 uP6210AG를 표시합니다.

우리는 열 페이스트 층을 제거했습니다. 여기에는 방열판 역할도 하는 보호 금속 덮개로 덮인 NVIDIA GF100 GPU가 있습니다. 칩 마킹(GF100-375-A3)으로 판단하면 페르미 아키텍처 기반 GPU 3차 개정판 출시와 함께 최고 가속기 양산이 시작됐다.

AMD는 오랫동안 그래픽 카드에 GDDR-5 비디오 메모리를 설치해 왔으며 대부분의 NVIDIA 솔루션은 GDDR-3 메모리와 함께 작동합니다. 새로운 GeForce GTX 470/480 가속기는 마침내 고급 메모리도 장착합니다. GeForce GTX 480 사본에는 K4G10325FE-HC04로 표시된 Samsung 비디오 메모리가 있습니다. 액세스 시간은 0.4ns이고 공칭 유효 주파수는 5GHz QDR입니다. 자, GeForce GTX 480의 외부 검사가 끝났습니다. 이제 새로운 항목에 대한 실제 테스트로 넘어갈 때입니다.

시험대

이 리뷰의 모든 비디오 카드 테스트는 다음 구성의 스탠드에서 수행되었습니다.

CPU	Intel Core i7 870 @ 4.0GHz(182x22)
CPU 냉각 시스템	Glacialtech F101 + 2x120mm 팬
마더보드	ASUS 막시무스 III 익스트림
램	슈퍼 탤런트 DDR3@1890
HDD	삼성 스핀포인트 750GB
전원 공급 장치	IKONIK 발칸 1200W
액자	Cooler Master 테스트 벤치 1.0용 베이스
운영 체제	마이크로소프트 윈도우 7 x64 얼티밋
드라이버 버전:	ForceWare 197.17 드라이버는 NVIDIA 그래픽 카드에 사용되었습니다. AMD 그래픽 카드는 Catalyst 10.3a 미리보기 드라이버를 사용했습니다.

다음 비디오 카드가 테스트에 참여했습니다.

AMD 라데온 HD 4890
AMD 라데온 HD 5870
AMD 라데온 HD 5970
엔비디아 지포스 GTX 260
엔비디아 지포스 GTX 285
엔비디아 지포스 GTX 295
엔비디아 지포스 GTX 480

물론 이 리뷰의 주요 목표는 새로운 NVIDIA 그래픽 가속기에 대해 알아보고 소비자 품질을 평가하는 것입니다. 또한 이전 세대 솔루션 소유자를 위한 새 비디오 카드로의 전환 가능성도 모색할 것입니다. 그렇기 때문에 우리의 검토에서 GeForce GTX 480의 직접적인 경쟁자(AMD Radeon HD 5870 비디오 카드, 지난 몇 년 동안의 베스트셀러인 Radeon HD 4890, GeForce GTX 260 및 물론 최고의 NVIDIA 가속기) 외에도 과거 세대의 사람들도 테스트에 참여하십시오.

오버클럭에 대한 몇 마디

주요 테스트 대상에 대한 자료에서는 일반적으로 공칭 주파수에서 얻은 결과와 오버클럭 후 성능 측정을 모두 표시합니다. 불행히도 이번에는 기존 유틸리티 중 어느 것도 GeForce GTX 480을 오버클럭할 수 없기 때문에 공칭 주파수에 비해 주파수가 증가한 테스트는 없을 것입니다. NVIDIA 시스템 도구나 MSI Afterburner는 아직 이 비디오 카드의 주파수를 명사 같은. 또한 진단 및 오버클러킹 유틸리티의 기존 공개 버전은 판독이 혼동됩니다.

그리고 작성 당시 공개 다운로드가 불가능했던 GPU-Z의 새 버전만이 새로운 GeForce GTX 480 가속기의 모든 특성을 정확하게 결정할 수 있었습니다.

GPU-Z 유틸리티의 스크린샷은 공칭 주파수에서 작동하는 SLI 모드의 GeForce GTX 480 비디오 카드 2개가 있는 시스템에서 촬영되었습니다.

⇡ 테스트 앱 및 테스트 모드

NVIDIA GeForce GTX 480 GPU의 온도와 테스트 시스템의 전체 전력 소비는 세 가지 모드로 측정되었습니다.

게임 테스트는 다음 설정으로 수행되었습니다.

	허가	화질 옵션
3D 마크 밴티지		성능, 높음, 극한
스토커: 프리피야트의 부름. 선샤프트 스테이지	1680x1050, 1920x1200	DX10/10.1, 최대 디테일, 4xAA/16xAF, 리얼 섀도우, DX 11, 최대 디테일, 테셀레이션 없음, 4xAA/16xAF, 실제 그림자
콜린 MCRae DiRT 2	1680x1050, 1920x1200	DX 9 울트라 디테일, 4xAA/16xAF; DX 11 울트라 디테일, 4xAA/16xAF
유니진 헤븐 1.0	1680x1050, 1920x1200	DX10, 하이 디테일, 4xAA/16xAF; DX11, 하이 디테일, 테셀레이션 끄기, 4xAA/16xAF
FarCry2 DirectX 10 벤치마크	1680x1050, 1920x1200	DX10, 매우 높음 사전 설정, 4xAA/16xAF
레지던트 이블 5 DirectX 10 벤치마크	1680x1050, 1920x1200	DX10, 하이 디테일, 4xAA/16xAF
크라이시스 v 1.2 x64	1680x1050, 1920x1200	DX10, 매우 높음, 4xAA/16xAF

NVIDIA 그래픽 카드 드라이버에서 PhysX가 비활성화되었습니다. NVIDIA GeForce GTX 480에 대한 이 리뷰는 새로운 NVIDIA 플래그십의 기능에 대한 첫 번째 테스트이지만 결코 마지막 테스트는 아닙니다. 이번에는 테스트 모드를 선택할 때 "클래식" 모드에서 신제품의 성능 테스트를 중단했습니다. 테셀레이션이 활성화된 상태에서 성능을 비교하고, 보다 복잡한 앤티앨리어싱 알고리즘의 속도와 품질을 평가하고, 새로운 플래그십 SLI 번들의 성능을 연구하는 것은 향후 검토 주제입니다. 그럼 숫자로 넘어갑시다.

⇡ 테스트

온도 조건

우선, 다양한 작동 모드에서 NVIDIA GF100 GPU의 온도가 어떤지 알아내고 이 수치를 나머지 테스트 참가자의 결과와 비교합니다. 모든 테스트 비디오 카드는 참조 CO로 냉각되었습니다. 유일한 예외는 ASUS ENGTX260 Matrix 비디오 카드로 대표되는 NVIDIA GeForce GTX 260 보드였습니다.

사무용 애플리케이션으로 작업할 때 GeForce GTX 480 GPU 및 비디오 메모리의 주파수가 크게 감소했음에도 불구하고 GF100의 온도는 Radeon HD 4890보다 훨씬 높아 상당히 높습니다. 동시에 소음 GeForce GTX 480 터빈의 소리는 열린 스탠드에서도 들리지 않습니다.

FarCry2 게임에서 GeForce GTX 480 GPU의 온도는 "인상적"입니다. 우리 연구실에서 처음으로 단일 칩 비디오 카드의 오버클럭되지 않은 GPU가 게임에서 매우 따뜻해졌습니다. 이 모드에서는 터빈의 속도가 증가하고 소음은 이미 나머지 구성 요소와 명확하게 구별됩니다.

GeForce GTX 480 가속기의 최대 부하로 인해 GPU 온도가 섭씨 97도까지 상승합니다! 이러한 온도 값에 도달하는 즉시 터빈이 최대 속도로 작동하기 시작하므로 그래픽 프로세서가 매우 빨리 냉각됩니다. 우리의 경우 온도가 91도까지 떨어졌고 전체 테스트 동안 더 높아지지 않았으며 터빈 속도는 감소하지 않았습니다. 새로운 단일 칩 플래그십 NVIDIA가 GPU 발열 측면에서 이전 세대의 NVIDIA의 2칩 최상위 모델인 GeForce GTX 295 비디오 카드조차 능가했기 때문에 결과에 대해 다소 낙담했다고 말해야 합니다. 예, NVIDIA 자체에서 제공한 문서에 따르면 GeForce GTX 480 GPU의 온도는 최대 섭씨 105도까지 허용됩니다. 그러나 시스템 장치 내부에는 비디오 카드 외에도 컴퓨터 내부에 안전한 온도 값을 유지해야 하는 다른 시스템 구성 요소가 있습니다. GeForce GTX 480의 미래 소유자는 케이스 내부의 고품질 환기 구성을 진지하게 고려하는 것이 좋습니다. 불 없이는 연기도 없다는 속담처럼. NVIDIA와 AMD의 다른 비디오 카드를 사용하는 테스트 벤치에서 얼마나 많은 전력이 소비되는지 봅시다.

부하가 없을 때 GeForce GTX 480 가속기가 설치된 시스템은 NVIDIA GeForce GTX 295 그래픽 카드가 설치된 동일한 시스템과 거의 동일한 양의 전력을 소비합니다.AMD 진영의 직접적인 경쟁자가 더 경제적인 솔루션으로 판명되었습니다. AMD Radeon HD 5870 그래픽 카드가 테스트 벤치에 설치된 경우 시스템은 GeForce GTX 480보다 약 30-35와트를 덜 소모합니다.

FarCry2를 플레이하고 FurMark 1.8.0 테스트를 사용하여 생성된 최대 부하 모드에서 GeForce GTX 480 그래픽 카드가 설치된 시스템은 GeForce GTX 295를 포함한 다른 모든 참가자보다 성능이 뛰어났습니다. AMD가 있는 시스템의 전력 소비 차이 Radeon HD 그래픽 카드 5870 및 NVIDIA GeForce GTX 480이 설치된 시스템은 약 110-130W이며 캘리포니아 사람들의 아이디어에 유리하지 않습니다. 시스템 전력 소비 및 GPU 가열 테스트가 GeForce GTX 480을 선호하는 것은 아닙니다. 그러나 최고의 솔루션을 구매하는 사람들이 항상 이러한 매개변수를 보는 것은 아닙니다. 플래그십 솔루션은 무엇보다도 기술적으로 가능한 한 발전되어야 하고 가장 중요하게는 생산적이어야 합니다. 최신 기술의 지원으로 NVIDIA GeForce GTX 480은 완벽하지만 이제 성능을 평가하겠습니다. 먼저 합성 테스트의 성능 지표를 살펴보겠습니다.

성능 프로필을 사용하여 3DMark Vantage에서 GeForce GTX 480을 테스트하면 GeForce GTX 285보다 25% 향상된 성능을 보여줍니다. 동시에 우리는 새로운 NVIDIA 플래그십과 주요 경쟁자 AMD Radeon HD 5870 사이의 격차를 기록했으며 결과의 차이는 약 6%입니다.

부하가 증가함에 따라 AMD Radeon HD 5870 그래픽 카드는 조금씩 입지를 잃기 시작합니다. High 모드에서 GeForce GTX 480과의 격차는 더 이상 Performance 모드에서처럼 눈에 띄지 않으며 Extreme 프로필로 전환하면서 새로운 NVIDIA 플래그십이 앞서 나가 GeForce GTX 295도 추월합니다. . 출시 직후 인기를 얻은 또 다른 합성 테스트 패키지는 Unigine Heaven v 1.0입니다.

NVIDIA GeForce GTX 480 비디오 카드는 주요 경쟁업체인 Radeon HD 5870을 능가합니다. 포인트의 이점은 1680x1050 및 1920x1200 모두에서 NVIDIA 측에 있습니다. NVIDIA 라인업 내에서 힘의 정렬은 다음과 같습니다. GeForce GTX 480 가속기는 성능 측면에서 GeForce GTX 295와 GeForce GTX 285 사이에 있으며 "295번째"에 뒤지고 이전 세대의 단일 칩 상단을 능가합니다. 약 20%.

테셀레이션 활성화 없이 DirectX 11에서 테스트하면 DirectX 10 모드에서 테스트한 것과 거의 동일한 결과가 나타납니다. 두 해상도 모두에서 GeForce GTX 480이 승점 면에서 승리합니다. AMD Radeon HD 5970은 여전히 경쟁에서 벗어납니다. 합성 테스트를 통해 우리는 단지 제시할 수 있습니다. 거의 항상 "합성"이 실제 게임에서 사용되는 엔진이 아닌 다른 엔진에서 작동하기 때문에 비디오 카드 성능의 대략적인 수준입니다. 그렇기 때문에 그러한 테스트의 결과는 신중하게 신뢰해야 합니다. 실제 게임에서 테스트를 진행해 보겠습니다.

FarCry 2 DirectX 10 Benchmark에서 얻은 GeForce GTX 480의 결과를 보면 "우리가 기다리던 것입니다!"라고 외치고 싶습니다. 새로운 NVIDIA 플래그십은 주요 경쟁자 AMD Radeon HD 5870을 크게 능가했으며 Radeon HD 5970의 결과에 매우 근접했습니다. 최소 및 평균 프레임 속도 측면에서 GeForce GTX 480과 Radeon HD 5870의 차이 , 약 25-30fps입니다. 이전 세대 GeForce GTX 285의 단일 칩 플래그십과 비교하여 NVIDIA의 신제품은 거의 두 배 빠른 것으로 나타났습니다! NVIDIA GeForce GTX 295와의 대결에 관해서는 "노인"도 FarCry 2에서 좋지 않았고 GeForce GTX 480이 선두를 차지했습니다.

오래되었지만 덜 기술적인 슈팅 게임인 Crysis v 1.2 x64는 GeForce GTX 480과 AMD Radeon HD 5870 간의 싸움에서 명확한 리더를 나타내지 않습니다. 이러한 가속기는 실제로 정면돌파입니다. 그러나 "전우들" 사이에서 GeForce GTX 480은 앞서가고 있습니다. 이 차이는 특히 최고 해상도에서 두드러집니다. 이 싸움에서 AMD Radeon HD 4890, GeForce GTX 260, 심지어 GeForce GTX 285도 "가난한 친척"처럼 보입니다. 왜냐하면 현대 하이엔드 솔루션의 배경에 대해 적절한 결과를 보여줄 수 없기 때문입니다.

Colin McRae DiRT 2에서는 모든 NVIDIA 솔루션이 우수한 결과를 보여줍니다. 여기서 AMD Radeon HD 5970은 더 이상 절대적인 리더가 아닙니다. 1920x1200에서 GeForce GTX 295는 차이가 약 1-2fps이지만 이전 AMD 가속기를 약간 능가할 수 있었습니다. GeForce GTX 480과 AMD Radeon HD 5870의 대결은 GeForce의 승리로 끝났습니다. 1680x1050에서 성능 차이는 평균 및 최소 프레임 속도 모두에서 약 20fps입니다. 해상도가 높아짐에 따라 AMD Radeon HD 5870은 격차를 눈에 띄게 좁히지만 새로운 NVIDIA 플래그십은 여전히 앞서 있습니다. DiRT 2에서 GeForce GTX 285와 GeForce GTX 480 사이의 격차는 이전에 테스트한 게임만큼 크지 않습니다. 여기에서 이전 세대의 플래그십은 모든 해상도에서 편안한 게임을하기에 충분한 우수한 성능을 보여줍니다.

DirectX 9에서 DirectX 11로 이동할 때 테스트한 모든 가속기의 결과가 감소했습니다. 그럼에도 불구하고 최대 해상도에서도 Radeon HD 5870과 GeForce GTX 480 모두에서 Colin McRae DiRT 2를 플레이하는 것은 편안합니다. 1920x1200 해상도. 모든 해상도의 챔피언은 여전히 Radeon HD 5970입니다.

S.T.A.L.K.E.R.: Call of Pripyat 게임에서 최신 가속기의 기능을 시연할 때입니다. 먼저, 최고의 가속기 AMD Radeon HD 5870 및 AMD Radeon HD 5970의 완전하고 무조건적인 리더십에 주목하고 싶습니다. 주요 경쟁자 AMD Radeon HD 5870과 NVIDIA GeForce GTX 480 간의 결과 차이는 실제로 두 배입니다! 솔직히 말해서, 그것은 매우 이상하게 보입니다. Stalker의 또 다른 이상한 점은 멀티 칩 탠덤에 대한 게임 엔진의 태도입니다. GeForce GTX 295는 최소 fps 측면에서 GeForce GTX 285보다 뒤떨어지며, 마찬가지로 Radeon HD 5970은 Radeon HD 5870보다 뒤쳐집니다.

1680x1050에서 S.T.A.L.K.E.R. 두 개의 최고의 AMD 가속기에서 편안하게 재생할 수 있도록 한 다음 해상도를 1920x1200으로 높이면 Radeon HD 5870의 최소 및 평균 프레임 속도가 재생이 매우 편안하지 않은 값으로 감소했습니다. Radeon HD 5970 가속기는 여전히 자체적으로 유지되고 있지만 프레임 속도가 24fps로 떨어지는 것은 기쁨을 가져다주지 않습니다. 리뷰의 주인공인 지포스 GTX 480은 고해상도로 전환해도 기세를 잃지 않고 오히려 추가돼 라데온 HD 5870과 거의 같은 최소 fps 값을 보였다.

DirectX 11로의 전환은 테스트 참가자의 성능에 부정적인 영향을 미치지 않았습니다. GeForce GTX 480 가속기는 Radeon HD 5870과 거의 동등한 성능을 보이며 1fps라는 상징적인 양만큼 약간 뒤쳐져 있습니다. 이전과 마찬가지로 AMD Radeon HD 5970이 선두를 달리고 있습니다.

마지막으로 레지던트 이블 5에서 GeForce GTX 480이 무엇을 할 수 있는지 확인해 보겠습니다. NVIDIA의 신제품은 Radeon HD 5870을 쉽게 능가하며 해상도에 따라 15-20fps로 상대방과 떨어져 있습니다. 일반적으로 GeForce GTX 480의 성능은 업계에서 오래된 NVIDIA GeForce GTX 285는 말할 것도 없고 GeForce GTX 295보다 훨씬 뛰어납니다.

⇡ 결론

요약하면 몇 가지 사항에 대해 이야기하고 싶습니다. 우선, 지원되는 기술 측면에서 NVIDIA와 AMD 비디오 카드 간의 Hi-End 세그먼트의 패리티가 복원되었다는 점에 주목할 가치가 있습니다. 더욱이 어떤 의미에서는 DirectX 11, Direct Compute 5, OpenCL 등을 비롯한 모든 최신 NVIDIA 가속기가 컴퓨터 게임을 포함한 응용 프로그램의 수 . 그러나 더 넓게 보면 NVIDIA는 많은 작업을 수행해야 합니다. 다른 시장 부문에서 AMD는 제조 가능성 측면에서 NVIDIA를 능가하는 솔루션을 많이 보유하고 있기 때문입니다. NVIDIA의 Hi-End 가속기에 대한 전력 소비 및 열 발산 문제는 여전히 해결되지 않았습니다. GeForce 라인의 주력 제품인 GeForce GTX 480 비디오 카드는 에너지 효율성 측면에서 Radeon HD 5870과 경쟁할 수 없을 뿐만 아니라 GeForce GTX 295도 이러한 지표에서 집니다! 성능에 대해 이야기하면 일반적으로 기본 모드에서 NVIDIA GeForce GTX 480 가속기가 주요 경쟁자 AMD Radeon HD 5870보다 빠른 것으로 판명되었습니다. 그러나 속도 이점을 살펴보면 일부 게임과 모드에서는 GeForce GTX 480에서 더 우월함을 기대했다고 말하고 싶습니다. 그럼에도 불구하고 성능 문제를 끝내기에는 아직 이르다. 곧 NVIDIA의 신제품과 AMD의 솔루션의 성능을 향상시키는 새로운 드라이버가 출시될 것입니다. 또한 더 무거운 그래픽 모드에서 두 회사의 최고 가속기를 테스트해야 합니다. 그러한 경쟁의 결과를 미리 예측하는 것은 거의 불가능하며 모든 것이 최신 GPU의 "안전 한계"에 달려 있습니다. 그러한 전투에서 누구의 건축이 미래를 위해 더 큰 예비를 가지고 있는지 분명해질 것입니다.

리소스 집약적인 동적 응용 프로그램을 좋아하는 사람이 게임 세계의 다음 참신함을 즐기고자 하는 경우 시스템 장치에 설치된 자신의 비디오 어댑터 기능에 대해 확실히 생각할 것입니다. 결국, 실습에서 알 수 있듯이 예산 장치와 초기 게임 클래스가 작업에 대처하는 것이 점점 더 어려워집니다. GTX 480 클래스의 고급 비디오 카드를 구입하고 5-10년 동안 자원 집약적인 장난감의 제동과 관련된 문제를 잊어버리는 방법밖에 없습니다. 기능, 리뷰, 리뷰 및 경쟁 제품과의 비교는 구매자가 올바른 선택을 하는 데 도움이 됩니다.

명세서

코드명 Fermi 및 레이블 GF100인 이 칩은 40nm 기술을 사용하여 제작되었으며, 이를 통해 제조업체는 칩에 더 많은 트랜지스터(32억 개)를 장착할 수 있을 뿐만 아니라 GeForce GTX 480 게임 장치의 전력 소비를 줄일 수 있습니다. 소산 특성은 250와트를 초과하지 않으며 이는 하이엔드 등급에 대한 우수한 지표입니다. 비디오 어댑터에는 4개의 그래픽 처리 클러스터가 장착되어 있으며 15개의 스트리밍 멀티프로세서와 480개의 CUDA 코어가 있습니다. 공장 버전의 그래픽 프로세서는 700MHz의 주파수에서 작동합니다. 비디오 메모리는 GDDR5 칩을 기반으로 하며 1.5GB의 용량을 가지며 384비트 버스에서 작동합니다. 유효 메모리 주파수는 3696MHz입니다.

지원되는 기술

게임 비디오 어댑터의 약한 링크는 DirectX 11 API 라이브러리에 대한 지원입니다.많은 잠재 구매자에게 GTX 480 칩이 포함된 제품의 일반적인 인상을 망치는 것은 이 특성입니다.장점에는 비디오 카드에 의한 버전 5.0 셰이더 지원이 포함됩니다 3D 가상화 작업을 담당하는 현대 기술의 도입(3D Vision, Blu Ray 3D 및 유사 제품).

Nvidia는 3D Surround 기술을 장치에 도입하여 매우 흥미로운 혁신을 이루었습니다. 제조업체는 이제 소유자가 비디오 카드에 3개의 장치를 연결하여 비디오를 표시하고 3D Vision 안경을 사용하여 이미지를 볼 수 있다고 주장합니다. 사실, 소유자의 피드백으로 판단하면 이 기술은 아직 완벽하지 않기 때문에 3D와 관련된 이러한 모든 새로운 개발은 구매자의 불만만 야기할 뿐입니다. 결국 아무도 사용되지 않을 기술에 대해 과도한 비용을 지불하고 싶어하지 않습니다.

그래픽 가속기의 잠재력 발휘

GTX 480 그래픽 가속기의 경우 전체 시스템의 성능 특성이 중요합니다. 우선, 하나의 플랫폼에 3GHz 이상의 주파수와 4개의 개별 코어가 있어야 하는 프로세서에 대해 이야기하고 있습니다. 제조업체 Nvidia는 프로모션 비디오에 각각 Intel Core I7(695 Extreme) 크리스탈을 사용하여 비디오 어댑터의 잠재력을 잠금 해제하기 위해 사용자는 동일한 성능의 프로세서를 가지고 있어야 합니다.

RAM에 대한 주장은 없지만 리뷰에서 사용자는 대부분의 최신 장난감에 최소 8GB가 필요하다고 확신합니다. 하드 드라이브의 경우 모든 것이 설명 없이 명확합니다. SSD 솔리드 스테이트 드라이브만이 전체 시스템에 적절한 성능을 제공할 수 있습니다. 전원 공급 장치에 문제가 있을 수 있습니다. 전문가들은 장치의 전력(최소 750W 이상이어야 함)이 아니라 강력한 12볼트 라인의 존재에 주의할 것을 권장합니다. 그렇지 않으면 정전으로 인해 소유자가 비디오 카드를 잃을 수 있습니다.

모바일 시장 대표

참고로 노트북은 GTX 480 칩을 기반으로 하는 수정된 그래픽 가속기를 사용하며, 개인용 컴퓨터용으로 제작된 개별 장치와는 특성이 크게 다릅니다. 첫째, 제조업체는 CUDA 코어 수를 480개에서 352개로 줄여 모바일 플랫폼의 전체 성능에 큰 영향을 미쳤습니다(합성 테스트로 테스트할 때 약 20% 감소). 제조업체는 또한 메모리 버스의 대역폭을 줄여 대부분의 중급 비디오 카드의 표준인 256비트로 제한했습니다.

최신 라이브러리에 대한 지원을 포함하여 관련된 기술에 관해서는 모든 것이 여기에서 변경되지 않았습니다. 당연히 대부분의 구매자는 3D 기능이 아니라 노트북의 성능에 관심이 있습니다. 따라서 이러한 변경 사항은 많은 사용자에게 눈에 띄지 않았으며 피드백으로 판단할 때 설치된 칩은 많은 구매자의 관심을 끌지 못할 것입니다.

날개 달린 그네

5세대 비디오 어댑터가 시장에 출시된 후 많은 매니아들이 서둘러 이전 클래스의 상위 장치와 비교하므로 미디어에서 가장 인기 있는 비교는 GTX 480 대 GTX 570입니다. 그들의 리뷰에서 많은 소유자는 4세대 그래픽 가속기는 Nvidia가 그들에게 정직하지 못했다는 것을 다른 사람들에게 확신시켜줍니다. 두 장치의 기술적 특성을 연구할 때 거의 동일하지만 비디오 카드 비용이 다르기 때문입니다(480 GTX가 더 비쌉니다).

놀랍게도 합성 벤치마크와 비교할 때 GTX 570은 4세대 플래그십을 능가합니다. 리소스 집약적인 다이내믹 게임에서 GTX 480 성능을 검토하면 상황이 급격하게 변하고 있다는 결론을 내릴 수 있습니다. 4세대 최고를 대표하는 GTA 5, Metro 2033, Dirt 2와 같은 애플리케이션 팬은 높은 프레임 속도로 최대 설정에서 게임을 즐길 수 있습니다. 그러나 GTX 570의 소유자는 고품질로만 응용 프로그램을 실행할 수 있습니다.

세대를 거쳐

GTX 480과 GTX 650의 비교는 테스트 없이 결과를 예측할 수 있다. 그러나 6세대의 마지막 대표자이지만 중급 게임 클래스에 속하며 플래그십 Nvidia 480 GTX에서 승리를 거머쥘 기회가 단 한 번도 없습니다. 합성 테스트에서 GTX 650은 적보다 최소 30~35% 낮은 성능을 보여줍니다.

사실, 리소스 집약적인 동적 게임에서는 메모리와 코어 모두에서 6세대 대표를 오버클럭하여 상황을 약간 수정할 수 있습니다. 매니아들의 평으로 판단하면 성능차이는 절반으로 줄어들 수 있습니다. 그러나 GTX 480 소유자가 오버클러킹을 통해 비디오 어댑터의 성능을 높이는 것을 귀찮게 하는 사람은 아무도 없지만 플래그십에는 잠재력이 있으며 저렴한 세그먼트의 대표자보다 훨씬 큽니다. 구매자가 그러한 선택에 직면했다면(480 GTX 또는 650 GTX 선택) 상대보다 몇 년 나이가 많더라도 Nvidia의 첫 번째 대표자가 선호됩니다.

명확한 우월성

4세대 플래그십을 비디오 카드 700시리즈 중급 게이밍 클래스 대표와 비교하는 것이 오히려 이상하게 보일 수도 있다. 그러나 GTX 480과 GTX 760의 두 가지 생산적인 장치를 비교하고 싶어하는 필사적인 사용자가 있습니다. 새로운 공정 기술(40에서 28나노미터)로의 전환 결과 7번째 시리즈는 합성 및 게임과 같은 모든 테스트에서 경쟁자를 매우 쉽게 능가할 것입니다.

그리고 제조업체가 하나의 GTX 760 1152 칩에 CUDA 프로세서를 배치했다는 점을 고려하면 모든 의심이 즉시 사라질 것입니다. 700번째 시리즈부터 Nvidia 그래픽 프로세서가 1000MHz의 심리적 장벽을 통과했으며 모든 비디오 카드에 최소 2GB의 메모리를 장착한다는 것을 잊지 마십시오. 확실히 그러한 비교에서 GTX 480의 대표자는 단순히 이길 가능성이 없습니다.

드디어

4세대 하이엔드 대표를 요약하자면 몇 가지 결론을 내릴 수 있다. 첫째, 이 비디오 어댑터의 소유자가 500번째 및 600번째 시리즈의 비디오 카드로 전환하는 것은 의미가 없습니다. 그러나 구매자가 7세대 그래픽 가속기를 선택하거나 GTX 480을 선호하는 선택에 직면하면 매니아가 수행한 소유자 리뷰와 많은 테스트에서 7세대 그래픽 카드를 구매할 것을 권장합니다.

최근까지 공식 NVIDIA 샘플 테스트를 기반으로 한 NVIDIA 및 GTX 470 기반 일련의 비디오 카드에 대한 첫 번째 프레젠테이션이 있었지만 이제야 그러한 그래픽 가속기가 매장 선반에 나타나기 시작했습니다. 물론 샘플과 연속 샘플의 동등성에 대한 음모는 남아 있습니다. 이것은 특히 라인의 플래그십인 NVIDIA 모델에서도 약간 제거된 버전의 GF100 칩(Fermi 디자인 기반 GPU)을 사용하기로 한 제조업체의 결정에 의해 뒷받침됩니다. 그러나 우리는 모든 것에 대해 순서대로 말하려고 노력할 것입니다.

NVIDIA 및 GTX470 그래픽 프로세서(비디오 카드)에 사용되는 Fermi 아키텍처 자체는 2009년 9월에 발표되었으며 불과 6개월 후에 사용자는 이점을 활용할 수 있었습니다. GF100 아키텍처 비디오 카드의 선언된 가격은 AMD의 단일 칩 플래그십보다 약간 높은 GTX 470의 경우 500달러 또는 350달러여야 합니다. 이 비디오 카드는 분명히 우리 시장에서 훨씬 더 비쌀 것입니다. AMD가 40nm TSMC 공정 기술을 사용하는 GPU 생산에서 관찰한 문제로 인해 시장에 DirectX 11을 지원하는 적절한 수의 고성능 제품을 제공할 수 없다는 점은 주목할 가치가 있습니다. GF100의 잠재력을 고려하면 GTX470 기반 비디오 카드로 시장에 보다 완전한 공급을 기대할 수 있습니다.

NVIDIA는 Fermi 아키텍처를 본질적으로 계산적인 것으로 정의하여 게임에서 3D 그래픽을 가속화하는 GPU의 전통적인 역할을 백그라운드로 격하했습니다. Fermi 아키텍처는 성능이 요구되는 시스템에 사용되는 Tesla 컴퓨팅 카드 라인의 일관된 개발입니다. 이 사실은 오류 수정(ECC) 메모리 지원과 향상된 배정밀도 성능으로 확인됩니다. 일부 기술 작업을 병렬로 실행함으로써 얻을 수 있는 잠재적인 이득은 엄청나며 소프트웨어 개발에 대한 NVIDIA의 투자는 이 성장하는 시장에서 AMD와 Intel보다 상당한 우위를 점하게 되었습니다.

엔비디아 페르미(GF100)

새로운 그래픽 카드의 계획된 기능은 GTX285와 같은 GT200 기반 그래픽 카드에 비해 플래그십 GF100 모델의 성능 잠재력을 두 배로 늘리는 것이었습니다. 그러나 이론이 항상 실천으로 이어지는 것은 아닙니다.

GF100 칩 자체에는 512개의 CUDA 코어가 있습니다(각각 4개의 스트리밍 멀티프로세서를 포함하고 각각 32개의 CUDA 코어를 포함하는 4개의 그래픽 처리 클러스터). 그러나 480개의 CUDA 코어만 남았습니다. 이는 원래 GF100 아키텍처보다 32개 적은 코어입니다. 이 단순화는 GF100에서 하나의 SM 다중 프로세서를 비활성화하여 이루어졌습니다. 이는 충분한 양의 본격적인 그래픽 프로세서를 얻을 수 없기 때문입니다.

차례로, 각 SM 멀티프로세서에는 자체 텍스처 유닛과 PolyMorph 엔진(향상된 지오메트리 계산 성능을 제공하는 고정 기능 로직)도 포함되어 있습니다. 결과적으로 64개의 텍스처 유닛 중 60개와 15개의 PolyMorph 엔진을 얻었습니다.

GPC 클러스터와 독립적인 GF100 파이프라인 부분에서는 NVIDIA에 대한 블록 종료가 없었습니다. ROP의 6개 섹션이 모두 여기에 남아 있습니다. 각 파티션은 한 번에 8개의 32비트 정수 픽셀을 출력할 수 있습니다. 즉, 클럭당 48픽셀을 얻을 수 있습니다. 모든 ROP 파티션이 있는 전체 GF100은 384비트 GDDR5 메모리 인터페이스(즉, 파티션당 64비트 인터페이스)를 지원합니다. GPU는 이러한 구성을 지원하며 인터페이스당 256MB의 메모리는 총 1.5GB의 GDDR5 메모리를 제공합니다(924MHz의 클럭 속도를 포함할 때 대역폭은 177GB/s임).

원래 칩의 이러한 모든 작업 용량 감소는 적절한 칩 수율에 대한 NVIDIA의 문제의 결과이지만 Hi-End 가속기 시장에 새로운 솔루션을 도입해야 할 필요성은 최소한 GF100 그래픽 프로세서 버전을 축소해야 했습니다. 페르미 아키텍처가 판매될 예정입니다. 그러나 결과가 무엇이든, 그것은 거기에 있으며 테스트하고 설명할 가치가 있습니다.

직렬 비디오 카드가 이 제조업체의 전형적인 상자 디자인으로 테스트 연구소에 왔습니다.

비디오 카드의 포장은 검은색과 노란색으로 디자인되어 있습니다. 판지 상자의 앞면에는 비디오 카드의 모델, 메모리 양, 유형 및 메모리 버스의 대역폭이 표시됩니다. NVIDIA PhysX 독점 기술에 대한 지원과 HDMI 커넥터의 존재에 대한 언급도 있습니다. 오른쪽 상단 모서리에서 제조업체는 NVIDIA CUDA, NVIDIA PureVideo HD, NVIDIA SLI와 같은 독점 기술의 지원에 주목합니다.

상자 뒷면에는 이 비디오 카드의 기능에 대한 간략한 개요가 있습니다. NVIDIA 3D Vision Surround 및 PhysX 기술 사용의 이점에 대해 설명합니다.

내부에는 비디오 카드 자체와 추가 전달 구성 요소가 있습니다. 그래픽 가속기와 함께 다음을 얻을 수 있습니다.

2개의 6핀 커넥터에서 1개의 8핀 PCI Express로 연결되는 비디오 카드 전원 어댑터;
2개의 MULEX 커넥터에서 1개의 6핀 PCI Express로 연결되는 비디오 카드 전원 어댑터,
DVI에서 VGA로의 어댑터;
Mini-HDMI에서 HDMI로의 어댑터;
사용자 매뉴얼;
소프트웨어 및 드라이버가 포함된 CD
이 비디오 카드의 모든 새로운 기능을 설명하는 데모 디스크입니다.

패키지에 포함된 전원 어댑터는 사용자가 비디오 카드를 연결하기 위한 적절한 커넥터와 함께 상당히 강력한 전원 공급 장치를 사용하도록 분명히 강요한다는 점에 주목하고 싶습니다. 이로 인해 구성을 선택할 때 몇 가지 문제가 발생할 수 있습니다. 일반적으로 장비는 최신 시스템 장치에 이 비디오 카드를 설치하는 모든 뉘앙스를 완전히 보상해야 합니다.

인쇄 회로 기판

비디오 카드 자체는 어두운 텍스타일라이트로 만들어졌으며 앞면은 어두운 플라스틱 케이스가 있는 냉각 시스템으로 닫혀 있습니다. 이 비디오 카드는 PCI Express 2.0 x16 버스를 지원하고 DirectX 11 Shader Model 5.0 및 OpenGL 3.2와 호환되며 NVIDIA PureVideo HD 기술, NVIDIA 3D Vision Surround, NVIDIA PhysX 기술, NVIDIA CUDA 기술 및 NVIDIA SLI 기술도 지원합니다.

비디오 카드의 인쇄 회로 기판의 뒷면은 훨씬 더 겸손해 보입니다. 여기서는 6단계를 사용하는 CHL8266 PWM 컨트롤러인 GPU 전원 시스템의 칩만 확인할 수 있습니다. 각 전원 위상에 대해 3개의 트랜지스터가 있습니다(상단 암에 1개, 하단 암에 2개). 이 접근 방식을 사용하면 전원 하위 시스템의 요소에서 열을 더 잘 제거할 수 있습니다. 두 번째 칩 uP6210AG는 NVIDIA의 그래픽 프로세서를 기반으로 하는 다른 비디오 카드의 독자들에게 이미 잘 알려져 있습니다. 이 비디오 카드의 메모리 칩에 2단계 전원을 제공합니다. 따라서 총 6 + 2 상 비디오 카드 전원 시스템을 얻습니다.

냉각 시스템을 살펴보면 이 비디오 카드가 "참조" 버전과 완전히 동일하다는 사실을 즉시 알 수 있습니다. 그래픽 카드는 Radeon HD 5870의 가속기보다 약 1센티미터 짧은 267mm(10.5인치) 인쇄 회로 기판을 사용하므로 거의 모든 최신 케이스에 맞을 수 있습니다.

PCI Express 버스 외에 추가 전원을 사용하려면 6핀 플러그 1개와 8핀 플러그 1개가 필요합니다. NVIDIA는 이 카드의 TDP가 250W라고 주장하며, 이는 PCI-SIG에서 설정한 300W 한도에 거의 맞지 않는 Radeon HD 5970보다 훨씬 낮습니다. 따라서 "상위" 솔루션의 경우 NVIDIA는 600W 이상의 전원 공급 장치를 권장합니다.

보드는 케이스 후면 패널에 있는 두 개의 슬롯을 차지합니다. 충분한 볼륨의 냉각 시스템을 위해 사용자는 케이스 내부의 공간을 확보해야 합니다.

인터페이스 패널에 2개의 DVI 포트와 1개의 미니 HDMI가 표시됩니다. 또한 두 번째 슬롯은 시스템 장치에서 가열된 공기를 내보내는 배기 그릴이 완전히 차지합니다.

냉각 시스템

비디오 카드 냉각 시스템을 자세히 살펴보겠습니다. "참조" 버전을 완전히 반복하고 NVIDIA 엔지니어는 가능한 한 효율적으로 만들려고 분명히 노력했지만 비디오 카드의 탐욕으로 인해 구성 요소의 결과 온도는 여전히 상당히 높은 수준으로 유지됩니다.

5개의 히트 파이프, 추가 열 제거 케이싱 및 터빈 자체의 공기 역학적 설계는 최대한의 사려 깊은 인상을 줍니다. 이것은 지금까지 우리가 본 모든 참조 설계 중 가장 효율적인 냉각 시스템 설계입니다. 측면 터빈에 의해 펌핑된 공기는 5개의 구리 튜브로 뚫린 알루미늄 라디에이터를 통과하여 케이스를 빠져 나옵니다.

이 디자인의 독특한 특징은 방열판의 측면 중 하나가 카드 케이스의 표면에 직접 위치하여 방열을 분명히 개선하지만 냉각 시스템의 우수한 가열로 인해 비디오 카드의 이 부분을 잡고 있다는 것입니다. 화상을 입을 수 있습니다.

여기서 주목할 만한 혁신은 GPU 및 메모리 칩의 표면에서 열을 제거하는 추가 방열판입니다. 공통 플레이트는 비디오 카드 보드의 상부를 덮고 전원 시스템의 메모리 칩과 트랜지스터에서 특수 열 인터페이스를 통해 열을 발산합니다.

냉각 시스템 테스트로 넘어 갑시다. 최대 부하에서 GPU 온도는 인상적인 101°C로 이 GPU의 임계 온도로 간주되지 않습니다. 동시에 냉각 시스템은 92%에서 작동하여 눈에 띄는 수준의 소음을 발생시켰습니다.

그리고 유휴 모드(2D 모드)에서 쿨러는 최대 용량의 44%로 작동합니다. 이 모드에서는 일반적인 노이즈 배경에서도 작업이 눈에 띕니다. 이 비디오 카드에 설치된 냉각 시스템은 정상적인 효율성을 제공하지만 비디오 카드의 GPU 요구 사항으로 인해 허용 가능한 온도를 제공하도록 분명히 강요합니다. 냉각 시스템의 소음은 분명히 비디오 카드의 부하에 따라 다르며 조용하다고 할 수 없습니다.

이제 비디오 카드의 기술적 특성에 대한 자세한 연구로 넘어 갑시다. 우선 테이블 형식으로 간략한 설명을 제공합니다.

여기에 설치된 NVIDIA GPU의 레이블은 GF100-375-A3입니다.

비디오 카드의 주파수 구성표 및 기타 특성은 다음과 같습니다.

이 샘플은 NVIDIA 가속기 "참조" 버전의 모든 특성을 완전히 반복합니다. ZT-40101-10P의 그래픽 프로세서는 각각 701MHz에서 작동하고 셰이더 도메인은 1401MHz에서 작동합니다. 비디오 메모리는 924MHz 실제 또는 3696MHz 유효 주파수를 수신했습니다.

테스트된 비디오 카드는 총 용량이 1536MB인 SAMSUNG에서 제조한 GDDR5 메모리 칩을 사용합니다. K4G10325FE-HC04 표시는 이러한 칩이 0.4ns의 액세스 시간을 제공한다는 것을 나타내며, 이는 유효 1250MHz 또는 5000MHz의 실제 주파수에 해당하며 오버클러킹을 위한 상당한 여유 공간을 제공합니다.

테스트

CPU	인텔 코어 2 쿼드 Q9550(LGA775, 2.83GHz, L2 12MB) @3.8GHz
마더보드	NForce 790i-Supreme(LGA775, nForce 790i Ultra SLI, DDR3, ATX) 기가바이트 GA-EP45T-DS3R(LGA775, 인텔 P45, DDR3, ATX)
쿨러	녹투아 NH-U12P(LGA775, 54.33CFM, 12.6-19.8dB) Thermalright SI-128(LGA775) + VIZO Starlet UVLED120(62.7 CFM, 31.1 dB)
추가 냉각	VIZO 프로펠러 PCL-201(+1 슬롯, 16.0-28.3 CFM, 20dB)
램	2x DDR3-1333 1024MB Kingston PC3-10600(KVR1333D3N9/1G)
하드 디스크	히타치 데스크스타 HDS721616PLA380(160GB, 16MB, SATA-300)
전원 공급 장치	시즈닉 M12D-850 (850W, 120mm, 20dB) 시즈닉 SS-650JT (650W, 120mm, 39.1dB)
액자	Spire SwordFin SP9007B(풀 타워) + Coolink SWiF 1202(120×120x25, 53 CFM, 24dB)
감시 장치	삼성 SyncMaster 757MB(DynaFlat, 2048× [이메일 보호됨] Hz, MPR II, TCO'99)

테스트 중에 비디오 카드가 현재까지 가장 강력한 단일 칩 그래픽 가속기의 상태를 확인한다는 것이 분명해졌습니다. NVIDIA의 GPU에 탑재된 신제품은 확실히 AMD 칩을 기반으로 하는 경쟁 제품보다 약간 빠르지만, 소비 전력과 작동 온도를 고려하면 노이즈가 증가하고 가격표를 보면 모호하지 않습니다. 균형 잡힌 솔루션. 또한 성능 면에서 Radeon HD 5970의 2칩 그래픽 가속기를 능가할 수 있는 NVIDIA 기반 2칩 버전을 만들 가능성에 대한 의구심이 있습니다.

오버클럭

이 비디오 카드의 오버클럭킹도 탁월하다고 할 수 없습니다. 칩 자체는 분명히 공칭 주파수보다 느리게 작동하지만 비디오 카드의 메모리를 오버클럭하는 데 거의 실패했습니다. 그러나 1.05V 전압의 GPU 자체는 770MHz로 오버클럭된 반면 코어 온도는 87°C였습니다. 하지만 오버클럭 시에는 비디오 카드의 상태가 쿨링 시스템 효율 테스트 때와 다른데, 특히 케이스의 측면 패널을 제거하고 비디오 카드 근처에 120mm 팬을 설치해 쿨링 상태를 약간 향상시켰고, 냉각기 자체는 지속적으로 100% 회전 속도로 작동했습니다. 공급 전압을 제어하는 소프트웨어 메커니즘을 가지고 실험을 계속했습니다. 1.075V를 인가했을 때 GPU는 784MHz까지 오버클럭이 가능했고 온도는 91°C까지 올라갔다. 최상의 결과는 GPU가 790MHz로 오버클럭할 수 있었을 때 1.1V에서 달성되었지만 이제 부하에서 온도가 99°C로 증가했습니다.

수동 가속이 성능에 미치는 영향을 살펴보겠습니다.

테스트 패키지		표준 주파수	오버클럭된 그래픽 카드	생산성 증가, %
	3D 마크 점수
	SM2.0 점수
	HDR/SM3.0 점수
	성능
심각한 Sam 2, 최대 품질, AA4x/AF16x, fps	1600×1200
심각한 Sam 2, 최대 품질, AA4x/AF16x, fps	2048×1536
먹이, 최대 품질, AA4x/AF16x, fps	1600×1200
먹이, 최대 품질, AA4x/AF16x, fps	2048×1536
Call Of Juarez, 최대 품질, AA/AF 없음, fps	1280×1024
	1600×1200
	2048×1536
Call Of Juarez, 최대 품질, AA4x/AF16x, fps	1280×1024
	1600×1200
	2048×1536
크라이시스, 최대 품질, AA/AF 없음, fps	1280×1024
	1600×1200
	2048×1536
크라이시스, 최대 품질, AA4x/AF16x, fps	1280×1024
	1600×1200
	2048×1536
크라이시스 탄두, 최대 품질, AA/AF 없음, fps	1280×1024
크라이시스 탄두, 최대 품질, AA/AF 없음, fps	1600×1200
크라이시스 탄두, 최대 품질, AA4x/AF16x, fps	1280×1024
크라이시스 탄두, 최대 품질, AA4x/AF16x, fps	1600×1200
Far Cry 2, 최대 품질, AA/AF 없음, fps	1280×1024
	1600×1200
	2048×1536
Far Cry 2, 최대 품질, AA4x/AF16x, fps	1280×1024
	1600×1200
	2048×1536

오버클럭으로 인한 증가는 다소 약하고, 오버클럭을 하지 않아도 비디오 카드의 최대 온도를 감안할 때 GPU의 냉각 효율을 높이려면 열심히 노력해야 하기 때문에 후자의 실효성이 의심된다. 그리고 공칭 주파수에서도 이 "최상급" 솔루션은 까다로운 사용자에게도 적절한 게임 성능을 제공할 수 있습니다.

결과

테스트된 ZT-40101-10P를 포함하여 NVIDIA GPU 기반 비디오 카드는 매우 생산적인 단일 칩 솔루션으로 판명되었습니다. 또한 Fermi 아키텍처가 사용된 GF100 GPU에는 처음에 512개의 스트리밍 코어가 있었지만 생산 중에 필요한 수의 칩을 얻는 데 몇 가지 문제가 있었기 때문에 "상위" 비디오 카드는 480개의 코어만 사용합니다. 그러나 충분히 높은 작동 주파수로 인해 가속기는 여전히 Radeon HD 5870 기반 경쟁사의 단일 칩 카드보다 일반적으로 더 빠른 것으로 밝혀졌지만 AMD의 2칩 솔루션인 Radeon HD 5970은 여전히 시장 리더.

그러나 NVIDIA의 단일 칩 "최고" GPU 기반 비디오 카드가 AMD 칩 기반의 해당 솔루션보다 성능이 우수하다면 전력 소비는 분명히 NVIDIA 카드의 장점이 아닙니다. 물론 많은 애호가에게는 이것이 선택 기준이 아니지만 에너지 소비의 증가가 전기 요금의 일부 증가로 이어지기 때문에 경우에 따라이 측면을 고려할 가치가 있습니다. 실제로 그래픽 가속기에 의해 소비되는 모든 에너지는 열의 형태로 소산되며, 이는 첨단 부품의 과열 및 고장을 피하기 위해 신속하게 제거되어야 하며, 이는 차례로 냉각 시스템의 복잡성을 초래하고 그 소음.