Сравнение на Geforce gtx 480. Преглед и тестване на NVIDIA GTX480

Nvidia GeForce GTX 480:

описание на видеокартата и резултати от синтетични тестове

Логично е да се каже, че картата изисква допълнително захранване, с два конектора, единият от които е 8-пинов, а вторият е 6-пинов. Ако няма проблем с последното, тъй като всички съвременни захранвания вече имат такива "опашки", тогава за захранване през 8-пинов конектор е необходим специален адаптер, който трябва да се доставя със серийни видеокарти.

Чипът е получен през четвъртата седмица на тази година, тоест в края на януари.

Относно охладителната система.

Nvidia Geforce GTX 480 1536MB PCI-E

По принцип охладителят не се различава от предишните решения на семейството GTX - цилиндричен вентилатор задвижва въздух през радиатора и отвежда топлината извън системния блок. Въпреки това, поради прекомерната консумация на енергия на новия продукт, а оттам и отоплението, CO е претърпял подобрения по отношение на подобряване на разсейването на топлината с помощта на топлинни тръби. Както виждаме, централният радиатор с тръби охлажда само сърцевината. Когато чиповете с памет се охлаждат от плоча, притисната към тях, разположена под корпуса.

Вероятно възможностите за търсене на COs от този тип вече са изчерпани, за да могат да се справят със силно нагрято ядро ​​без шум. Следователно трябва да кажем, че CO се оказа шумен. Дори в 2D режим охладителят работи на 44% от максимума, въпреки че по-рано тази цифра беше някъде около 20-25%. Шумът започва след 50%. Следователно охладителят работи на границата на звуковия шум и това е на празен ход! Какво да кажем за натоварването, когато CO започва постепенно да увеличава скоростта на въртене на турбината, като я довежда средно до 70-80%, когато картата работи в триизмерен режим.

Проведохме температурно проучване с помощта на помощната програма EVGA Precision (автор A. Nikolaychuk AKA Unwinder) и получихме следните резултати:

Nvidia Geforce GTX 480 1536MB PCI-E

И това не е изненадващо, тъй като нагряването на ядрото достига 95 градуса и дори такава висока цифра се постига с цената на много шумна работа на CO. Така че феновете на най-модерната и бърза 3D графика за игри ще трябва да забравят какво е тишина, когато играят игри или каквито и да било тестове. Дори в 2D, когато картата е заредена с всякакъв вид сложно съдържание (като флаш или видео), охладителят се чува доста.

Оборудване.

Това е референтен продукт, така че няма пакет или опаковка.

Сега да преминем към тестовете. Първо, показваме конфигурацията на тестовата стенда.

Инсталация и драйвери

Конфигурация на тестов стенд:

  • Компютър, базиран на Intel Core I7 CPU 920 (Socket 1366 LGA)
    • процесор Intel Core I7 CPU 920 (2667 MHz);
    • Asus P6T Deluxe дънна платка, базирана на чипсет Intel X58;
    • RAM 3 GB DDR3 SDRAM Corsair 1066MHz;
    • твърд диск WD Caviar SE WD1600JD 160GB SATA;
    • Tagan TG900-BZ 900W захранване.
  • операционна система Windows 7 32bit; DirectX11;
  • монитор Dell 3007WFP (30");
  • ATI драйвери версия CATALYST 10.3; Nvidia версия 197.17.

vsync е деактивиран.

Синтетични тестове

Пакетите за синтетични тестове, които използваме, могат да бъдат изтеглени от тук:

  • D3D RightMark Beta 4 (1050)с описание на сайта http://3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3— тестове на пикселни шейдъри версии 2.0 и 3.0 връзка.
  • RightMark3D 2.0с кратко описание: , .

Тъй като нямаме собствени синтетични DirectX 11 тестове, трябваше да използваме примери от различни SDK и демо програми. Първият е HDRToneMappingCS11.exe и NBodyGravityCS11.exe от DirectX SDK (февруари 2010 г.).

Взехме и по два примера от двата производителя: Nvidia и AMD, за да няма претенции за пристрастия от никого. Примерите за DetailTessellation11.exe и PNTriangles11.exe са взети от ATI Radeon SDK (между другото те също са в DX SDK). Е, Nvidia представи две демо програми: Realistic Character Hair и Realistic Water Terrain, които скоро трябва да бъдат достъпни за изтегляне на уебсайта на компанията.

Извършени са синтетични тестове на следните видео карти:

  • Geforce GTX 480 GTX 480)
  • Geforce GTX 295със стандартни параметри (по-нататък GTX 295)
  • Geforce GTX 285със стандартни параметри (по-нататък GTX 285)
  • Radeon HD 5970със стандартни параметри (по-нататък HD 5970)
  • Radeon HD 5870със стандартни параметри (по-нататък HD 5870)

За да се сравнят резултатите на новия модел Geforce GTX 480, тези видеокарти бяха избрани поради следните причини: Radeon HD 5870 и HD 5970 са най-продуктивните едночипови и двучипови модели от конкурентната компания AMD, с цени, близки до GTX 480. С решенията на Nvidia всичко е още по-просто: Geforce GTX 285 е най-продуктивната едночипова карта на GPU от предишното поколение, по нея ще съдим за архитектурните промени, а GTX 295 е най-мощната двучипова карта от Nvidia преди пускането на нови решения.

Direct3D 9: Тестове за запълване на пиксели

Тестът определя пиковата производителност на семплиране на текстура (тексели скорост) в режим FFP за различен брой текстури, приложени на пиксел:

Нашият тест е малко остарял и видеокартите в него не достигат теоретично възможните стойности, но все пак показва правилно пиковата скорост на текстуриране на видеокартите една спрямо друга. Както обикновено, резултатите от синтетиката не достигат пиковите стойности, оказва се, че GTX 480 избира до 40 тексела на цикъл от 32-битови текстури с билинейно филтриране в този тест, което е един и половина пъти по-ниско от теоретична цифра от 60 филтрирани тексела.

Това не е достатъчно, за да стигнете поне до GTX 285, който избира текстурни данни с 5-7% по-бързо. Да не говорим за изпреварването на конкурентния HD 5870, който е над 1,5 пъти по-бърз в почти всички режими, ако се съди по нашата DX9 синтетика. Картата Nvidia с двоен GPU очевидно стана жертва на софтуерни проблеми, но HD 5970 е дори по-мощен от HD 5870.

Разликата между GTX 480 и GTX 285 е почти винаги една и съща, освен в случаите с малък брой текстури, където ограничението в честотната лента на паметта е по-силно изразено. И HD 5870 не е толкова далеч напред в тези тестове. Но при 4-8 текстури разликата става по-голяма, което намеква за липсата на скорост на текстуриране на GF100, за да бъде винаги по-напред от конкурента в остарели приложения за игри. Нека разгледаме същите резултати в теста за запълване:

Вторият синтетичен тест показва скоростта на запълване и в него виждаме същата ситуация, но вече като се вземе предвид броят на пикселите, записани във фреймбуфера. Максималният резултат остава при решенията на AMD, които имат по-голям брой TMU и са по-ефективни при постигане на висока ефективност в нашия синтетичен тест. В случаите с 0-3 наслагващи текстури разликата между решенията е много по-малка, в такива режими производителността е ограничена преди всичко от честотната лента на паметта.

Direct3D 9: Сравнителни показатели за Pixel Shaders

Първата група пикселни шейдъри, които разглеждаме, е много проста за съвременните видеочипове, включва различни версии на пикселни програми с относително ниска сложност: 1.1, 1.4 и 2.0, намиращи се в старите игри.

Тестовете са много, много прости за съвременните архитектури и не показват всички възможности на съвременните графични процесори, но са интересни за оценка на баланса между извличане на текстура и математически изчисления, особено при смяна на архитектури, което се случи този път с Nvidia.

В тези тестове производителността е ограничена главно от скоростта на текстурните единици, но вече като се вземе предвид ефективността на блоковете и кеширането на текстурни данни в реални задачи. Нека да видим как се отразиха промените в архитектурата в сравнение с GT200? Ясно се вижда, че архитектурата се е променила и новата GTX 480 карта се представя по-добре от карта с един чип, базирана на предишната архитектура. Освен това в повечето тестове GTX 480 настига двучиповия GTX 295, което само по себе си не е лошо.

Пропускателната способност на паметта в тези тестове само леко ограничава новите решения, а скоростта зависи от текстурирането, което не позволява на базираната на GF100 карта да показва резултати дори на нивото на Radeon HD 5870, да не говорим за двойния GPU AMD решение. Видеокартите, базирани на чипове на Nvidia, явно изостават в този набор от тестове, което е сигнал за събуждане за другите ни тестове, където скоростта на текстуриране е важна. Нека да разгледаме резултатите от малко по-сложни пикселни програми на междинни версии:

При тестовете на пикселни шейдъри версия 2.a нещата са още по-лоши в сравнение със скоростта на конкурентите. Тестът за процедурно изобразяване на вода, зависещ от силно текстуриране, използва зависимо вземане на проби от текстури при високи нива на гнездене, а картите винаги са подредени според скоростта на текстуриране, но коригирани за различна ефективност на използване на TMU.

Картите, базирани на чипове RV870, показват максимални резултати, но скоростта на GTX 480 се оказа някъде между едночиповите и двучиповите модели на GPU от предишната архитектура. Слаб, разбира се, но поне по-бърз от GTX 285, което показва по-ефективно използване на наличните TMU.

Резултатите от втория тест са почти същите, въпреки че е по-интензивен от изчисления и винаги е бил по-подходящ за архитектурата на AMD, която има голям брой изчислителни единици. Съвременните решения на AMD са далеч напред тук, особено двучиповата версия.

GTX 480 превъзхожда GTX 285 само с 25% и изостава от модела с два чипа с почти същото количество. Това ясно показва ограничението на производителността на GTX 480 поради малкия брой TMU в сравнение с архитектурата от ново поколение. Опасенията ни се потвърждават под формата на основния недостатък на архитектурата GF100.

Direct3D 9: Тестове за Pixel Shaders 2.0

Тези тестове на DirectX 9 пикселни шейдъри са по-сложни от предишните, те са близки до това, което виждаме в момента в мултиплатформените игри и попадат в две категории. Нека започнем с по-простата версия 2.0 шейдъри:

  • Паралаксно картографиране- метод за нанасяне на текстури, познат от повечето съвременни игри, описан подробно в статията.
  • Замразено стъкло— сложна процедурна текстура на замразено стъкло с контролирани параметри.

Има два варианта на тези шейдъри: един, който е ориентиран към математиката, и този, който предпочита стойности за извадка от текстури. Помислете за математически интензивни опции, които са по-обещаващи по отношение на бъдещи приложения:

Това са универсални тестове, които зависят както от скоростта на ALU единиците, така и от скоростта на текстуриране; общият баланс на чипа е важен при тях. Вижда се, че производителността на видеокартите в теста Frozen Glass е ограничена не само от математиката, но и от скоростта на извличане на текстури. Ситуацията в него е подобна на това, което видяхме малко по-високо в Cook-Torrance, но новата GTX 480 този път е много по-близо до dual-GTX 295, базирана на GPU на старата архитектура на Nvidia. От друга страна, дори едночиповият HD 5870 все още е много напред.

Във втория тест „Parallax Mapping” резултатите отново са много сходни с предишните. Този път обаче HD 5870 не се откъсна от картите на Nvidia толкова, колкото при първия тест. Нека видим какво ще се случи след това, но игрите обикновено са по-многостранни от синтетичните и не почиват толкова ясно само на текстуриране. Но все пак за такива остарели задачи броят на текстурните модули в GF100 е очевидно недостатъчен. Нека разгледаме същите тестове в модификацията с предпочитание на проби от текстури към математически изчисления, за да се уверим накрая в нашите междинни заключения:

Картината е донякъде подобна, но AMD картите очевидно са по-добри в извличането на текстури, особено HD 5970 с два чипа е добър тук! Днешният герой под формата на GTX 480 отново показва среден резултат между GTX 285 и GTX 295, тъй като тук акцентът върху производителността в скоростта на текстурните единици е още по-ясно видим, а броят им в GF100 за новата мощна графична архитектура все още е очевидно недостатъчна.

Но това бяха остарели задачи, с акцент върху текстурирането и не особено трудни. А сега ще разгледаме резултатите от още два теста на пикселни шейдъри - версия 3.0, най-трудният от нашите тестове на пикселни шейдъри за Direct3D 9, който е много по-показателен от гледна точка на съвременните ексклузивни компютърни игри. Тестовете се различават по това, че зареждат по-силно както ALU, така и текстурни единици, и двете програми за шейдъри са сложни и дълги, включват голям брой клонове:

  • Картографиране на стръмния паралакс- много по-"тежка" версия на техниката за картографиране на паралакса, също описана в статията.
  • Козина- процедурен шейдър, който изобразява козина.

Най-накрая! Тук е съвсем друг въпрос. И двата PS 3.0 теста са много сложни, изобщо не зависят от честотната лента на паметта и текстурирането, те са чисто математически, но с много преходи и разклонения, с които новата архитектура GF100 изглежда се справя перфектно.

В тези тестове GTX 480 показва истинската си сила и превъзхожда всички решения с изключение на новия двоен чип от конкурент. Освен това GTX 295 е почти два пъти по-бавен в тези най-трудни тестове, а GTX 285 е дори три пъти по-бавен! Резултатите бяха ясно повлияни от архитектурните промени на новия графичен процесор, насочени към подобряване на ефективността на изчисленията.

И така, с новата архитектура GF100 виждаме много голямо увеличение на производителността в най-трудните тестове на PS 3.0. В който най-важното нещо не е върховата математическа мощност, която имат решенията на AMD, а ефективността при изпълнение на сложни шейдърни програми с преходи и разклонения. Е, удвоената математическа мощност в сравнение с GT200 също се отрази. Много добър резултат, защото си струва много да изпреварим решението на AMD архитектурата, която има по-голям брой ALU изпълнителни единици.

Direct3D 10: PS 4.0 пикселни тестове за шейдъри (текстуриране, зацикляне)

Втората версия на RightMark3D включва два познати PS 3.0 теста за Direct3D 9, които бяха пренаписани за DirectX 10, както и още два нови теста. Първата двойка добави възможността за активиране на самозасенчване и суперсемплиране на шейдъри, което допълнително увеличава натоварването на видеочиповете.

Тези тестове измерват производителността на пикселни шейдъри с цикли, с голям брой извличания на текстура (в най-тежкия режим, до няколкостотин извличания на пиксел) и относително малко натоварване на ALU. С други думи, те измерват скоростта на извличане на текстура и ефективността на разклоняването в пикселния шейдър.

Първият тест за пикселни шейдъри ще бъде Fur. При най-ниските настройки той използва 15 до 30 проби за текстура от картата на височината и две проби от основната текстура. Детайлността на ефекта - режим "High" увеличава броя на семплите до 40-80, включването на "shader" supersampling - до 60-120 семпли, а режимът "High" заедно със SSAA се характеризира с максимална "тежост" - от 160 до 320 проби от височинната карта.

Нека първо проверим режимите без активирано суперсемплиране, те са сравнително прости и съотношението на резултатите в режимите "Ниско" и "Високо" трябва да бъде приблизително еднакво.

Производителността в този тест зависи както от броя и ефективността на TMU, така и от скоростта на запълване с честотната лента на паметта в по-малка степен. Резултатите при "High" са около един и половина пъти по-ниски, отколкото при "Low", както би трябвало да бъде на теория. В Direct3D 10 тестове за процедурно изобразяване на козина с голям брой извличания на текстури, решенията на Nvidia са традиционно силни, но най-новата архитектура на AMD вече се доближи до тях.

GTX 480 е с почти една трета по-бърза от GTX 285, но не достига до GTX 295, което също видяхме в тестовете на DX9. Това говори по-скоро за влиянието на fillrate и честотната лента на паметта, където новото решение на Nvidia има предимство пред едночиповата карта от предишната серия. Скоростта на GF100 е приблизително същата в сравнение с две карти, базирани на RV870. Нека да разгледаме резултата от същия тест, но с включена суперсемплиране на "шейдъра", което учетворява работата, може би нещо ще се промени в тази ситуация и честотната лента със скоростта на запълване ще има по-малък ефект:

Активирането на суперсемплиране теоретично увеличава натоварването четири пъти и този път Geforce GTX 480 губи позиции, колкото и да е странно. И двата Radeona стават малко по-силни. Разликата между GTX 480 и GTX 285 е много малка, което показва, че най-вероятно фокусът все още е върху текстурирането. Или честотната лента на паметта, която в GTX 480 не се е увеличила много в сравнение с GTX 285. Влиянието на производителността на ALU и ефективното изпълнение на клонове очевидно не се вижда в този тест.

Вторият тест, който измерва производителността при изпълнение на сложни зациклени пикселни шейдъри с голям брой извличания на текстура, се нарича стръмно паралаксно картографиране. При ниски настройки той използва 10 до 50 проби за текстури от картата на височината и три проби от основните текстури. Когато включите тежък режим със самозасенчване, броят на пробите се удвоява, а суперсемплирането учетворява този брой. Най-сложният тестов режим със суперсемплиране и самозасенчване избира от 80 до 400 стойности на текстурата, тоест осем пъти повече от обикновения режим. Първо проверяваме прости опции без суперсемплиране:

Този тест е по-интересен от практическа гледна точка, тъй като разновидностите на паралакс картографиране се използват в игрите от дълго време, а тежки варианти, като нашето стръмно картографиране на паралакс, се използват в много проекти, например в Crysis и Lost Planet . Освен това в нашия тест, в допълнение към суперсемплиране, можете да включите самозасенчване, което приблизително удвоява натоварването на видеочипа, този режим се нарича "High".

Диаграмата почти напълно повтаря предишната, подобни резултати са показани дори в абсолютни числа. В актуализираната версия на теста D3D10 без суперсемплиране, GTX 480 се представя малко по-добре от едночиповата горна част от предишното поколение, но изостава от двучиповата GTX 295 карта. Също така новата видеокарта, базирана на GF100, леко превъзхожда неговият съперник HD 5870, чийто вариант с двоен чип става победител в абсолютно изражение.

Да видим какво ще промени включването на суперсемплиране, то винаги причинява малко по-голям спад в производителността на картите на Nvidia.

Когато суперсемплирането и самозасенчването са активирани, задачата се оказва по-трудна, комбинираното включване на две опции наведнъж увеличава натоварването на картите почти осем пъти, причинявайки голям спад в производителността. Разликата между индикаторите за скорост на няколко видеокарти се промени, включването на суперсемплиране има същия ефект като в предишния случай - картите на AMD ясно подобриха производителността си в сравнение с решението на Nvidia.

И двете двучипови карти остават пред GTX 480, но този път новото решение е малко по-назад от прекия си конкурент HD 5870. Изглежда, че това ще е така в тестовете за игри - някъде GTX 480 ще бъде далеч напред и някъде ще изостане малко . Въпреки това, картата на GF100 поне изпреварва предшественика си, забележимо в лек режим и само малко в твърд режим. Архитектурните промени в новия графичен процесор на Nvidia всъщност не дадоха голямо предимство в тези тестове, за съжаление.

Direct3D 10: PS 4.0 Pixel Shader Benchmarks (Computing)

Следващите няколко теста за пикселни шейдъри съдържат минималния брой извличания на текстура, за да се намали въздействието на производителността на TMU. Те използват голям брой аритметични операции и измерват точно математическата производителност на видеочиповете, скоростта на изпълнение на аритметични инструкции в пикселния шейдър.

Първият тест по математика е минерал. Това е сложен процедурен тест за текстуриране, който използва само две извадки от данни за текстура и 65 инструкции sin и cos.

Но в математическите показатели трябва да видим големи промени, тъй като GF100 GPU има два пъти по-голяма мощност на ALU от GT200. Теоретично обаче решенията на AMD в нашите синтетични тестове трябва да бъдат още по-бързи, тъй като съвременната архитектура на AMD има ясно предимство пред конкурентите на Nvidia в изчислително сложни задачи. Ситуацията се потвърждава и този път, въпреки че новата платка GTX 480 намали разликата между картите на Nvidia и AMD, но тя остана повече от един и половина пъти.

Но сравнението с GTX 285 и GTX 295 се оказа интересно. Този път Nvidia не успя да удвои разликата от предишната едночипова карта или да изпревари старата двучипова карта от предишното поколение. Заключението се потвърждава, че този тест не зависи изцяло от скоростта на ALU, но резултатите не могат да бъдат приписани и на разликата в честотната лента на паметта. GF100 е само с 38% по-бърз от GTX 285, което е много странно и много, много малко според нас.

Нека разгледаме втория тест за изчисления на шейдъри, който се нарича Fire. Той е по-тежък за ALU и има само едно извличане на текстура в него, а броят на инструкциите sin и cos е удвоен, до 130. Нека видим какво се промени с увеличаване на натоварването:

Във втория тест скоростта на изобразяване е ограничена почти изключително от производителността на шейдърите, но все пак разликата между GTX 285 и GTX 480 е твърде малка - само 58%, въпреки че теоретично би трябвало да е по-близо до двукратна разлика. Но новото решение поне настигна двучиповата GTX 295, за разлика от предишния тест. Въпреки това, конкурентите, представени от Radeon HD 5870 и още повече HD 5970 в този тест, показват много по-висока скорост.

Обобщаване на математическите тестове D3D10. Всички видеокарти на Nvidia са далеч назад, дори новият GF100 е почти два пъти по-бавен от конкурента си в пиковите синтетични задачи! И всичко това въпреки факта, че GTX 480 теоретично е почти два пъти по-бърз от едночиповия GTX 285. Реалността показва много по-ниска цифра, а Nvidia дори не успя да се доближи до AMD картите в прости математически тестове.

Като цяло резултатът за крайните математически изчисления остава непроменен и този път е ясно и безспорно предимство на решенията на AMD, което линията GTX 400 не е променила.

Direct3D 10: Тестове за геометрични шейдъри

Има два теста за скорост на геометрични шейдъри в RightMark3D 2.0, първата опция се нарича "Galaxy", техниката е подобна на "точковите спрайтове" от предишни версии на Direct3D. Той анимира система от частици на GPU, геометричен шейдър от всяка точка създава четири върха, които образуват частица. Подобни алгоритми трябва да се използват широко в бъдещи DirectX 10 игри.

Промяната на баланса в тестовете за геометрични шейдъри не влияе на крайния резултат от изобразяването, крайното изображение винаги е абсолютно същото, само методите за обработка на сцената се променят. Параметърът "GS load" определя в кой шейдър се извършват изчисленията - във връх или геометрия. Броят на изчисленията винаги е един и същ.

Нека разгледаме първата версия на теста "Galaxy" с изчисления във шейдера на върховете, за три нива на геометрична сложност:

Съотношението на скоростите с различна геометрична сложност на сцените е приблизително еднакво за всички решения, производителността съответства на броя точки, при всяка стъпка спадът на FPS е около два пъти. Задачата за съвременните видеокарти не е особено трудна, а цялостната производителност е ограничена от скоростта на обработка на геометрията и не зависи от честотната лента на паметта.

Това е мястото, където новият GPU показва истинската си сила. GeForce GTX 480 във всички режими показва резултати, близки до двучиповото решение на конкурента, превъзхождайки HD 5870 и базираната на GT200 двучипова карта с коефициент 1,5. Отличен резултат! Както се очакваше, изпълнението на геометричния шейдър на GF100 е много, много ефективно, около 2,5 пъти по-бързо от това на GT200. Нека видим дали ситуацията се променя при прехвърляне на част от изчисленията към геометричния шейдър:

Не, числата не се промениха много, когато натоварването се промени в този тест. Всички карти в този тест не забелязват промени в параметъра за натоварване на GS, който е отговорен за прехвърлянето на част от изчисленията към геометричния шейдър и показват резултати, подобни на предишната диаграма. Нека видим какво ще се промени в следващия тест, който предполага голямо натоварване на геометричните шейдъри.

„Hyperlight“ е вторият тест на геометрични шейдъри, демонстриращ използването на няколко техники наведнъж: инстанциране, извеждане на поток, натоварване на буфера. Той използва динамично създаване на геометрия чрез рисуване към два буфера, както и нова функция в Direct3D 10 - извеждане на поток. Първият шейдър генерира посоката на лъчите, скоростта и посоката на техния растеж, тези данни се поставят в буфер, който се използва от втория шейдър за изобразяване. За всяка точка от гредата се изграждат 14 върха в кръг, общо до един милион изходни точки.

Нов тип програма за шейдъри се използва за генериране на "лъчи" и с параметър "GS load", зададен на "Heavy" - също и за рисуването им. Тоест в режим „Балансиран“ геометричните шейдъри се използват само за създаване и „отглеждане“ на лъчи, изходът се извършва с помощта на „екземпляр“, а в режим „Тежък“ геометричният шейдър също участва в изхода . Нека първо разгледаме лесния режим:

И двете конфигурации с два чипа се представиха както обикновено в този тест, Geforce GTX 295 и Radeon HD 5970. Очевидно този тест изобщо не е съвместим с метода за изобразяване на много чипове AFR. В противен случай относителните резултати в различните режими отговарят на натоварването: във всички случаи производителността се мащабира добре и е близка до теоретичните параметри, според които всяко следващо ниво на броя на полигоните трябва да е по-малко от два пъти по-бавно.

В този тест производителността на новата Geforce GTX 480 само леко превъзхожда Radeon HD 5870 в твърд режим, но разликата е по-осезаема в светъл режим. Сравняването на GTX 480 с GTX 285, базиран на предишното поколение GPU, като цяло е смешно, новият видео чип е около два пъти по-бърз.

Числата трябва да се променят в следващата диаграма, в тест с по-активно използване на геометрични шейдъри. Също така ще бъде интересно да се сравнят резултатите, получени в режими "Балансиран" и "Тежък" един с друг.

Време е отново да се удивите на възможностите за обработка на геометрия на GF100 и скоростта на изпълнение на геометричния шейдър. Това е точно резултатът, за който бяха направени глобални промени в графичния конвейер GF100. Докато производителността на геометричните шейдъри е подобрена доста и в GT200, и в RV870, GF100 просто ги разкъсва в тази задача.

Новата GTX 480 в този тест е почти два пъти по-бърза от Radeon HD 5870 и до 2,75 пъти по-бърза от своя предшественик с един чип, GTX 285. Инженерите на Nvidia се опитаха да подобрят ефективността на предишната архитектура за обработка на геометрията и те явно успя. Всички предишни решения просто не са способни на същото ефективно изпълнение на геометрични шейдъри. Какво ще се случи в тестовете за теселация, които трябва да покажат още по-голяма разлика на теория? Но нека не гледаме много напред.

Direct3D 10: скорост на извличане на текстура от върхови шейдъри

Тестовете "Извличане на текстура на връх" измерват скоростта на голям брой извличания на текстура от шейдър на върха. Тестовете са сходни по същество и съотношението между резултатите от картите в тестовете "Земя" и "Вълни" трябва да бъде приблизително еднакво. И двата теста се основават на данни за семплиране на текстура, като единствената съществена разлика е, че тестът "Вълни" използва условни скокове, докато тестът "Земя" не.

Помислете за първия тест „Земя“, първо в режим „Ниска детайлност на ефекта“:

Предишни проучвания показват, че както скоростта на текстуриране, така и честотната лента на паметта влияят на резултатите от този тест. Но разликата между решенията е доста малка. GTX 480 показва подобен резултат на dual-GTX 295, леко превъзхожда HD 5870, но леко отстъпва във всички режими на най-продуктивната Radeon HD 5970 в този тест. Резултатите са явно странни... Нека да разгледаме производителността в същия тест с увеличен брой извличания на текстура:

Взаимното подреждане на картите на диаграмата се е променило леко, това се вижда от леко влошените показатели на почти всички карти. С изключение на GTX 480, който преглеждаме днес. Той не загуби почти никаква производителност в сравнение със същия тест при осветени условия. Това означава - повишена ефективност на текстурните модули и особено на подсистемата за кеширане. Сега новата карта GF100 е най-бързата при среден до висок брой полигони и наравно с двучиповите карти в най-лесния режим.

Нека разгледаме резултатите от втория тест за извличане на текстури от върхови шейдъри. Тестът Waves има по-малко проби, но използва условни скокове. Броят на билинейните текстурни проби в този случай е до 14 („Детайл на ефекта Нисък“) или до 24 („Висок детайл на ефекта“) на връх. Сложността на геометрията се променя подобно на предишния тест.

Интересното е, че резултатите в теста "Вълни" не са подобни на това, което видяхме в предишните графики. Предимството на продуктите на AMD се увеличи донякъде и сега GTX 480 показва производителност, подобна на HD 5870 и Geforce GTX 295, като леко губи от конкурента в тежък режим. Предишното топ решение на Nvidia на един чип е изоставено, новият модел от семейството Geforce GTX 400 го изпреварва, макар и не няколко пъти. Помислете за втората версия на същия тест:

Отново почти няма промени, въпреки че с нарастването на сложността на условията, резултатите от най-новия графичен процесор на Nvidia във втория тест за семплиране на върхове станаха малко по-добри спрямо скоростта на видеокартите на AMD. Предимството пред HD 5870, макар и малко, е налице и новата едночипова карта се справи с Geforce GTX 295, с изключение на най-лесния режим.

3DMark Vantage: Тестове на функции

В това ревю отново решихме да включим синтетични тестове от пакета 3DMark Vantage. Въпреки че пакетът не е нов, неговите функционални тестове поддържат D3D10 и са интересни, защото се различават от нашите. Когато анализираме резултатите от новото решение на Nvidia в този пакет, ще можем да направим някои нови и полезни заключения, които са ни убягнали в тестовете на семейството RightMark.

Тест на функциите 2: Цветно запълване

Тест за скоростта на запълване. Той използва много прост пикселен шейдър, който не ограничава производителността. Интерполираната стойност на цвета се записва в буфер извън екрана (цел за изобразяване) с помощта на алфа смесване. Той използва 16-битов FP16 буфер извън екрана, най-често използван в игри, които използват HDR изобразяване, така че този тест е доста навременен.

Производителността в този тест не съвпада с това, което видяхме в нашите подобни тестове, дори и с различни формати: ние използваме целочислен буфер с 8 бита на компонент, докато в теста Vantage той е 16-битов с плаваща запетая. По-вероятно е числата Vantage да покажат не производителността на ROP, а приблизителното количество честотна лента на паметта. При двучиповите карти нещата са малко по-сложни, GTX 295 показва по-ниска цифра, отколкото би трябвало.

Резултатите от теста приблизително съответстват на теоретичните цифри и зависят от ширината на шината на паметта, нейния тип и честота. GTX 285 се представя добре поради използването на 512-битова памет, а GTX 480 не е много напред поради факта, че GDDR5 паметта не работи на особено висока честота и ширината на шината на паметта съответства на 384-битова. Е, Radeon HD 5870 също е някъде наблизо, въпреки че има само 256-битова шина на паметта, но GDDR5 е доста бърз.

Въпреки използването на GDDR5 памет с по-висока честотна лента на паметта, новото решение на Nvidia заедно с HD 5870 се представя само малко над нивото на GTX 285, който има 512-битова шина и GDDR3 памет. Това може да служи като потенциално ограничение на производителността при използване на буфери за рендиране във формат FP16, което се наблюдава широко в съвременните игри.

Тест на характеристиките 3: Картиране на паралаксната оклузия

Един от най-интересните тестове за функции, тъй като тази техника вече се използва в игрите. Начертава един четириъгълник (по-точно два триъгълника), използвайки специалната техника Parallax Occlusion Mapping, която имитира сложна геометрия. Използват се по-скоро ресурсоемки операции за проследяване на лъчи и карта на дълбочината с висока разделителна способност. Тази повърхност също е засенчена с помощта на тежкия алгоритъм на Strauss. Това е тест на много сложен и тежък пикселен шейдър за видеочип, съдържащ множество извличания на текстури по време на проследяване на лъчи, динамично разклоняване и сложни изчисления на Strauss осветление.

Тестът се различава от другите по това, че зависи не само от мощността на шейдъра, ефективността на изпълнение на клонове и скоростта на извличане на текстура поотделно, но и от всичко по малко. А за постигане на висока скорост е важен компетентен баланс между GPU и честотната лента на видео паметта. Това силно влияе върху теста и ефективността на разклоняването в шейдърите.

За съжаление, GTX 480 се представя посредствено в този тест, само с 23% по-бързо от предишното едночипово решение, GTX 285. Днешната графична карта на Nvidia изостава както от двучиповата GTX 295, така и от най-добрия съперник Radeon HD 5870, докато двучиповата чип HD 5970 като цяло оставаше недостъпен.

Не е много ясно какво е повлияло толкова негативно на резултатите от този тест. Вероятно е виновна ниската скорост на извличане на текстури, които се използват активно в теста, тъй като ефективността на разклоняване на GF100 е доста висока, което беше доказано от нашите тестове на версия 3 пикселни шейдъри. Решенията на Nvidia винаги са били ефективни в този тест, но HD 5870 превъзхожда дори новата GTX 480. Може би GF100 ще покаже най-доброто от себе си в тестовете за симулация по физика?

Тест на функциите 4: GPU плат

Тестът е интересен с това, че изчислява физическите взаимодействия (имитация на плат) с помощта на видеочип. Използва се симулация на върхове, като се използва комбинираната операция на шейдерите на върховете и геометрията, с няколко преминавания. Използвайте stream out за прехвърляне на върхове от един симулационен проход към друг. По този начин се тества производителността на изпълнението на шейдъри на върхови и геометрични елементи и скоростта на изходящ поток.

Можете веднага да отхвърлите производителността на двучиповите карти, те ясно съответстват на скоростта на едночиповите аналози (всеки чип в HD 5970 и GTX 295 работи на по-ниска честота, отколкото в HD 5870 и GTX 285). Скоростта на изобразяване тук зависи от производителността на обработката на геометрията и изпълнението на геометричните шейдъри. В този тест дори GTX 285 се представя добре, само малко зад HD 5870, а новият GTX 480 отново показа своите силни страни.

В този тест GF100 е почти два пъти по-продуктивен от предишното решение, което е в добро съгласие с двойно подобрената мощност на шейдъра на новия чип. Предимството пред конкуриращия се Radeon HD 5870 е също толкова впечатляващо. Като цяло на днешния ни герой може да се присвои статут на лидер в изпълнението на геометрични шейдъри и скоростта на обработка на геометрията като цяло, както трябва да бъде на теория.

Тест на функциите 5: GPU частици

Тест за физическа симулация на ефекти, базирани на системи от частици, изчислени с помощта на видеочип. Използва се и симулация на връх, всеки връх представлява една частица. Stream out се използва за същата цел, както в предишния тест. Изчисляват се няколкостотин хиляди частици, всички са анимирани поотделно, изчисляват се и техните сблъсъци с картата на височината. Подобно на един от нашите тестове RightMark3D 2.0, частиците се рисуват с помощта на геометричен шейдър, който създава четири върха от всяка точка, за да образува частицата. Но тестът зарежда преди всичко блокове на шейдъри с изчисления на върхове, тества се и stream out.

Има още по-силен резултат. В тестовете за симулация на синтетични тъкани и частици на Vantage, където се използват геометрични шейдъри, новият GF100 просто оставя всички свои конкуренти в праха. Този път той превъзхожда предишния графичен процесор на Nvidia с почти три пъти, докато конкурентната Radeon HD 5870 се представя приблизително два пъти по-зле в теста за симулация на частици.

Резултатите от многочипове отново са едни и същи - както AMD картата, така и Nvidia очевидно нямат многочиповия метод за изобразяване, тъй като резултатите от изчисленията на текущия кадър се използват в следващия, което не позволява той да започне да се изчислява преди изобразяването на текущия е завършено. Това е очевидна слабост на двучиповите карти, те не могат да работят ефективно, когато в рамката се използват данни от предишната.

Тест на характеристиките 6: Шум на Перлин

Последният тест за функции на пакета Vantage е математически интензивен тест на видеочипа, той изчислява няколко октави от алгоритъма на шума на Perlin в пикселния шейдър. Всеки цветен канал използва собствена шумова функция, за да увеличи натоварването на видеочипа. Шумът на Perlin е стандартен алгоритъм, често използван при процедурно текстуриране и използва много математика.

Тестът за математически функции от тестовия пакет Futuremark показва чистата производителност на видеочиповете при екстремни задачи. Показаната в него производителност е в добро съответствие с това, което трябва да се получи според теорията, и отчасти съответства на това, което видяхме по-горе в нашите собствени математически тестове от RightMark 2.0. Но в този тест разликата между решенията е още по-голяма.

И така, в този математически тест GTX 480, базиран на новия GF100, най-накрая изпревари GTX 285 точно два пъти, което отговаря на теорията. Но разликата между новото решение и HD 5870 се оказа твърде голяма – 1,7 пъти. Все още не обмисляме двучиповата HD 5970...

Като цяло видеокартите AMD естествено превъзхождат конкурентите на Nvidia в този тест, но новото решение, базирано на графичния процесор Nvidia GF100, все пак успя да се доближи до него. Припомнете си, че този математически тест е доста ясен и е предназначен да покаже производителност близо до теоретичния пик. При по-сложни изчислителни тестове, като физически изчисления, се очертава малко по-различна картина. Но простата, но интензивна математика се извършва много по-бързо на AMD карти.

Direct3D 11: Компютърни и геометрични шейдъри

За да тестваме новите решения от Nvidia и AMD в задачи, използващи функции на DirectX 11, използвахме мостри от SDK на Microsoft, AMD и Nvidia, както и някои демонстрационни програми от тези компании.

Първо, нека разгледаме тестовете, които използват нов тип шейдъри - Compute. Техният външен вид е една от най-важните иновации в последните версии на DX API, те се използват за различни задачи: последваща обработка, симулации и др. Първият тест показва пример за тонално съпоставяне на HDR изобразяване от DirectX SDK с последваща обработка с помощта на пикселни или компютърни шейдъри.

Трябва да признаем ясната победа на едночиповото решение на AMD над новата видеокарта Nvidia Geforce GTX 480 в този тест. Платката, базирана на новия чип GF100, обявен днес, изостава от конкуриращия се Radeon HD 5870 както в пикселен, така и в компютърен режим на шейдъри. Освен това изоставането е доста забележимо - до един и половина пъти. Двучиповият HD 5970 има само един GPU, работещ в този тест, така че има дори по-ниски резултати от HD 5870.

Вторият тест за изчислителни шейдъри също е взет от DirectX SDK на Microsoft и показва гравитационен изчислителен проблем с N-body (N-body), симулация на динамична система от частици, която е подложена на физически сили като гравитацията.

И в този изчислителен тест новото решение на Nvidia отново губи от най-близкия си конкурент, Radeon HD 5870. В този случай около 25%, което също е доста. Двучиповият HD 5970 отново не може да покаже своите възможности и е ограничен до работата на един от двата графични процесора, инсталирани на платката.

Следващият тест е демонстрация от Nvidia, наречена Realistic Character Hair. Той използва не чисто синтетичен код от изчислителни или геометрични шейдъри, а комплекс от геометрични и изчислителни шейдъри и теселация, така че е малко по-близо до реални проблеми, отколкото чистата синтетична форма на първите два теста.

Но в този тест новият GPU на Nvidia се представя добре, доста изпреварвайки едночиповия Radeon HD 5870 и двучиповия HD 5970, чийто втори графичен процесор отново се провали. В същото време е интересна не само разликата в производителността между едночиповите карти до 1,5-1,8 пъти, но и различното им поведение при активирана хардуерна теселация.

Новата видеокарта Geforce GTX 480, базирана на чипа GF100, в този случай ускорява с 15%, когато е активирана теселация, докато решението на AMD, базирано на RV870, се забавя с почти 5%. С други думи, в този случай теселацията е от полза за решението на Nvidia, но не и за AMD. Очевидно се отразява различната организация на геометричния конвейер, към разглеждането на чието изпълнение сега преминаваме.

Direct3D 11: Производителност на теселация

Най-важната иновация в Direct3D 11 се счита за хардуерна теселация. Разгледахме го много подробно в нашата теоретична статия за Nvidia GF100. Има няколко различни схеми за разделяне на графични примитиви (теселация). Например теселация на фонг, PN триъгълници, подразделение на Catmull-Clark.

Tessellation вече започна да се използва в първите DirectX 11 игри като STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033. В някои от тях теселацията се използва за модели на герои (всички FPS игри изброени), в други - за симулиране на реалистична водна повърхност (DiRT 2). Схемата PN Triangles се използва в STALKER: Call of Pripyat, в Metro 2033 - Phong tesellation. Тези методи се внедряват сравнително бързо и лесно в процеса на разработка на играта и съществуващите двигатели, което е направено.

Първият ни тест за теселация ще бъде примерът за детайлна теселация от ATI Radeon SDK. Всъщност той показва не само теселация, но и две различни техники за бумпмапинг: нормално наслагване на нормални карти и паралаксно оклузионно картографиране. Е, нека сравним DirectX 11 решения от Nvidia и AMD при различни условия:

Първото заключение се навежда по следния начин: техниката за картографиране на оклузия на паралакс пиксел по пиксел (средните ленти на диаграмата) е по-малко ефективна от теселацията както при Geforce GTX 480, така и при RADEIN HD 5870, отколкото теселацията (долни ленти). Това означава, че симулирането на геометрия с помощта на пикселни изчисления осигурява по-малко производителност от реалната геометрия, изобразена с помощта на теселация. Това е между другото за перспективите на теселацията, където в момента се използва паралаксното картографиране.

След това по отношение на производителността на GTX 480 и AMD картите една спрямо друга. Двучиповият HD 5970 изпреварва вариантите с един чип, което е разбираемо. Но GTX 480 изпреварва HD 5870 с 5-15%. Повече с активирана теселация, по-малко с изчисления на пиксел. Което е в съответствие с нашите очаквания – в игри с поддръжка само на DX9 или DX10 разликата между GTX 480 и HD 5870 също трябва да е по-малка, отколкото в DX11 игри с теселация.

Вторият тест за производителност на теселация, който ще имаме, е друг пример за 3D разработчици от ATI Radeon SDK - PN Triangles. Всъщност и двата примера също са част от DX SDK, така че много разработчици на игри ще създадат свой собствен код, базиран на тях. Тествахме този пример с различен коефициент на теселация, за да видим колко много влияе върху цялостната производителност.

В този пример може би за първи път видяхме реалната геометрична сила на графичната архитектура GF100. Да, това е просто синтетичен тест и подобни екстремни фактори на разделяне е малко вероятно да бъдат използвани в началото. Но за това е необходима синтетика, която да помогне за оценка на перспективите за решения в бъдещи задачи.

А Geforce GTX 480 тук перфектно показва на какво е способен GF100 в задачите за теселация. Единичният чип многократно изпреварва двучиповата карта на конкурента. Предимството пред HD 5970 достига четири пъти, а едночиповият HD 5870 е победен в този тест с просто опустошителен резултат. Всъщност GF100 ви позволява да използвате няколко спирки повече теселация от RV870. Това означава архитектура, специално проектирана да вземе предвид възможностите на новия API под формата на теселация.

Но нека разгледаме още един тест – демо програма Realistic Water Terrain на Nvidia, известна още като Island. Между другото, авторът на тази програма е Тимофей Чеблоков, известен още като Smalltim, познат на 3D ентусиастите. Неговата демонстрация на Island използва теселация и картографиране на изместване, за да представи реалистично изглеждаща океанска повърхност и терен. Тя изглежда страхотно:

Като цяло Island не е чист синтетичен тест за теселация, а съдържа доста сложни пикселни и изчислителни шейдъри, така че разликата в производителността може да е по-малка, отколкото в предишния случай, но тази ситуация ще бъде по-близка до реалността.

В този случай тествахме демонстрацията с четири различни фактора на теселация, тук тази настройка се нарича Dynamic Tessellation LOD. Ако при най-ниското съотношение на разделяне, картата GF100 е само малко по-напред от едночиповата версия на AMD и дори е по-ниска от HD 5970, то с увеличаване на съотношението на разделяне и произтичащата сложност на сцената, производителността на GTX 480 намалява далеч не толкова, колкото скоростта на изобразяване на конкуриращите се решения.

В резултат на това отново получихме ситуация, при която GF100 чипът на новата графична архитектура на Nvidia осигурява производителност на теселация, подобна на RV870 при значително различна сложност на сцената. И така, с максимален LOD коефициент от 100 в тази програма, GTX 480 показва същата производителност като Radeon HD 5870, но с коефициент само 25 - тоест с няколко пъти повече триъгълници (28 милиона срещу 4 милиона в тази случай). Това е просто огромна разлика!

Заключения по синтетични тестове

Въз основа на резултатите от синтетичните тестове на новия модел Nvidia Geforce GTX 480, базиран на графичния процесор GF100, както и резултатите от други модели видеокарти от големите производители на видеочипове, можем да заключим, че това е много мощна графична архитектура на Nvidia , който се отличава със значително подобрена производителност и възможности. Новите графични карти, базирани на GF100, се превърнаха в една от най-бързите сред всички карти с един чип.

Увеличеният брой блокове за обработка на геометрия и тяхната паралелна работа значително подобриха производителността на теселацията и геометричните шейдъри. В задачите за синтетична теселация, новото решение на Nvidia просто няма равни. Дори решението с два чипа не помага на конкурент и дори когато се сравняват видеокарти с един GPU, решение, базирано на GF100, превъзхожда най-добрата карта на базата на RV870 до 4-6 пъти при подобни тестове. И до пускането на архитектурата на конкурента, специално подобрена за ефективна обработка на геометрията, ситуацията няма да се промени.

Ако преценим производителността в 3D приложения без теселация, тогава можем да предположим, че в тестовете за игри тя ще бъде същата като в нашите синтетични тестове - някъде Geforce GTX 480 ще изпревари конкурента, а някъде ще изостане малко. Освен това не трябва да има твърде големи загуби, тъй като няма игри, които биха били напълно ограничени от математически изчисления или производителност на семплиране на текстури - единствените параметри, по които имаме някои въпроси относно архитектурата на GF100.

При синтетични тестове на теселация, геометрични шейдъри и физически изчисления (симулации на текстил и частици в пакета Vantage, който също използва геометрични шейдъри), новият чип Nvidia GF100 е значително по-силен от останалите. Както при други изчислителни тестове със сложни програми. Но линейната математика като чисто изчислителните тестове от RightMark или Vantage, както се очакваше, беше загубена за решенията на AMD, а Nvidia все още изостава много. Оказва се, че GF100 е по-близо до процесора по отношение на неговите характеристики, той стана още по-гъвкав (спомнете си C++ и подобно на CPU кеширане), но в сравнение с RV870, той има малко по-малко мощност за „разбиване на номера“, които графичните процесори винаги са се различавали от процесорите.

Относително ниската пикова производителност на изчисленията и текстурата, която отбелязахме в нашата статия, води до изоставане от конкурента в някои изкуствени тестове, но като цяло GTX 480 показа много прилични резултати, което трябва да бъде потвърдено в следващата част от нашия материал. В него ще се запознаете с тестовете на най-новото решение на Nvidia, базирано на новия графичен процесор, в най-модерните приложения за игри.

Предполагаме, че резултатите от играта ще съответстват приблизително на нашите заключения, направени при анализ на резултатите от синтетичните тестове. Въпреки че понякога няма да има разлика, тъй като скоростта на изобразяване в игрите често зависи от няколко характеристики на видеокартите наведнъж и зависи много повече от скоростта на запълване и честотната лента на паметта, отколкото от синтетичната. Смятаме, че моделът Geforce GTX 480 трябва да бъде малко по-напред от едночиповия си конкурент Radeon HD 5870 в игри без теселация и със сигурност ще бъде напред в тестовете с него.

Наскоро, след дълга подготовка и многобройни обещания, NVidia все пак пусна нови видео адаптери на масовия пазар: GeForce GTX 480 и GeForce GTX 470. Вече успяхме да се запознаем с всеки един от новите продукти в първото ни ревю. Това означава, че днес задачата да ги изучаваме много внимателно не е на дневен ред, само накратко ще припомним основните параметри. "И така, какво ще има в тази статия?" - питате вие, нашите скъпи читатели. И в тази статия ще "направим овърклок". Да, авторът реши да коригира ситуацията, поради която имаше толкова много шум.

GTX 480 отвътре и отвън (накратко)

реклама

Както обещах, няма да има подробно проучване на структурата и архитектурата на видеоадаптера, ние само ще припомним ключовите моменти на тези, които невнимателно прочетоха първия ни преглед или искат да освежат характеристиките. Нека започнем с външен изглед на картата.

Пред нас е същият видео адаптер от ZOTAC, който беше в първия преглед. Всъщност има само стикер от ZOTAC, а видеокартата е образец на референтния дизайн, без никакви промени. Видео адаптерът е с дължина 27 см и дълбочина 12 см. Печатът ZOTAC разделя двете части на охладителната система. Вдясно от него има турбина с възможност за софтуерно управление на скоростта. Отляво виждаме горната част на алуминиевия радиатор и четири топлинни тръби. Всъщност има пет тръби, само една е скрита под корпуса на видеокартата. Задната страна на дъската не е нищо особено. Единственият чип, който ни интересува, е чипът с надпис CHL8266, който отговаря за управлението на захранването на видеоадаптера. Използвайки възможностите на тази микросхема, можем ръчно да регулираме напрежението, подавано към графичния процесор, с помощта на специализирани помощни програми.

NVIDIA GeForce GTX 480 - Империята отвръща на удара!

Край на слуховете и спекулациите! Най-новите графични карти на NVIDIA, базирани на архитектурата на Fermi, най-накрая бяха официално обявени. Време е да разберете какви са те и какви бойни качества ще покажат в борбата за короната на най-мощния 3D графичен ускорител

⇣ Съдържание

Има мнение, че всички събития около нас се развиват циклично и задължително се повтарят във времето с някои промени. Гледайки развитието на събитията около графичната архитектура на Ферми и базираните на нея видеочипове, човек неволно се убеждава в валидността на това твърдение. Факт е, че последствията от проблемите, които NVIDIA сега среща при пускането на пазара на видеокарти, базирани на GPU Fermi, много напомнят на ситуацията, която се разви около водещото решение на AMD преди три години - видеокартата Radeon HD 2900 XT . Така беше. В края на 2006 г. NVIDIA пусна осмото поколение на своите GeForce видео карти. Флагманът на линията беше мощният по това време NVIDIA GeForce 8800 GTX ускорител, който значително изпреварваше топ модела на AMD от онези времена, Radeon X1900 XTX, по отношение на производителност и технологичност. За да се конкурира успешно с NVIDIA, AMD трябваше да създаде нов ускорител от най-висок клас, но поради редица технологични проблеми, новата Radeon HD 2900 XT излезе с около половин година закъснение. Подобна ситуация се случи с NVIDIA в края на 2009 г. С пускането на първия ускорител от семейството AMD Radeon HD 5xxx, Radeon HD 5870, NVIDIA загуби своята „лидерска фланелка“ сред едночиповите Hi-End решения и след това, с разширяването на линията от графични ускорители на AMD, започна да загуби позиции в почти всички сегменти на пазара на настолни компютри.графики. И сега, шест месеца по-късно, NVIDIA най-накрая успя да произведе достатъчен брой графични чипове с новата архитектура. Днес, 26 март 2010 г., бяха обявени най-новите графични ускорители NVIDIA GeForce GTX 470 и GeForce GTX 480. Най-старата от тези видео карти стана обект на нашето внимателно внимание. Не толкова отдавна вече публикувахме материал за характеристиките на архитектурата на Ферми, така че сега няма да повтаряме казаното, а ще говорим само за това, което се е променило от онези времена. Противно на очакванията, старшият ускорител на семейството - NVIDIA GeForce GTX 480, получи не 512 CUDA ядра, както беше посочено по-горе, а само 480. Освен това промените засегнаха текстурни единици, техният брой е 60, вместо обявените по-рано 64 Но всичките 48 единици ROP и обещаната ширина на шината на паметта от 384 бита останаха на мястото си. За подробно запознаване с характеристиките на новите NVIDIA GeForce GTX 470 и GTX 480 ускорители вижте таблицата:

GeForce GTX 285 GeForce GTX 470 GeForce GTX 480
Процес на производство на GPU, nm 55 40 40
Клъстери за графична обработка, бр. 4 4
Брой поточни мултипроцесори 14 15
Брой CUDA ядра 240 448 480
Брой текстурни блокове 80 56 60
Брой ROPs 32 40 48
Честота на графичния процесор, MHz 648 607 700
Честота на CUDA ядра, MHz 1476 1215 1401
Ефективна честота на видео паметта, MHz 2484 3348 3696
Размер на видео паметта, Mb 1024 1280 1536
Ширина на шината на паметта, бит 512 320 384
Пропускателна способност на видео паметта, GB/s 159 133.9 177.4
Поддръжка на DirectX 10 11 11
Максимален TDP, W 183 215 250
Препоръчителна мощност на захранването, W 550 550 600
Температурна граница на графичния процесор, °C 105 105 105
Препоръчителна цена на дребно към момента на обявяването, USD 399 349 499

Таблицата показва, че GeForce GTX 480 до голяма степен превъзхожда предишния топ модел - GeForce GTX 285, по почти всички характеристики. Особено заслужава да се отбележи удвоеният брой ядра на CUDA, което несъмнено ще има положителен ефект върху скоростта на сложните шейдъри. Също така, новите ускорители на NVIDIA получиха дългоочакваната поддръжка за DirectX 11. В допълнение, GeForce GTX 470/480 поддържа технология, наречена NVIDIA Surround, подобна на ATI Eyefinity. NVIDIA Surround ви позволява да използвате три монитора едновременно като едно работно пространство. Въпреки това, внедрявайки своята версия на технологията за пълно потапяне във виртуалния свят, калифорнийците решиха да отидат още по-далеч и създадоха „технологичен микс“ от NVIDIA 3D Vision и NVIDIA Surround, който се нарича NVIDIA 3D Vision Surround. Същността на този "коктейл" е, че можете да използвате три монитора и очила 3D Vision едновременно, за да създадете максимален ефект на присъствие. Но ще говорим повече за това в нашите бъдещи материали. Е, време е да се запознаете с най-новия ускорител, запознайте се с - NVIDIA GeForce GTX 480!

⇡ Външен вид. Дизайн. Особености

Много преди пускането на GeForce GTX 480 на страниците на различни интернет ресурси се появиха снимки на видеокарти, подобни на GeForce GTX 480, но едва преди анонса успяхме да видим реални снимки на новия флагман на NVIDIA. И така, пред вас е референтна проба на NVIDIA GeForce GTX 480. Пластмасовият корпус е направен във вече познатия стил, но за разлика от решенията от предишното поколение, при GTX 480 той покрива само около половината от предната повърхност на видеокарта, а втората е заета от метален радиатор с надпис GeForce. От горната част на пластмасовия корпус излизат четири топлинни тръби (общо пет), а по-близо до терминалния панел има вентилационни прорези за отстраняване на част от нагрятия въздух. Дължината на GeForce GTX 480 е 27 см, докато дължината на Radeon HD 5870 е с около 2 см по-дълга поради охладителната система, стърчаща отвъд печатната платка. Графичната карта GeForce GTX 480 изисква два PCI-Express захранващи конектора, за да работи. Единият е 6-пинов, а другият е 8-пинов. Изходният панел на GeForce GTX 480 има два DVI конектора и един HDMI порт. Има и вентилационни отвори за отстраняване на горещия въздух извън системния блок. Демонтираме охладителната система. Охладителят GeForce GTX 480 е прикрепен към печатната платка с 13 винта. Контактът на радиатора с елементите на захранващата подсистема на платката, както и с чиповете на видео паметта, се осъществява чрез специални термични подложки. Графичният чип влиза в контакт с радиатора чрез тънък слой термична паста. Металната плоча, с която чиповете памет и елементите на захранващата система влизат в контакт, е прикрепена към корпуса на охладителната система GeForce GTX 480 с помощта на пластмасови ключалки. В „опашната“ част на плочата има турбина, която изпомпва въздушен поток, който преминава през ребрата на радиатора и се изхвърля извън системния блок. Най-горещият елемент на GeForce GTX 480 е графичният процесор. За охлаждането му се използва радиатор с пет топлинни тръби, изработени по технология на директен контакт. Всичките пет тръби през тънък слой термична паста са в контакт с метален капак, който предпазва графичното ядро. Захранващата система на графичния процесор използва шест фази и е базирана на PWM контролера CHL8266. За съжаление не можахме да намерим съответната документация на уебсайта на производителя. За разлика от захранващите елементи, произведени от Volterra, които са сглобени в един пакет, захранващите елементи в захранващата подсистема GeForce GTX 480 са направени по дискретна схема. Има три транзистора за всяка фаза на мощността (един в горната част на рамото и два в долната). Този подход ви позволява по-добре да отстраните топлината от елементите на захранващата подсистема. Системата за захранване на видео паметта е двуфазна. Маркиране на PWM контролера на паметта uP6210AG.

Отстраняваме слоя термична паста и ето го - графичният процесор NVIDIA GF100, покрит със защитен метален капак, който действа и като разпределител на топлина. Съдейки по маркировката на чипа (GF100-375-A3), масовото производство на топ ускорители започна едва с пускането на третата ревизия на графичния процесор, базиран на архитектурата на Fermi.

AMD инсталира GDDR-5 видео памет на своите графични карти от много дълго време, докато по-голямата част от решенията на NVIDIA работят с GDDR-3 памет. Новите GeForce GTX 470/480 ускорители най-накрая също са оборудвани с усъвършенствана памет. Нашето копие на GeForce GTX 480 има Samsung видео памет с маркировка K4G10325FE-HC04. Времето за достъп е 0,4 ns, а номиналната ефективна честота е 5 GHz QDR. Е, външната проверка на GeForce GTX 480 приключи, време е да преминем към практически тестове на нови елементи.

изпитателен стенд

Тестването на всички видеокарти в този преглед беше извършено на стенд със следната конфигурация:

процесор Intel Core i7 870 @ 4,0 GHz (182x22)
Система за охлаждане на процесора Glacialtech F101 + 2x120mm вентилатор
дънна платка ASUS Maximus III Extreme
RAM Супер талант DDR3@1890
HDD Samsung SpinPoint 750 GB
Захранване IKONIK Vulcan 1200W
Кадър Основа за тестов стенд Cooler Master 1.0
Операционна система Microsoft Windows 7 x64 Ultimate
Версии на драйвери: Използвани са драйвери ForceWare 197.17 за графични карти на NVIDIA
Графичните карти AMD използват драйвери за предварителен преглед на Catalyst 10.3a

Следните видеокарти участваха в тестването:

  • AMD Radeon HD 4890
  • AMD Radeon HD 5870
  • AMD Radeon HD 5970
  • NVIDIA GeForce GTX 260
  • NVIDIA GeForce GTX 285
  • NVIDIA GeForce GTX 295
  • NVIDIA GeForce GTX 480
Разбира се, основната цел на това ревю е да се запознаем с новия графичен ускорител на NVIDIA и да оценим неговите потребителски качества. Освен това ще се опитаме да разберем и възможността за преминаване към нови видеокарти за собствениците на решения от предишно поколение. Ето защо в нашия преглед, в допълнение към директния конкурент на GeForce GTX 480 - видеокартата AMD Radeon HD 5870, бестселърите от минали години - Radeon HD 4890, GeForce GTX 260 и, разбира се, най-добрите ускорители на NVIDIA от миналото поколение, също участвайте в теста.

Няколко думи за овърклока

В нашите материали за основния тестов обект обикновено представяме както резултатите, получени при номинални честоти, така и измерванията на производителността след овърклок. За съжаление, този път няма да има тестове с повишени честоти спрямо номиналните, тъй като нито една от съществуващите помощни програми не може да овърклокне GeForce GTX 480. Нито NVIDIA System Tools, нито MSI Afterburner все още могат да увеличат честотите на тази видеокарта над номинален. Освен това съществуващите публични версии на помощните програми за диагностика и овърклок са объркани в показанията си:

И само новата версия на GPU-Z, която към момента на писане не беше достъпна за публично изтегляне, успя да определи правилно всички характеристики на новия ускорител GeForce GTX 480.

Екранна снимка на помощната програма GPU-Z беше направена на система с две видеокарти GeForce GTX 480 в режим SLI, работещи на номинални честоти.

⇡ Тествайте приложения и тестови режими

Температурата на графичния процесор NVIDIA GeForce GTX 480 и общата консумация на енергия на тестовата система бяха измерени в три режима:

Тестването на играта беше извършено със следните настройки:

Разрешение Опции за качество на картината
3D Mark Vantage производителност, висока, екстремна
СТАЛКЪР: Зовът на Припят. Етап на слънчевите валове 1680x1050, 1920x1200 DX10/10.1, макс. Детайл, 4xAA/16xAF, Реални сенки, DX 11, Макс. Детайл, без теселация, 4xAA/16xAF, реални сенки
Колин MCRae DiRT 2 1680x1050, 1920x1200 DX 9 Ultra Detail, 4xAA/16xAF; DX 11 Ultra Detail, 4xAA/16xAF
Unigine Heaven 1.0 1680x1050, 1920x1200 DX10, висока детайлност, 4xAA/16xAF; DX11, висока детайлност, изключена теселация, 4xAA/16xAF
FarCry2 DirectX 10 Benchmark 1680x1050, 1920x1200 DX10, много висока предварителна настройка, 4xAA/16xAF
Resident Evil 5 DirectX 10 Бенчмарк 1680x1050, 1920x1200 DX10, висока детайлност, 4xAA/16xAF
Crysis v 1.2 x64 1680x1050, 1920x1200 DX10, Много висока, 4xAA/16xAF
PhysX е деактивиран в драйверите за графична карта NVIDIAТова ревю на NVIDIA GeForce GTX 480 е първият, но не и последният тест на възможностите на новия флагман на NVIDIA. Този път, когато избирахме режими на тестване, спряхме да тестваме производителността на новия продукт в „класически“ режими. Сравняването на производителността с активирана теселация, оценката на скоростта и качеството на по-сложните алгоритми за анти-алиасинг, както и изучаването на производителността на SLI пакета от нови флагмани са теми за бъдещи прегледи. И така, нека да преминем към числата.

⇡ Тестване

Температурни условия

Първо, нека да разберем как стоят нещата с температурата на графичния процесор NVIDIA GF100 в различни режими на работа и да сравним тези цифри с резултатите на останалите участници в теста. Всички тестови видеокарти бяха охладени чрез референтни CO. Единственото изключение беше платката NVIDIA GeForce GTX 260, която е представена от видеокартата ASUS ENGTX260 Matrix.

Въпреки факта, че при работа с офис приложения честотата на GeForce GTX 480 GPU и видео паметта е значително намалена, температурата на GF100 е доста висока, по-висока от тази на Radeon HD 4890. В същото време шумът от GeForce GTX 480 турбина не се чува дори на отворена стойка.

Температурата на графичния процесор GeForce GTX 480 в играта FarCry2 е „впечатляваща“. За първи път в нашата лаборатория неовърклокнатият графичен процесор на видеокарта с един чип загрява толкова много в играта. В този режим скоростта на турбината се увеличава и нейният шум вече е ясно разграничен от останалите компоненти.

Максималното натоварване на ускорителя GeForce GTX 480 повишава температурата на графичния процесор още по-високо - до 97 градуса по Целзий! Трябва да кажа, че веднага след достигане на такава температурна стойност, турбината започва да работи с максимална скорост, в резултат на което графичният процесор се охлажда доста бързо. В нашия случай температурата падна до 91 градуса и не се покачи по-високо по време на целия тест, докато скоростта на турбината не намалява. Трябва да кажем, че бяхме донякъде обезкуражени от резултата, тъй като новият флагман с един чип NVIDIA превъзхожда дори видеокартата GeForce GTX 295, двучиповия топ модел на NVIDIA от предишното поколение, по отношение на отоплението на GPU. Да, според документи, предоставени от самата NVIDIA, температури на GeForce GTX 480 GPU до 105 градуса по Целзий са приемливи. Въпреки това, вътре в системния блок, освен видеокартата, има и други системни компоненти, които също изискват поддържане на безопасни температурни стойности вътре в компютъра. Силно препоръчваме на бъдещите собственици на GeForce GTX 480 да се отнасят сериозно към организирането на висококачествена вентилация вътре в корпуса. Както се казва, дим без огън няма. Нека да видим колко електроенергия се изразходва от тестов стенд с различни видеокарти от NVIDIA и AMD.

Без натоварване система с инсталиран GeForce GTX 480 ускорител консумира приблизително същото количество електроенергия, както същата система с графична карта NVIDIA GeForce GTX 295. Пряк конкурент от лагера на AMD се оказва по-икономично решение. Когато графичната карта AMD Radeon HD 5870 е инсталирана на тестовия стенд, системата консумира около 30-35 вата по-малко, отколкото при GeForce GTX 480.

При игра на FarCry2 и в режим на максимално натоварване, създаден с помощта на теста FurMark 1.8.0, системата с инсталирана GeForce GTX 480 графична карта превъзхожда всички останали участници, включително GeForce GTX 295. Разликата в консумацията на енергия на системата с AMD Radeon HD графична карта, инсталирана 5870 и системи с NVIDIA GeForce GTX 480 е около 110-130 W, а не в полза на идеята на калифорнийците. Трябва да кажа, че тестовете за системна консумация на енергия и нагряване на графичния процесор не говорят в полза на GeForce GTX 480. Хората, които купуват топ решения обаче, не винаги гледат на тези параметри. Водещите решения, на първо място, трябва да бъдат възможно най-модерни и, най-важното, продуктивни. С поддръжката на съвременни технологии, NVIDIA GeForce GTX 480 е в перфектно състояние, но сега ще оценим производителността. Първо, нека разгледаме показателите за ефективност в синтетичните тестове:

Тестването на GeForce GTX 480 в 3DMark Vantage с профила Performance демонстрира 25% увеличение на производителността спрямо GeForce GTX 285. В същото време записахме разлика между новия флагман на NVIDIA и основния му конкурент AMD Radeon HD 5870, разликата в резултатите е около 6%.

С нарастването на натоварването графичната карта AMD Radeon HD 5870 започва да губи позиции малко по малко. В режим High разликата от GeForce GTX 480 вече не е толкова забележима, както в режим Performance, а с преминаването към Extreme профил, новият флагман на NVIDIA изпреварва, изпреварвайки и GeForce GTX 295. извън конкуренцията . Друг синтетичен тестов пакет, който стана популярен почти веднага след пускането на пазара, е Unigine Heaven v 1.0.

Видеокартата NVIDIA GeForce GTX 480 превъзхожда основния си конкурент, Radeon HD 5870. Предимството в точки е на страната на NVIDIA както при 1680x1050, така и при 1920x1200. Подреждането на силите в гамата на NVIDIA е както следва: ускорителят GeForce GTX 480 е между GeForce GTX 295 и GeForce GTX 285 по отношение на производителността, изостава от „295-ата“ и превъзхожда едночиповия връх на предишното поколение с около 20%.

Тестването в DirectX 11 без активиране на теселация показва приблизително същите резултати като теста в режим DirectX 10. И в двете резолюции GeForce GTX 480 печели по точки. AMD Radeon HD 5970 все още е извън конкуренцията. Синтетичните тестове ни позволяват да представим само приблизително ниво на производителност на видеокартата, тъй като почти винаги "синтетиката" работи на двигатели, различни от тези, използвани в реалните игри. Ето защо на резултатите от подобни тестове трябва да се вярва с повишено внимание. Нека да преминем към тестване в реални игри.

Гледайки резултатите от GeForce GTX 480, получени в FarCry 2 DirectX 10 Benchmark, искам да възкликна „Това чакахме!“. Новият флагман на NVIDIA значително надмина основния си конкурент AMD Radeon HD 5870 и се доближи доста до резултатите на Radeon HD 5970. Разликата между GeForce GTX 480 и Radeon HD 5870, както по отношение на минималната, така и средната скорост на кадрите , е около 25-30 кадъра в секунда. В сравнение с едночиповия флагман на предишното поколение GeForce GTX 285, новият продукт на NVIDIA се оказа почти два пъти по-бърз! Що се отнася до конфронтацията с NVIDIA GeForce GTX 295, „старецът“ също не се справи добре във FarCry 2, GeForce GTX 480 поведе.

Старият, но не по-малко технологичен шутър Crysis v 1.2 x64 не разкрива явен лидер в битката между GeForce GTX 480 и AMD Radeon HD 5870. Тези ускорители всъщност са един срещу друг. Но сред „братята по оръжие“ GeForce GTX 480 пробива напред. Тази разлика е особено забележима при най-високата разделителна способност. Трябва да кажа, че в тази битка AMD Radeon HD 4890, GeForce GTX 260 и дори GeForce GTX 285 изглеждат като „бедни роднини“, защото не могат да покажат адекватни резултати на фона на съвременните Hi-End решения.

В Colin McRae DiRT 2 всички решения на NVIDIA показват отлични резултати. Тук AMD Radeon HD 5970 вече не е абсолютният лидер. При 1920x1200, GeForce GTX 295 успя леко да надмине по-стария AMD ускорител, въпреки че разликата е около 1-2 кадъра в секунда. Конфронтацията между GeForce GTX 480 и AMD Radeon HD 5870 завърши с победа за GeForce. Разликата в производителността при 1680x1050 е около 20 кадъра в секунда както при средната, така и при минималната честота на кадрите. С нарастването на разделителната способност AMD Radeon HD 5870 забележимо намалява разликата, въпреки че новият флагман на NVIDIA все още е напред. Разликата между GeForce GTX 285 и GeForce GTX 480 в DiRT 2 не е толкова голяма, колкото в предишните тествани игри. Тук флагманът от предишното поколение демонстрира добра производителност, достатъчна за комфортна игра във всички резолюции.

При преминаване от DirectX 9 към DirectX 11, резултатите от всички тествани ускорители намаляха. Независимо от това, дори при максимална разделителна способност, е удобно да играете Colin McRae DiRT 2 както на Radeon HD 5870, така и на GeForce GTX 480. Резолюция 1920x1200. Шампионът във всички резолюции все още е Radeon HD 5970.

Време е да демонстрираме възможностите на съвременните ускорители в играта S.T.A.L.K.E.R.: Call of Pripyat. Първо, бих искал да отбележа пълното и безусловно лидерство на топ ускорителите AMD Radeon HD 5870 и AMD Radeon HD 5970. Разликата в резултатите между основните конкуренти AMD Radeon HD 5870 и NVIDIA GeForce GTX 480 всъщност е двойна! Честно казано, изглежда много странно. Друга странност на Stalker е отношението на игровия двигател към многочиповите тандеми. Моля, имайте предвид, че GeForce GTX 295 изостава от GeForce GTX 285 по отношение на минималните кадри в секунда, по подобен начин Radeon HD 5970 изостава от Radeon HD 5870.

Ако при 1680x1050 S.T.A.L.K.E.R. ви позволи да играете удобно на два най-добри AMD ускорителя, след което увеличаването на разделителната способност до 1920x1200 намали минималната и средната честота на кадрите на Radeon HD 5870 до такива стойности, при които не става много удобно за игра. Ускорителят Radeon HD 5970 все още се държи, въпреки че падането на кадрите до 24 кадъра в секунда не носи радост. Главният герой на нашия преглед, GeForce GTX 480, не загуби инерция при преминаване към по-висока разделителна способност, а, напротив, добави, почти равен на минималната стойност на fps с Radeon HD 5870.

Преходът към DirectX 11 не се отрази неблагоприятно на производителността на участниците в теста. Ускорителят GeForce GTX 480 се представя почти наравно с Radeon HD 5870, леко изостава със символично количество от 1 fps. Както и преди, AMD Radeon HD 5970 е начело.

И накрая, нека проверим на какво е способна GeForce GTX 480 в Resident Evil 5. Новият продукт на NVIDIA лесно превъзхожда Radeon HD 5870, като се откъсва от противника с 15-20 fps, в зависимост от резолюцията. Производителността на GeForce GTX 480 като цяло е дори по-добра от тази на GeForce GTX 295, да не говорим за старата в индустрията NVIDIA GeForce GTX 285.

⇡ Заключения

Обобщавайки, бих искал да се спра на няколко точки. На първо място, заслужава да се отбележи, че по отношение на поддържаните технологии паритетът в сегмента Hi-End между видеокартите NVIDIA и AMD е възстановен. Освен това, в известен смисъл, леко технологично предимство вече е на страната на „зелените“, тъй като всички съвременни ускорители на NVIDIA, в допълнение към DirectX 11, Direct Compute 5, OpenCL и др., поддържат PhysX и CUDA технологии, използвани в брой приложения, включително компютърни игри. Въпреки това, ако погледнете по-широко, тогава NVIDIA трябва да свърши много работа, тъй като в други пазарни сегменти AMD има много решения, които превъзхождат колегите на NVIDIA по отношение на технологичността. Проблемът с консумацията на енергия и разсейването на топлината остана нерешен за Hi-End ускорителите на NVIDIA. Флагманът на линията GeForce - видеокартата GeForce GTX 480, не само не може да се конкурира с Radeon HD 5870 по отношение на енергийната ефективност, но дори GeForce GTX 295 губи по тези показатели! Ако говорим за производителност, тогава като цяло в основните, така да се каже, режими, ускорителят NVIDIA GeForce GTX 480 се оказва по-бърз от основния си конкурент AMD Radeon HD 5870. Въпреки това, гледайки скоростното предимство на GeForce GTX 480 в някои игри и режими искам да кажа, че очаквахме повече превъзходство. Въпреки това все още е твърде рано окончателно да се сложи край на проблема с производителността. Скоро ще има нови драйвери, които ще увеличат производителността на новите продукти от NVIDIA и решенията на AMD. Освен това трябва да тестваме най-добрите ускорители от двете компании в по-тежки графични режими. Едва ли е възможно да се предвидят резултатите от подобни състезания предварително, всичко ще зависи от „маржа на безопасност“ на съвременните графични процесори. Именно в такива битки ще се разбере чия архитектура има по-голям резерв за бъдещето.

Когато любител на ресурсоемки динамични приложения има желание да се наслади на преминаването на следващата новост в света на играта, той със сигурност ще помисли за възможностите на собствения си видео адаптер, инсталиран в системния блок. В края на краищата, както показва практиката, за бюджетните устройства и началния клас за игри става все по-трудно да се справят със задачите. Има само един изход - да закупите видеокарта от висок клас от класа GTX 480 и да забравите за проблемите, свързани със спирането в ресурсоемки играчки за 5-10 години. Характеристики, прегледи, преглед и сравнение с конкурентни продукти ще помогнат на купувачите да направят правилния избор.

Спецификации

Чипът, с кодово име Fermi и обозначен като GF100, е изграден по 40nm технология, което позволи на производителя не само да постави повече транзистори (3,2 милиарда) на чипа, но и да намали консумацията на енергия на игровото устройство GeForce GTX 480. Топлината характеристиките на разсейване не надвишават 250 вата, което е отличен показател за класа High-End. Видеоадаптерът е оборудван с четири графични клъстера за обработка, има 15 поточни мултипроцесора и 480 CUDA ядра. Графичният процесор, във фабричната версия, работи на честота от 700 MHz. Видеопаметта е базирана на GDDR5 чипове, има капацитет от 1,5 GB и работи на 384-битова шина. Ефективната честота на паметта е 3696 MHz.

Поддържани технологии

Слабата връзка в игровия видеоадаптер е поддръжката на DirectX 11 API библиотеки. Именно тази характеристика разваля общото впечатление от продуктите с чипа GTX 480 за много потенциални купувачи. Предимствата включват поддръжка на шейдъри версия 5.0 от видеокартата и въвеждането на съвременни технологии, отговорни за работата с 3D виртуализация (3D Vision, Blu Ray 3D и техните аналози).

Доста интересна иновация направи Nvidia, като въведе 3D Surround технологията в устройството. Производителят твърди, че сега собствениците могат да свържат три устройства към видеокартата за показване на видео и да използват очила 3D Vision за преглед на изображението. Вярно е, ако се съди по обратната връзка от собствениците, тази технология все още е далеч от съвършенството, така че всички тези нови разработки, които са свързани с 3D, предизвикват само недоволство от страна на купувачите. В крайна сметка никой не иска да плаща за технология, която няма да се използва.

Разгръщане на потенциала на графичния ускорител

За графичния ускорител GTX 480 характеристиките на производителността на цялата система са критични. На първо място, говорим за процесор, който трябва да има честота над 3 GHz и да има 4 отделни ядра на една платформа. Производителят Nvidia използва кристала Intel Core I7 (695 Extreme) в своите рекламни видеоклипове, съответно, за да отключи потенциала на видеоадаптера, потребителят трябва да има процесор със същата производителност.

Няма претенции към RAM, но в своите прегледи потребителите уверяват, че повечето съвременни играчки изискват поне 8 GB. Що се отнася до твърдия диск, всичко е ясно без коментар - само SSD SSD устройство може да осигури прилична производителност за цялата система. Възможно е да има проблеми със захранването. Експертите препоръчват да се обръща внимание не на мощността на устройството (тя трябва да бъде най-малко 750 W), а на наличието на мощна 12-волтова линия, в противен случай собственикът може да загуби видеокартата поради прекъсване на захранването.

Представител на мобилния пазар

Струва си да се отбележи, че лаптопите използват модифициран графичен ускорител на базата на чипа GTX 480. Характеристиките му се различават значително от дискретно устройство, създадено за персонални компютри. Първо, производителят намали броя на CUDA ядрата от 480 на 352, което значително повлия на цялостната производителност на мобилната платформа (около 20% намаление при тестване със синтетични тестове). Производителят също така намали честотната лента на шината на паметта, ограничавайки я до 256 бита, стандарт за повечето видеокарти от среден клас.

Що се отнася до използваните технологии, включително поддръжка на съвременни библиотеки, тук всичко остана непроменено. Естествено, повечето купувачи се интересуват от производителността на лаптопа, а не от неговите 3D възможности. Следователно тези промени не останаха незабелязани от много потребители и, съдейки по техните отзиви, инсталираният чип едва ли ще привлече вниманието на много купувачи.

Крилата люлка

След като видео адаптерите от 5-то поколение навлязоха на пазара, много ентусиасти се втурнаха да ги сравняват с най-добрите устройства от предишния клас, така че най-популярното сравнение в медиите е сравнението: GTX 480 срещу GTX 570. В своите рецензии много собственици на графичният ускорител от 4-то поколение уверява другите, че Nvidia е била нечестна с тях, защото при изучаване на техническите характеристики на двете устройства се оказва, че те са почти идентични, но цената на видеокартите е различна (480 GTX е по-скъпо).

Изненадващо, в сравнение със синтетични тестове, графичната карта GTX 570 превъзхожда флагмана от 4-то поколение. Преглеждайки производителността на GTX 480 в ресурсоемки динамични игри, можем да заключим, че ситуацията се променя радикално. Феновете на приложения като GTA 5, Metro 2033, Dirt 2 с топ представител на 4-то поколение ще могат да се насладят на играта при максимални настройки с висока честота на кадрите. Но собствениците на GTX 570 ще могат да стартират приложението само с високо качество.

Пристъпете през едно поколение

Що се отнася до сравнението на GTX 480 срещу GTX 650, резултатът може да бъде предвиден без никакви тестове. Въпреки че е последният представител на 6-то поколение, той принадлежи към средния геймърски клас и просто няма нито един шанс да грабне победата от флагманската Nvidia 480 GTX. При синтетични тестове GTX 650 ще демонстрира производителност, която ще бъде поне 30-35% по-ниска от тази на противника.

Вярно е, че в ресурсоемките динамични игри ситуацията може да бъде леко коригирана чрез овърклок на представителя на 6-то поколение както в паметта, така и в ядрото. Съдейки по отзивите на ентусиастите, разликата в производителността може да бъде намалена наполовина. Но никой не притеснява собствениците на GTX 480 да увеличат мощността на видеоадаптера чрез овърклок, но флагманът има потенциал и той е много по-голям от този на представителите на евтиния сегмент. Ако купувачът е изправен пред такъв избор (вземете 480 GTX или 650 GTX), тогава първият представител на Nvidia е за предпочитане, дори ако той е няколко години по-възрастен от своя опонент.

Ясно превъзходство

Може да изглежда доста странно да сравним флагмана от 4-то поколение с представител на средния геймърски клас от 700-та серия видеокарти. Въпреки това, има отчаяни потребители, които искат да видят сравнение на две продуктивни устройства GTX 480 срещу GTX 760. Логично е да се предположи, че в резултат на прехода към нова технологична технология (от 40 до 28 нанометра), представител на 7-та серия много лесно ще надмине конкурента във всички тестове, както синтетични, така и игрови.

И ако вземем предвид, че производителят е поставил процесори CUDA на един чип GTX 760 1152, тогава всички съмнения веднага ще изчезнат. Не забравяйте, че започвайки от 700-та серия, графичните процесори на Nvidia са преминали психологическата бариера от 1000 MHz и оборудват всички видеокарти с поне 2 GB памет. Определено при подобно сравнение представителят на GTX 480 просто няма шанс да спечели.

Най-накрая

Обобщавайки представителя на 4-то поколение High-End, могат да се направят няколко извода. Първо, няма смисъл собствениците на този видеоадаптер да преминават към видеокарти от 500-та и 600-та серия. Въпреки това, ако купувачът е изправен пред избор - да вземе графичен ускорител от 7-мо поколение или да даде предпочитание на GTX 480, прегледите на собствениците и много тестове, проведени от ентусиасти, препоръчват закупуването на графична карта от 7-ма серия.

Доскоро гърмяха първите презентации на серия видеокарти, базирани на NVIDIA и GTX 470, базирани на тестване на официални образци на NVIDIA, но едва сега такива графични ускорители започнаха да се появяват по рафтовете на магазините. Разбира се, остава интригата за еквивалентността на пробите и серийните проби. Това е особено подкрепено от решението на производителя да използва леко намалена версия на чипа GF100 (GPU, базиран на дизайна на Fermi) дори във флагмана на линията, модела NVIDIA. Но ще се опитаме да разкажем за всичко по ред.

Самата архитектура Fermi, използвана в графичните процесори (видеокарти) NVIDIA и GTX470, беше обявена още през септември 2009 г. и само шест месеца по-късно потребителите успяха да се възползват от предимствата й. Обявената цена на видеокартите с архитектура GF100 би трябвало да е $500 за или $350 за GTX 470, което е малко по-високо от едночиповите флагмани на AMD, въпреки че тези видеокарти очевидно ще са още по-скъпи на нашия пазар. Струва си да се отбележи, че проблемите, наблюдавани от AMD при производството на графични процесори, използващи 40-nm TSMC процесна технология, не й позволяват да предостави на пазара точния брой високопроизводителни продукти с поддръжка на DirectX 11. не използвайте пълния потенциал на GF100, може да се надяваме на по-пълно снабдяване на пазара с видеокарти, базирани на GTX470.

NVIDIA определи архитектурата на Fermi като по своята същност изчислителна, измествайки традиционната роля на GPU за ускоряване на 3D графиката в игрите на заден план. Архитектурата на Fermi е последователно развитие на линията изчислителни карти на Tesla, които се използват в системи, изискващи производителност. Този факт се потвърждава от поддръжката на паметта с коригиране на грешки (ECC) и подобрената производителност с двойна точност. Потенциалните печалби от паралелното изпълнение на някои технически задачи са огромни, а инвестициите на NVIDIA в разработката на софтуер доведоха до значителна преднина пред AMD и Intel на този растящ пазар.

NVIDIA Fermi (GF100)

Планираните възможности на новата графична карта бяха да удвоят потенциала за производителност на водещ модел GF100 в сравнение с базирана на GT200 графична карта като GTX285. Но теорията не винаги се превръща в практика.

Самият чип GF100 има 512 CUDA ядра (четири клъстера за графична обработка, всеки от които съдържа четири поточни мултипроцесора и всеки съдържа 32 ядра CUDA). Но останаха само 480 ядра CUDA, което е с 32 ядра по-малко от оригиналната архитектура GF100. Това опростяване беше направено чрез деактивиране на един SM мултипроцесор в GF100, очевидно поради невъзможността да се получи достатъчно количество пълноценни графични процесори.

От своя страна всеки SM мултипроцесор също съдържа свои собствени текстурни единици и PolyMorph двигателя (логика с фиксирана функция, която осигурява подобрена производителност на изчисляване на геометрията). Следователно получих 60 от 64 текстурни единици и 15 PolyMorph двигателя.

В частта от конвейера GF100, която е независима от GPC клъстерите, нямаше блокиране на блокове за NVIDIA. Всичките шест раздела на ROP остават тук. Всеки дял е в състояние да извежда осем 32-битови цели числа наведнъж, което означава, че получаваме 48 пиксела на часовник. Пълен GF100 с всички ROP дялове поддържа 384-битов GDDR5 интерфейс на паметта (т.е. 64-битов интерфейс на дял). Графичният процесор поддържа точно такава конфигурация, а 256 MB памет на интерфейс ни дават общо 1,5 GB GDDR5 памет (пропускателната способност е 177 GB/s, когато включите тактова честота от 924 MHz).

Всички тези намаления на работния капацитет на оригиналния чип са резултат от проблемите на NVIDIA с добива на подходящи чипове, но необходимостта от въвеждане на нови решения на пазара на Hi-End ускорители принуди най-малкото съкратени версии на графичния процесор GF100 с архитектурата на Ферми, която ще бъде пусната в продажба. Но какъвто и да е резултатът, той е налице и си струва да се тества и описва.

В нашата тестова лаборатория дойде серийна видеокарта с типичен за този производител дизайн на кутия.

Опаковката на видеокартата е проектирана в черен и жълт цвят. На предната страна на картонената кутия са посочени моделът на видеокартата, обемът на паметта, нейният тип и честотната лента на шината на паметта. Споменават се и поддръжка на патентовани технологии NVIDIA PhysX и наличието на HDMI конектор. В горния десен ъгъл производителят обръща внимание на поддръжката на собствени технологии: NVIDIA CUDA, NVIDIA PureVideo HD, NVIDIA SLI.

На гърба на кутията има малък преглед на възможностите на тази видеокарта. Описани са предимствата на използването на технологии: NVIDIA 3D Vision Surround и PhysX.

Вътре е самата видеокарта и допълнителни компоненти за доставка. Заедно с графичния ускорител можете да получите следното:

  • Захранващ адаптер за видеокарта от два шест-пинови конектора към един осем-пинов PCI Express;
  • Захранващ адаптер за видеокарта от два MULEX конектора към един шест-пинов PCI Express;
  • Адаптер от DVI към VGA;
  • Адаптер от Mini-HDMI към HDMI;
  • ръководство за употреба;
  • CD със софтуер и драйвери;
  • Демо диск, описващ всички нови функции на тази видеокарта.

Бих искал да отбележа, че захранващите адаптери, включени в пакета, очевидно ще принудят потребителя да използва доста мощно захранване с подходящи конектори за свързване на видеокарта. Това може да доведе до някои проблеми при избора на конфигурация. Като цяло оборудването трябва напълно да компенсира всички нюанси на инсталирането на тази видеокарта в модерен системен блок.

Печатна електронна платка

Самата видеокарта е направена върху тъмен текстолит, чиято лицева страна е затворена от охладителна система с тъмен пластмасов корпус. Припомнете си, че тази видеокарта поддържа шината PCI Express 2.0 x16, съвместима е с DirectX 11 Shader Model 5.0 и OpenGL 3.2, а също така поддържа NVIDIA PureVideo HD технология, NVIDIA 3D Vision Surround, NVIDIA PhysX технология, NVIDIA CUDALI технология и NVIDIA S.

Обратната страна на печатната платка на видеокартата изглежда много по-скромна. Тук можем да отбележим само чипа на захранващата система на GPU - PWM контролера CHL8266, използващ шест фази. Има три транзистора за всяка фаза на мощността (един в горната част на рамото и два в долната). Този подход ви позволява по-добре да отстраните топлината от елементите на захранващата подсистема. Вторият чип uP6210AG вече е добре познат на нашите читатели от други видеокарти, базирани на графични процесори от NVIDIA. Той осигурява две фази на захранване за чиповете памет на тази видеокарта. Така общо получаваме 6 + 2-фазна система за захранване на видеокарта.

Поглеждайки под охладителната система, веднага можете да констатирате факта, че тази видеокарта е напълно идентична с нейната "референтна" версия. Графичната карта използва 267 мм (10,5″) печатна платка, около сантиметър по-къса от ускорителите на Radeon HD 5870, което може да й помогне да се побере в почти всеки модерен корпус.

За допълнително захранване (в допълнение към шината PCI Express) са необходими един шест-пинов и един осем-пинов щепсели. NVIDIA твърди, че тази карта има TDP от 250 W, което е значително по-малко от Radeon HD 5970, което едва отговаря на тавана от 300 W, зададен от PCI-SIG. Ето защо, за "топ" решение, NVIDIA препоръчва 600W захранване или по-високо.

Платката заема два слота на задния панел на корпуса. За достатъчно обемна охладителна система потребителят ще трябва да освободи място в кутията.

Интерфейсният панел показва: два DVI порта и един мини-HDMI. Освен това вторият слот ще бъде изцяло зает от изпускателната решетка, която издухва нагрят въздух от системния блок.

Охладителна система

Нека разгледаме по-отблизо системата за охлаждане на видеокартата. Той напълно повтаря "референтната" версия и инженерите на NVIDIA очевидно се опитаха да я направят възможно най-ефективна, но поради ненаситността на видеокартата, получената температура на компонентите все още остава на доста високо ниво.

Пет топлинни тръби, допълнителен топлоотвеждащ корпус и аеродинамичният дизайн на самата турбина впечатляват с максималната си обмисленост. Това е най-ефективният дизайн на охладителна система от всеки референтен дизайн, който сме виждали досега. Въздухът, изпомпван от страничната турбина, преминава през алуминиев радиатор, пробит от пет медни тръби, и излиза от корпуса.

Уникална особеност на този дизайн е разположението на една от страните на радиатора директно върху повърхността на корпуса на картата, което ясно подобрява разсейването на топлината, но поради доброто нагряване на охладителната система, задържането на тази част от видеокартата може да причини изгаряния.

Забележителна иновация тук е допълнителен радиатор, който премахва топлината от повърхността на графичния процесор и чиповете памет. Общата плоча покрива горната част на платката на видеокартата и осигурява разсейване на топлината чрез специален термичен интерфейс от чиповете памет и транзисторите на енергийната система.

Нека да преминем към тестване на охладителната система. При максимално натоварване температурата на графичния процесор беше впечатляващите 101 ° C, което не се счита за критична температура за този графичен процесор. В същото време охладителната система работеше на 92% и създаваше забележимо ниво на шум.

А в режим на празен ход (2D режим) охладителят работи на 44% от максималния си капацитет. В този режим работата му се забелязва и на фона на общия шум. Охлаждащата система, инсталирана на тази видеокарта, осигурява нормална ефективност, но нуждите на графичния процесор на видеокартата явно я принуждават да се опита да осигури приемливи температури. Шумът на охладителната система очевидно зависи от натоварването на видеокартата и не може да се нарече тих.

Е, сега нека да преминем към подробно проучване на техническите характеристики на видеокартата. За начало даваме кратко описание под формата на таблица:

Инсталираният тук графичен процесор на NVIDIA е с етикет GF100-375-A3.

Честотната схема на видеокартата и други характеристики изглеждат така:

Тази проба напълно повтаря всички характеристики на "референтната" версия на ускорителя NVIDIA. Графичният процесор на ZT-40101-10P работи съответно на 701 MHz, а шейдърните домейни съответно на 1401 MHz. Видео паметта получава 924 MHz реална или 3696 MHz ефективна честота.

Тестваната видеокарта използва чипове памет GDDR5, произведени от SAMSUNG с общ капацитет 1536 MB. Маркировката K4G10325FE-HC04 показва, че тези чипове осигуряват време за достъп от 0,4 ns, което съответства на реална честота от 1250 MHz или ефективна 5000 MHz и осигурява значителен капацитет за овърклок.

Тестване

процесор Intel Core 2 Quad Q9550 (LGA775, 2.83GHz, L2 12MB) @3.8GHz
дънни платки NForce 790i-Supreme (LGA775, nForce 790i Ultra SLI, DDR3, ATX)
GIGABYTE GA-EP45T-DS3R (LGA775, Intel P45, DDR3, ATX)
Охладители Noctua NH-U12P (LGA775, 54,33 CFM, 12,6-19,8 dB)
Thermalright SI-128 (LGA775) + VIZO Starlet UVLED120 (62,7 CFM, 31,1 dB)
Допълнително охлаждане VIZO Propeller PCL-201 (+1 слот, 16,0-28,3 CFM, 20 dB)
RAM 2x DDR3-1333 1024MB Kingston PC3-10600 (KVR1333D3N9/1G)
Твърди дискове Hitachi Deskstar HDS721616PLA380 (160 GB, 16 MB, SATA-300)
Захранвания Seasonic M12D-850 (850W, 120mm, 20dB)
Seasonic SS-650JT (650W, 120mm, 39.1dB)
Кадър Spire SwordFin SP9007B (пълна кула) + Coolink SWiF 1202 (120×120x25, 53 CFM, 24 dB)
Монитор Samsung SyncMaster 757MB (DynaFlat, 2048× [защитен с имейл] Hz, MPR II, TCO'99)

По време на тестването стана ясно, че видеокартата потвърждава статуса на най-мощния едночипов графичен ускорител досега. Новият продукт на GPU от NVIDIA очевидно е малко по-бърз от своите конкуренти, базирани на чипове на AMD, но като се има предвид неговата консумация на енергия и работна температура, което води до повишен шум, както и като се гледа цената, не може да се нарече еднозначно балансирано решение. Освен това има съмнения относно възможността за създаване на версия с два чипа, базирана на NVIDIA, която може да надмине двучиповия графичен ускорител на Radeon HD 5970 по отношение на производителността.

Овърклок

Овърклокът на тази видеокарта също не може да се нарече изключителен. Почти не успяхме да овърклокнем паметта на видеокартата, въпреки че самите чипове очевидно работят по-бавно от номиналната си честота. Но самият GPU с напрежение 1,05 V беше овърклокнат до 770 MHz, докато температурата на ядрото беше 87 ° C. Но по време на овърклок видеокартата е в различни условия, отколкото по време на теста за ефективност на охладителната система, по-специално, страничният панел на корпуса беше премахнат и близо до видеокартата е инсталиран 120 мм вентилатор, което леко подобрява условията на охлаждане, а Самият охладител постоянно работеше на 100% скорост на въртене. Разполагайки със софтуерен механизъм за управление на захранващото напрежение, продължихме експериментите. При прилагане на 1.075 V, графичният процесор успя да овърклокне до 784 MHz, а температурата се повиши до 91 ° C. Най-добрият резултат беше постигнат при 1,1 V, когато графичният процесор успя да овърклокне до 790 MHz, но сега температурата му се увеличи до 99 ° C при натоварване

Нека видим как ръчното ускорение влияе на производителността:

Тестова опаковка

Стандартни честоти

Овърклокната графична карта

Увеличение на производителността, %

3D Mark Score
SM2.0 резултат
HDR/SM3.0 резултат
производителност

Serious Sam 2, максимално качество, AA4x/AF16x, fps

1600×1200
2048×1536

Prey, максимално качество, AA4x/AF16x, fps

1600×1200
2048×1536

Call Of Juarez, максимално качество, БЕЗ AA/AF, fps

1280×1024
1600×1200
2048×1536

Call Of Juarez, максимално качество, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis, максимално качество, БЕЗ AA/AF, fps

1280×1024
1600×1200
2048×1536

Crysis, максимално качество, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Crysis Warhead, максимално качество, БЕЗ AA/AF, fps

1280×1024
1600×1200

Crysis Warhead, максимално качество, AA4x/AF16x, fps

1280×1024
1600×1200

Far Cry 2, максимално качество, БЕЗ AA/AF, fps

1280×1024
1600×1200
2048×1536

Far Cry 2, максимално качество, AA4x/AF16x, fps

1280×1024
1600×1200
2048×1536

Увеличението от овърклок е доста слабо и предвид максималните температури на видеокартата дори без овърклок, целесъобразността на последното става съмнителна, защото ще трябва да работите усилено, за да увеличите ефективността на охлаждане на графичния процесор. И дори при номинални честоти, това „върховен клас“ решение може да осигури прилична производителност на игри дори за взискателен потребител.

Резултати

Видеокартите, базирани на графичния процесор NVIDIA, включително тествания ZT-40101-10P, се оказаха много продуктивни едночипови решения. Освен това графичният процесор GF100 с използваната в тях архитектура на Fermi първоначално имаше 512 стрийминг ядра, но в резултат на някои проблеми с получаването на необходимия брой чипове по време на производството, "топ" видеокартите на него използват само 480 ядра. Но поради достатъчно високи работни честоти, ускорителите все пак се оказаха като цяло по-бързи от едночиповите карти на конкурента, базирани на Radeon HD 5870, въпреки че двучиповото решение от AMD, Radeon HD 5970, все още остава лидер на пазара.

Въпреки това, ако едночиповите "топ" GPU-базирани видеокарти на NVIDIA превъзхождат съответните решения, базирани на чипове на AMD, тогава консумацията на енергия очевидно не е силната страна на картите на NVIDIA. Разбира се, за много ентусиасти това няма да бъде критерий за избор, но в някои случаи си струва да се вземе предвид този аспект, тъй като увеличаването на консумацията на енергия води не само до известно увеличение на сметките за електроенергия. Всъщност цялата енергия, консумирана от графичния ускорител, се разсейва под формата на топлина, която трябва бързо да се отстрани, за да се избегне прегряване и повреда на високотехнологични компоненти, което от своя страна води до усложняване на охладителната система и увеличаване на неговият шум.



Свързани статии: