Какво трябва да знаем преди да закупим нова видеокарта.

**shanto** · 01-09-09, 20:33

Започвам тази тема , свързана с основните постановки при видеокартите защото попаднах на една много интересна статия с автор Добрил Доков.

Много хора , са изправени пред Въпроса "Каква видеокарта да си взема, за да мога да правя определено нещо
на компютър си - да играя определена игра, да гледам филми, да рендирам и т.н".
Но да си отговорим на този въпрос е изключително трудно за голяма част от потребителите на компютърни системи, поради
тяхното незнание какво точно трябва да търсят за решаването на техния проблем.

В повечето случаи, когато производителите на графични карти се опитват да продадат една видеокарта, основното нещо, на което наблягат, е обемът на паметта й. Проблемът, който на свой ред откриват купувачите, е, че точно обемът на паметта е последното нещо, което е от значение за скоростта и производителността на графичната карта. На какво да обръщаме внимание и какво означават сложните и странни съкращения, като PS или VS, поточни ядра и т.н., ще разгледаме подробно в този материал.
Едно от най-често срещаните заблуждения при повечето потребители, които не са „навътре“ по отношение на компютрите, е за важността на обемана паметта на видеокартата. В това заблуждение имат пръст (доста сериозно при това) производителите на графични карти, които предлагат слаби модели с абсурдно голям обем на графичната памет, подлъгвайки купувачите, че тя е от основно значение.
Причините за това поведение са доста комплексни, но най-основните от тях се крият в разходите за производство на съответните видеокарти. Използването на графичен процесор от по-нисък клас позволява доста по-евтина изработка на продукта като цяло, тъй като той не изисква сложна и скъпа захранваща схема и многослойна печатна платка с повече от 8 до 10 слоя. Цените на паметта (GDDR2 иGDDR3) в последно време се понижиха изключително много, което позволява използването на големи обеми от нея на много ниска производствена цена.
В крайна сметка потребителят получава продукт, който използва изключително слаб графичен процесор (например GeForce 8400GS), „обогатен“ с обем на паметта от порядъка на 1-2 GB, която е напълно излишна и неизползваема. Неизползваема, защото самият графичен процесор не може да се справи с нивото на детайлност и качество на картината при работа в режими и резолюции, където тези 2 GB биха били полезни.
И така, ако имаме нужда от закупуването на нова графична карта или просто отвътреискаме да знаем какво има в нея, е добре да разберем какво точно представляват те и кои са важните особености, важни за по-висока производителност. За тази цел ще разгледаме двете основни архитектури, присъстващи на пазара в момента – RV700 на ATI и GT200 на Nvidia, на които се базират техните графични карти. Преди това обаче нека отделим малко внимание и разгледаме какво представляват основните модули в графичната карта – т.нар. пикселни и вертексни шейдъри, текстурни и растерни блокове.

Неразбираемите термини на графичния свят

Преди въвеждането на DirectX 10 и новите архитектури на ATI и Nvidia с паралелни шейдърни ядра в процесора цялата дейност се изпълняваше от няколко основни модула в графичния чип. Появата на пикселните шейдъри при DirectX 8 може би следва да се счита за една от най-сериозните и революционни промени в архитектурата на компютърната графика след представянето на графичния процесор като такъв от Nvidia с първия модел GeForce.
Преди да разберем каква работа точно извършват отделните модули в графичното ядро, трябва да разберем поредността от действия, които стоят зад всеки един кадър, който виждаме, когато играем триизмерна (и не само) компютърна игра. Зад създаването дори на един-единствен обект в сцената се крие поредица от изключително сложни действия. Ако прескочим по-маловажните части и стигнем до работата на графичния процесор, ще открием, че основните „работници“ в него са вертексният, пикселният и геометричният шейдър. За да създаде даден обект, графичният процесор използва многостени, изградени от триъгълници, всеки от които на свой ред се създава чрез три вектора. Именно тези вектори са обект на управление и манипулация от страна на вертексния шейдър, който трансформира триизмерните полигони в двуизмерни изображения, готови за подаване на следващия етап от конвейера.
Следващата фаза в обработката на кадъра е геометричният шейдър (въведен при DX10), който може да добавя допълнителни полигони в случай на нужда. След него идва ред на пикселния шейдър, който представлява един от най-важните модули на графичния процесор. Работата на пикселния шейдър е да изчисли осветеността на всеки от пикселите в сцената, тъй като тази задача не може да бъде извършена от вертексния или геометричен шейдър. При въвеждането на DirectX 8 и Pixel Shader 1.0 използването на пикселните шейдъри се е ограничавало само до изчисляване на осветеността на всеки пиксел от сцената. С постепенното развитие на графичните процесори обаче неговата задача се разширява доста сериозно, като се стига дотам, че в момента чрез пикселните шейдъри се изчисляват и изобразяват почти всички по-сериозни ефекти на повърхността (bump-mapping, засенчване, осветление, отдалеченост, depth-of-field и т.н.).
Благодарение на пикселните шейдъри става възможно т.нар. per-pixel осветление, при което започва еволюцията на съвременната реалистична компютърна графика, която виждаме в игрите. Всъщност самият термин „шейдър“ произхожда от времето, когато единствената употреба на тези алгоритми е била за изчисляване на осветеността (shading) на отделните пиксели в сцената. Следващата по-сериозна стъпка от еволюцията на графичния процесор е преходът къмDirectX 10 архитектура, базирана на т.нар. унифицирани шейдъри, обединяващи в себе си трите основни модула – вертексния, пикселния и геометричния шейдър. Именно на нея са базирани всички съвременни графични карти, като освен броя на унифицираните шейдъри от значение в наши дни е и броят на още два параметъра – TMU и ROP модулите.
Задачата на TMU или Texture Mapping Unit е буквално да „облича“ създадените полигони с текстури. Текстуризирането на триизмерните обекти може да става с произволно изображение независимо от неговия размер, като задачата на TMU модула е да го ориентира и преоразмери, за да пасне на положението на съответния вертекс или група от тях във всяка сцена. Тук стигаме до един от основните показатели на съвременните графични карти – броя на TMU модулите. По големият брой TMU съвсем логично води до по-висока производителност, но производството им на свой ред е относително скъпо (макар да са част от кристала на графичния процесор). По тази причина разработчиците на графични архитектури избягват поставянето на твърде много TMU модули, тъй като излишните просто ще стоят без работа.
ROP или Raster OPerations е другият модул, който е от значение за производителността на графичното ядро освен шейдърните процесори. Работата на ROP модула е да обработи и евентуално комбинира данните за всеки пиксел и съответния му тексел (текстуризиран пиксел) от сцената, който му се подава от шейдърните ядра. Освен за обработката ROP модулите се грижат и запоследващото прехвърляне на данните към паметта на графичната карта или кеша на графичния процесор. Броят на ROP модулите е другият признак, от който сериозно зависи производителността на графичното ядро, като тук отново са в сила съображенията, пречещи на увеличаването на броя, както и при TMU модулите.

DirectX 10 и новото настояще

С прехода към DirectX 10 всички шейдъри се обединяват в едно, като името на новата концепция съвсем логично е Fully Unified Shader Model. При DirectX 10 архитектурата няма отделни пикселни или вертексни шейдъри – графичното ядро е съставено от изключително голям брой (е, според класа на картата) минипроцесори, изпълняващи подадените им задачи без значение какви са те. По този начин се постига сериозно повишаване на ефективността на изчисленията чрез паралелна обработка, която е силно застъпена при графичните сцени.
За целта както ATI, така и Nvidia въвеждат нещо, носещо името „шейдърен процесор“, представляващо основната изчислителна единица на съвременното графично ядро. Разликата между двата вида шейдърни ядра при двете компании е доста сериозна, откъдето идват и повечето грешни представи при директното сравняване на двата типа продукти. За да разберем защо 800-те шейдърни ядра на RV770 са еквивалентни на 240-те на Nvidia, трябва да разгледаме по-отблизо структурата на съвременния графичен процесор.
При RV770 и предишните DirectX 10 поколения на ATI се разчита основно на суперскаларна архитектура, при която всяко от шейдърните ядра работи паралелно в комплект с още четири други. Отначало ATI се опитваше да разглежда комплекта от пет шейдърни ядра като самостоятелна единица, но след като това не доби популярност, фирмата започна да класифицира своите продукти според броя на всички елементарни шейдърни ядра в процесора.
Всеки един от модулите в графичното ядро се състои от пет изчислителни процесора – четири от тях са способни да изпълняват по една елементарна функция на такт (включително FP MAD). Петото ядро поема по-сложните инструкции, сред които са например SIN, COS, EXP и други 32- битови single precision операции. Петте процесора имат собствен диспечер, който се грижи за разпределението на задачите и следенето на потенциални разклонения в потока инструкции, както и общ регистър, в който да записват и четат данни при работа. ATI нарича обединението от тези пет ядра SPU или Stream Processing Units, като всеки 16 SPU модула са събрани в общ по-голям блок, който носи името SIMD Core (Single Instruction Multiple Data Core). Работата с 64-битови double precision функции става чрез разпределяне на задачите именно на това по-високо ниво – SIMD Core.
Всеки SIMD Core модул разполага със собствена памет с обем 16 kB, която да използва по време на работа, независимо дали става дума за обмен между отделните ядра или трансфер на данните като цяло. Всяка от 10-те SIMD Core групи разполага с по четири TMU модула, които да се грижат за текстуризирането, което означава, че при RV770 се спазва съотношение 4:1 между ALU модулите и текстурните блокове, което ATI считат за оптимален вариант.
Както може да се види от показаната схема, ATI са предпочели да заложат на суперскаларна архитектура на своя графичен процесор (всъщност на всички DX10 модели на фирмата). Недостатък на тази концепция се явява фактът, че за да се оползотвори напълно предлаганата архитектура, е необходима оптимизация на програмите (в случая игрите), която на свой ред почти никой не прави.
Тъй като най-малката работна единица, която може да се използва при RV700, е всеки SPU блок с по пет процесора, реално погледнато, броят на шейдърните ядра в този тип архитектура не е 800, а доста по-скромните 160. Погледнато от тази гледна точка, излиза, че реално 160-те шейдъра на ATI са еквивалентни или по-производителни от 240-те, използвани в моделите на Nvidia, но това не е така. Една от основните разлики между двете архитектури е споменатата по-рано суперскаларност, която улеснява обработката на поточни данни. Реално погледнато, това са и основната част от изчисленията в 3D графиката, поради което имаме подобна прилика в производителността между двете архитектури при сериозна разлика в броя на шейдърите.
След като разгледахме особеностите на архитектурата на графичните карти на ATI, е време да обърнем внимание и на реализацията при Nvidia. За момента Nvidia има две архитектури, които реално са в употреба – G9x и GT2x0, които намират приложение в ниския, средния и съответно високия клас продукти на компанията. GT2x0 на практика се явява пълноценен наследник на G9x, с тази разлика, че включва повече модули от съответния вид, които увеличават производителността на картата. По тази причина ще разгледаме само особеностите на GT200.
Първата основна разлика между GT200 и RV700 се крие в типа на използваните шейдърни процесори. Докато при варианта на ATI се разчита на групи от по пет шейдъра, работещи в суперскаларен режим, при Nvidia тази задача се изпълнява от един-единствен шейдър, способен да изпълнява както простите, така и сложните (SIN, COS, MAD и т.н.) операции. Всъщност липсата на суперскаларност е още една причина, поради която по-малкиятброй шейдърни процесори като цяло (240 срещу 800) на Nvidia успява да поддържа еквивалентна производителност. Скаларният режим на работа на GT200 позволява постигане на почти два пъти по-високи тактови честоти (около 1.8 GHz) на работа, компенсирайки по-малкия брой шейдъри.
За да улесни приемането и употребата на CUDA, Nvidia преминава към нов тип групиране на шейдърните ядра в графичния процесор, който улеснява тяхното адресиране и работата с тях като цяло. За разлика от G9x, който предлагаше осем клъстера с по 16 шейдърни ядра, GT2x0 вече е „екипиран“ с десет клъстера, всеки от които включва 24 шейдъра, или общо 240 като цяло за ядрото. Nvidia нарича тези клъстери Thread Processing Clusters, като всеки от тях разполага с осем TMU модула (два пъти повече от четирите при G9x). Всеки от трите модула (които впрочем Nvidia нарича Thread Processing Arrays), участващи в TPC клъстера, разполага със собствена кеш памет с обем 16 kB (отново два пъти повече от G9x). Както може да се види от сметката, съотношението на ALU изчислителна мощност към TMU модули е 3:1, което се различава от реализираното при ATI 4:1. Всеки TPC клъстер, който е съставен от три TPA модула, е комбиниран със собствен диспечер, разпределящ инструкциите между шейдърите, който според Nvidia е усъвършенстван до постигане на почти 2.5 пъти по-висока производителност.
Като погледнем съотношенията между математическа изчислителна мощност и текстурна, става очевидно, че Nvidia отдава предпочитание на втората, макар съвременните игри да наблягат повече на „грубите“ изчисления. Не се подлъгвайте да си мислите, че GT2x0 ще загуби по точки и в този случай, тъй като това е една изключително мощна и гъвкава архитектура, която едва ли ще срещне затруднения с което и да е съвременно заглавие. Между другото макар схематично TMU и ROP модулите да се намират в TPC клъстерите и ядрото като цяло, те работят на доста по-ниска честота от тази на шейдърите.
ROP модулите, с които разполага GT2x0, са общо 32 и са разпределени така, че да работят общо с всички TPC клъстери. При тях Nvidia е направила едно доста сериозно подобрение в сравнение с използваните при G8x/9x модули. ROP елементите на GT2x0 са оптимизирани и предлагат около три пъти по-висока скорост на изчисленията при обработка на смесване (blending) с плаваща запетая. Според Nvidia това ще доведе до доста сериозно ускорение на производителността при HDR и transparency anti-aliasing обработките. Останалите възможности на ROP са идентични с тези на G8x/G9x и осигуряват поддръжка на 8хMSAA и 16хCSAA.

Паметта не е всичко

Както видяхме от разгледаните досега особености на архитектурите при ATI и Nvidia, паметта далеч не е основният признак за производителността на графичната карта. Колкото и да им се иска на повечето производители на абсурдни решения от сорта на GeForce 8400GS с 2 GB памет да ни убедят, че това е карта с върхова производителност, истината е, че трябва да гледаме самото ядро. Независимо че тук разгледахме само върховите предложения на двете фирми, това съвсем не означава, че те не използват същите архитектури и в по-ниските класове продукти. Макар GT2x0 да се явява наследник на G9x, която Nvidia използва за графичните си карти от среден и нисък клас, те са изключително подобни.
Следващия път когато правите ъпгрейд на системата си и купувате нова графична карта, това, на което трябва да обърнете внимание, е не марката или обемът на паметта й, а дали графичният й процесор ви устройва като производителност. А дали ще е модел на Nvidia или ATI е въпрос единствено на лично предпочитание.

Надявам се , че с информация съм бил в полза на хората, които не са толкова навътре в тази материя, но пък искат да си закупят или подновят видеокартата, но се чудят от къде да започнат.

Изказвам и благодарност на автора за добре съставената статия.

**FearMe** · 01-09-09, 21:36

статията наистина е добра, но за съжаление поднесената в нея информация е прекалено сложна за непрофесионалиста
след прочитането й неговата подготвеност за адекватен избор ще е същата като и преди прочитането й

според мен ръководството за избор на видеокарта изглежда по следния начин:

1. дефиниране на нуждите, като ясно бъде обяснено, че "и за игри" струва поне $150 отгоре, а "интернет и филми" не струва нищо, защото за това стигат и вградените. трябва да бъде и повярвано, и че гледането на филми с висока резолюция зависи от процесора, а не от видеокартата, като възможността това да се прави от видеото е опция, нужна само при изключително слаб процесор

2. определяне на бюджет

3. съобразяване с ползвания монитор/резолюция. няма смисъл от 295 за 1280*1024

4. развенчаване на митовете - "nvidia са по-добри/по-лоши от ati", "повечето памет е равно на по-хубава карта", обясняване на ролята на поколението на чипа, по-известната марка не е кой знае колко (ако изобщо) по-хубава

Какво трябва да знаем преди да закупим нова видеокарта.

Инструменти на темите

Какво трябва да знаем преди да закупим нова видеокарта.

Re:Какво трябва да знаем преди да закупим нова видеокарта.

Подобни теми

Продавам видеокарта Innovision GeForce GTS 450 GDDR5 1GB НОВА

какво ми трябва за NV-GS27 Panasonic

Какво трябва да вкючва...

Какво ми трябва за LAN за 5 души, какво оборудване

SetCombG.com

Следвай ни