Как отследить использование графического процессора в диспетчере задач Windows. Встроенная и интегрированная графика в процессоре Что такое copy в параметрах графического процессора


Графический процессор (GPU) является не менее важным компонентом SoC мобильного устройства, чем (CPU). За последние пять лет бурное развитие мобильных платформ Android и iOS подстегнуло разработчиков мобильных графических процессоров, и сегодня никого не удивить мобильными играми с трехмерной графикой уровня PlayStation 2 или даже выше. Вторую статью цикла “Ликбез по мобильному железу” я посвятил графическим процессорам.

В настоящее время бОльшую часть графических чипов производят используя ядра: PowerVR (Imagination Technologies), Mali (ARM), Adreno (Qualcomm, ранее ATI Imageon) и GeForce ULP (nVIDIA).

PowerVR – это подразделение компании Imagination Technologies, которая в недавнем прошлом разрабатывала графику для настольных систем, но под давлением ATI и nVIDIA вынуждена была покинуть этот рынок. Сегодня PowerVR разрабатывает, пожалуй, самые мощные GPU для мобильных устройств. Чипы PowerVR используют при производстве процессоров такие компании, как Samsung, Apple, Texas Instruments и др. Например, разные ревизии GPU от PowerVR установлены во всех поколениях Apple iPhone. Актуальными остаются серии чипов 5 и 5XT. К пятой серии относятся одноядерные чипы: SGX520, SGX530, SGX531, SGX535, SGX540 и SGX545. Чипы серии 5XT могут иметь от 1 до 16 ядер: SGX543, SGX544, SGX554. Спецификации 6 серии (Rogue) пока уточняются, но уже известен диапазон производительности чипов серии – 100-1000GFLOPS.

Mali – это графические процессоры, разрабатываемые и лицензируемые британской ARM. Чипы Mali являются составной частью различных SoC, производимых Samsung, ST-Ericsson, Rockchip и др. Например, Mali-400 MP входит в состав SoC Samsung Exynos 421x, используемых в таких смартфонах, как Samsung Galaxy SII и SIII, в двух поколениях “смартфонпланшетмаша?” Samsung Note. Актуальным на сегодня является Mali-400 MP в двух- и четырехядерных вариантах. На подходе чипы Mali-T604 и Mali-T658, производительность которых до 5 раз выше, чем у Mali-400.

Adreno – это графические чипы, которые разрабатывает одноименное подразделение американской Qualcomm. Название Adreno является анаграммой от Radeon. До Qualcomm подразделение принадлежало ATI, а чипы носили название Imageon. Последние несколько лет Qualcomm при производстве SoC использовала чипы 2xx серии: Adreno 200, Adreno 205, Adreno 220, Adreno 225. Последний из списка – совсем свежий чип – выполненный по 28нм технологии, самый мощный из Adreno 2хх серии. Его производительность в 6 раз выше, чем у “старичка” Adreno 200. В 2013 году все больше устройств получат графические процессоры Adreno 305 и Adreno 320. Уже сейчас 320-ый установлен в Nexus 4 и китайскую версию Nokia Lumia 920T, по некоторым параметрам чип в 2 раза мощнее 225-го.

GeForce ULP (ultra-low power) – мобильная версия видео-чипа от nVIDIA, входит в состав системы-на-кристалле Tegra всех поколений. Одним из важнейших конкурентных преимуществ Tegra является специализированный контент, предназначенный только для устройств на основе этой SoC. У nVIDIA традиционно тесная связь с разработчиками игр, и их команда Content Development работает вместе с ними для того, чтобы оптимизировать игры для графических решений GeForce. Для доступа к таким играм nVIDIA даже запустила Android-приложение Tegra Zone, специализированный аналог Android Market, в котором можно скачать оптимизированные для Tegra приложения.

Производительность графических процессоров обычно измеряется по трем параметрам:

– количество треугольников в секунду обычно в миллионах – Мега (MTriangles/s);

– количество пикселей в секунду обычно в миллионах – Мега (MPixel/s);

– количество операций с плавающей точкой в секунду обычно в миллиардах – Гига (GFLOPS).

По “флопсам” требуется небольшое пояснение. FLOPS (FLoating-point Operations Per Second) – это количество вычислительных операций или инструкций, выполняемых над операндами с плавающей точкой (запятой) в секунду. Операнд с плавающей точкой – это нецелое число (корректней было бы сказать “с плавающей запятой”, ведь знаком, отделяющим целую часть числа от дробной в русском языке является именно запятая). Понять какой графический процессор установлен в твоем смартфоне поможет ctrl+F и таблица приведенная ниже. Обратите внимание на то, что GPU разных смартфонов работают на разной частоте. Что бы вычислить производительность в GFLOPS для конкретной модели необходимо число указанное в столбце “производительность в GFLOPS” разделить на 200 и умножить на частоту отдельно взятого GPU (например в Galaxy SIII GPU работает на частоте 533МГц значит 7,2 / 200 * 533 = 19,188):

Название смартфона/планшета Процессор Графический процессор Производительность в GFLOPS
Samsung Galaxy S 4 Samsung Exynos 5410 PowerVR SGX544MP3 21,6 @200МГц
HTC One Qualcomm Snapdragon 600 APQ8064T Adreno 320 20,5 @200МГц
Samsung Galaxy S III, Galaxy Note II, Galaxy Note 10.1 Samsung Exynos 4412 Mali-400 MP4 7,2 @200МГц
Samsung Chromebook XE303C12, Nexus 10 Samsung Exynos 5250 Mali-T604 MP4 36 @200МГц
Samsung Galaxy S II, Galaxy Note, Tab 7.7, Galaxy Tab 7 Plus Samsung Exynos 4210 Mali-400 MP4 7,2 @200МГц
Samsung Galaxy S, Wave, Wave II, Nexus S, Galaxy Tab, Meizu M9 Samsung Exynos 3110 PowerVR SGX540 3,2 @200Мгц
Apple iPhone 3GS, iPod touch 3gen Samsung S5PC100 PowerVR SGX535 1,6 @200Мгц
LG Optimus G, Nexus 4, Sony Xperia Z Qualcomm APQ8064(ядра Krait) Adreno 320 20,5 @200МГц
HTC One XL, Nokia Lumia 920, Lumia 820, Motorola RAZR HD, Razr M, Sony Xperia V Qualcomm MSM8960(ядра Krait) Adreno 225 12,8 @200МГц
HTC One S, Windows Phone 8x, Sony Xperia TX/T Qualcomm MSM8260A Adreno 220 ~8,5* @200МГц
HTC Desire S, Incredible S, Desire HD, SonyEricsson Xperia Arc, Nokia Lumia 800, Lumia 710 Qualcomm MSM8255 Adreno 205 ~4,3* @200МГц
Nokia Lumia 610, LG P500 Qualcomm MSM7227A Adreno 200 ~1,4* @128МГц
Motorola Milestone, Samsung i8910, Nokia N900 TI OMAP3430 PowerVR SGX530 1,6 @200Мгц
Samsung Galaxy Nexus, Huawei Ascend P1, Ascend D1, Amazon Kindle Fire HD 7″ TI OMAP4460 PowerVR SGX540 3,2 @200Мгц
RIM BlackBerry Playbook, LG Optimus 3D P920, Motorola ATRIX 2, Milestone 3, RAZR, Amazon Kindle Fire первого и второго поколений TI OMAP4430 PowerVR SGX540 3,2 @200Мгц
Motorola Defy, Milestone 2, Cliq 2, Defy+, Droid X, Nokia N9, N950, LG Optimus Black, Samsung Galaxy S scLCD TI OMAP3630 PowerVR SGX530 1,6 @200Мгц
Acer Iconia Tab A210/A211/A700/ A701/A510, ASUS Transformer Pad, Google Nexus 7, Eee Pad Transformer Prime, Transformer Pad Infinity, Microsoft Surface, Sony Xperia Tablet S, HTC One X/X+, LG Optimus 4X HD, Lenovo IdeaPad Yoga nVidia Tegra 3 GeForce ULP 4,8 @200МГц
Acer Iconia Tab A500, Iconia Tab A501, Iconia Tab A100, ASUS Eee Pad Slider, Eee Pad Transformer, HTC Sensatoin/XE/XL/4G, Lenovo IdeaPad K1, ThinkPad Tablet, LG Optimus Pad, Optimus 2X, Motorola Atrix 4G, Electrify, Photon 4G, Xoom, Samsung Galaxy Tab 10.1, Galaxy Tab 8.9, Sony Tablet P, Tablet S nVidia Tegra 2 GeForce ULP 3,2 @200МГц
Apple iPhone 5 Apple A6 PowerVR SGX543MP3 19,2 @200МГц
Apple iPad 2, iPhone 4S, iPod touch 5gen, iPad mini Apple A5 PowerVR SGX543MP2 12,8 @200МГц
Apple iPad, iPhone 4, iPod touch 4gen Apple A4 PowerVR SGX535 1,6 @200МГц

* – данные приблизительные.

Приведу еще одну таблицу с абсолютными значениями производительности самых популярных смартфонов верхнего ценового диапозона:

* – неофициальные данные.

Мощность мобильной графики растет от года к году. Уже в этом году в топовых смартфонах мы можем увидеть игры уровня PS3/X-Box360. Одновременно с мощностью сильно растет энергопотребление SoC и неприлично снижается автономность мобильных устройств. Что ж, будем ждать прорыва в области производства источников питания!

Еще один пожиратель энергии в современном мобильном устройстве – это, безусловно, дисплей. Экраны в мобильных телефонах становятся все краше. Дисплеи смартфонов выпущенных с разницей всего лишь в год, разительно отличаются по качеству картинки. В следующей статье цикла я расскажу о дисплеях: каких типов они бывают, что такое PPI, от чего зависит энергопотребление и прочее.

Исходным материалом для рендеринга является множество треугольников различного размера, из которых складываются все объекты виртуального мира: пейзаж, игровые персонажи, монстры, оружие и т.д. Однако сами по себе модели, созданные из треугольников, выглядят как проволочные каркасы. Поэтому на них накладываются текстуры - цветные двухмерные «обои». И текстуры, и модели помещаются в память графической карты, а дальше, при создании каждого кадра игрового действия выполняется цикл рендеринга, состоящий из нескольких этапов.

1. Игровая программа отправляет графическому процессору информацию, описывающую игровую сцену: состав присутствующих объектов, их окраску, положение относительно точки наблюдения, освещение и видимость. Передаются и дополнительные данные, характеризующие сцену и позволяющую видеокарте увеличить реалистичность получаемого изображения, добавив туман, размытие, блики и т.д.

2. Графический процессор располагает трехмерные модели в кадре, определяет, какие из входящих в них треугольников находятся на виду и отсекает скрытые другими объектами или, например, тенями.

Затем создаются источники света и определяется их влияние на цвет освещаемых объектов. Этот этап рендеринга называется «трансформация и освещение» (T&L - Transformation & Lighting).

3. На видимые треугольники накладываются текстуры с применением различных технологий фильтрации. Билинейная фильтрация предусматривает наложение на треугольник двух версий текстуры с различным разрешением. Результатом ее использования являются хорошо различимые границы между областями четких и размытых текстур, возникающие на трехмерных поверхностях перпендикулярно направлению обзора. Трилинейная фильтрация, использующая три варианта одной текстуры, позволяет создать более мягкие переходы.

Однако в результате использования обеих технологий по-настоящему четко выглядят лишь те текстуры, которые расположены перпендикулярно к оси зрения. При взгляде под углом они сильно размываются. Для того чтобы это предотвратить, используется анизотропная фильтрация.

Такой метод фильтрации текстур задается в настройках драйвера видеоадаптера либо непосредственно в компьютерной игре. Кроме того, можно изменять силу анизотропной фильтрации: 2х, 4х, 8х или 16х - чем больше «иксов», тем более четкими будут изображения на наклонных поверхностях. Но при увеличении силы фильтрации возрастает нагрузка на видеокарту, что может привести к снижению скорости работы и к уменьшению количества кадров, генерируемых в единицу времени.

На этапе текстурирования могут использоваться различные дополнительные эффекты. Например, наложение карт среды (Enironmental Mapping) позволяет создавать поверхности, в которых будет отражаться игровая сцена: зеркала, блестящие металлические предметы и т.д. Другой впечатляющий эффект получается с применением карт неровностей (Bump Mapping), благодаря которому свет, падающий на поверхность под углом, создает видимость рельефа.
Текстурирование является последним этапом рендеринга, после которого картинка попадает в кадровый буфер видеокарты и выводится на экран монитора.

Электронные компоненты видеокарты

Теперь, когда стало понятно, каким образом происходит процесс построения трехмерного изображения, можно перечислить технические характеристики компонентов видеокарты, которые определяют скорость процесса. Главными составными частями видеокарты являются графический процессор (GPU - Graphics Processing Unit) и видеопамять.

Графический процессор

Одной из основных характеристик этого компонента (как и центрального процессора ПК), является тактовая частота. При прочих равных условиях, чем она выше, тем быстрее происходит обработка данных, а следовательно - увеличивается количество кадров в секунду (FPS - frames per second) в компьютерных играх. Частота графического процессора - важный, но не единственный, влияющий на его производительность параметр - современные модели производства Nvidia и ATI, имеющие сопоставимый уровень быстродействия, характеризуются различными частотами GPU.

Для адаптеров Nvidia, обладающих высокой производительностью, характерны тактовые частоты GPU от 550 МГц до 675 МГц. Частоту работы графического процессора меньше 500 МГц имеют «середнячки» и дешевые низкопроизводительные карты.
В то же время GPU «топовых» карт производства ATI имеют частоты от 600 до 800 МГц, и даже у самых дешевых видеоадаптеров частота графического процессора не опускается ниже 500 МГц.

Однако, несмотря на то, что графические процессоры Nvidia обладают меньшей частотой, чем GPU, разработанные ATI, они обеспечивают, по крайней мере, такой же уровень производительности, а зачастую - и более высокий. Дело в том, что не меньшее значение, чем тактовая частота, имеют другие характеристики GPU.

1. Количество текстурных модулей (TMU - Texture Mapping Units) - элементов графического процессора, выполняющих наложение текстур на треугольники. От количества TMU напрямую зависит скорость построения трехмерной сцены.
2. Количество конвейеров рендеринга (ROP - Render Output Pipeline) - блоков, выполняющих «сервисные» функции (пару примеров, pls). В современных графических процессорах ROP, как правило, меньше, чем текстурных модулей, и это ограничивает общую скорость текстурирования. К примеру, чип видеокарты Nvidia GeForce 8800 GTX имеет 32 «текстурника» и 24 ROP. У процессора видеокарты ATI Radeon HD 3870 только 16 текстурных моделей и 16 ROP.

Производительность текстурных модулей выражается в такой величине как филлрейт - скорость текстурирования, измеряемая в текселах за секунду. Видеокарта GeForce 8800 GTX имеет филлрейт в 18,4 млрд текс/с. Но более объективным показателем является филлрейт, измеряемый в пикселах, так как он отражает скорость работы ROP. У GeForce 8800 GTX эта величина равна 13,8 млрд пикс./с.
3. Количество шейдерных блоков (шейдерных процессоров), которые - как следует из названия - занимаются обработкой пиксельных и вершинных шейдеров. Современные игры активно используют шейдеры, так что количество шейдерных блоков имеет решающее значение для определения производительности.

Не так давно графические процессоры имели отдельные модули для выполнения пиксельных и вершинных шейдеров. Видеокарты Nvidia серии GeForce 8000 и адаптеры ATI Radeon HD 2000 первыми перешли на унифицированную шейдерную архитектуру. Графические процессоры этих карт имеют блоки, способные обрабатывать как пиксельные, так и вершинные шейдеры - универсальные шейдерные процессоры (потоковые процессоры). Такой подход позволяет полностью задействовать вычислительные ресурсы чипа при любом соотношении пиксельных и вершинных расчетов в коде игры. Кроме того, в современных графических процессорах шейдерные блоки часто работают на частоте, превышающей тактовую частоту GPU (например, у GeForce 8800 GTX эта частота составляет 1350 МГц против «общих» 575 МГц).

Обращаем ваше внимание на то, что компании Nvidia и ATI по-разному считают количество шейдерных процессоров в своих чипах. К примеру, Radeon HD 3870 имеет 320 таких блоков, а GeForce 8800 GTX - только 128. На самом деле, ATI указывает вместо целых шейдерных процессоров их составные компоненты. В каждом шейдерном процессоре содержится по пять компонентов, так что общее количество шейдерных блоков у Radeon HD 3870 - всего 64, поэтому и работает эта видеокарта медленнее, чем GeForce 8800 GTX.

Память видео карты

Видеопамять по отношению к GPU выполняет те же функции, что и оперативная память - по отношению к центральному процессору ПК: она хранит весь «строительный материал», необходимый для создания изображения - текстуры, геометрические данные, программы шейдеров и т.д.

Какие характеристики видеопамяти влияют на производительность графической карты

1. Объем. Современные игры используют огромное количество текстур с высоким разрешением, и для их размещения требуется соответствующий объем видеопамяти. Основная масса выпускаемых сегодня «топовых» видеоадаптеров и карт среднего ценового диапазона снабжается 512 Мб памяти, которая не может быть увеличена впоследствии. Более дешевые видеокарты оснащаются вдвое меньшим объемом памяти, для современных игр его уже недостаточно.

В случае нехватки памяти графический процессор вынужден постоянно загружать текстуры из оперативной памяти ПК, связь с которой осуществляется гораздо медленнее, в результате производительность может заметно снижаться. С другой стороны, чрезмерно большой объем памяти может не дать никакого увеличения скорости, так как дополнительное «место» просто не будет использоваться. Покупать видеоадаптер с 1 Гб памяти имеет смысл только в том случае, если он принадлежит к «топовым» продуктам (видеокарты ATI Radeon HD 4870, Nvidia GeForce 9800, а также новейшие карты серии GeForce GTX 200).

2. Частота. Этот параметр у современных видеокарт может изменяться от 800 до 3200 МГц и зависит, в первую очередь, от типа используемых микросхем памяти. Чипы DDR 2 могут обеспечить рабочую частоту в пределах 800 МГц и используются только в самых дешевых графических адаптерах. Память GDDR 3 и GDDR 4 увеличивает частотный диапазон вплоть до 2400 МГц. Новейшие графические карты ATI Radeon HD 4870 используют память GDDR-5 с фантастической частотой - 3200 МГц.

Частота памяти, как и частота графического процессора, оказывает большое влияние на производительность видеокарты в играх, особенно при использовании полноэкранного сглаживания. При прочих равных условиях, чем больше частота памяти, тем выше быстродействие, т.к. графический процессор будет меньше «простаивать» в ожидании поступления данных. Частота памяти в 1800 МГц является нижней границей, отделяющей высокопроизводительные карты от менее быстрых.

3. Разрядность шины видеопамяти гораздо сильнее влияет на общую производительность карты, чем частота памяти. Она показывает, сколько данных может передать память за один такт. Соответственно, двукратное увеличение разрядности шины памяти эквивалентно удвоению ее тактовой частоты. Основная масса современных видеокарт имеют 256-битную шину памяти. Уменьшение разрядности до 128 или, тем более, до 64 бит наносит сильный удар по быстродействию. С другой стороны, в самых дорогих видеокартах шина может быть «расширена» до 512 бит (пока этим может похвастаться лишь новейший GeForce GTX 280), что оказывается весьма кстати, принимая во внимание мощность их графических процессоров.

Где найти информацию о технических характеристиках видеокарты

Если графическая карта обладает некими выдающимися параметрами (высокая тактовая частота процессора и памяти, ее объем), то они, как правило, указываются непосредственно на коробке. Но наиболее полные спецификации видеоадаптеров и GPU, на которых они основаны, можно найти только в Интернете. Общая информация выкладывается на корпоративных сайтах производителей графических процессоров: Nvidia (www.nvidia.ru) и ATI (www.ati.amd.com/ru). Подробности можно узнать на неофициальных веб-сайтах, посвященных видеокартам - www.nvworld.ru и www.radeon.ru. Хорошим подспорьем станет электронная энциклопедия Wikipedia (www.ru.wikipedia.org). Пользователи, покупающие карту с прицелом на разгон могут воспользоваться ресурсом www.overclockers.ru.

Одновременное использование двух видеокарт

Для того чтобы получить максимальную производительность, можно установить в компьютер сразу две видеокарты. Производители предусмотрели для этого соответствующие технологии - SLI (Scalable Link Interface, используется картами Nvidia) и CrossFire (разработка ATI). Для того чтобы воспользоваться ими, материнская плата должна не только иметь два слота PCI-E для видеокарт, но и поддерживать одну из названных технологий. Многие «материнки» на чипсетах Intel могут использовать платы ATI в режиме CrossFire, а вот объединить в одну «упряжку» две (или даже три!) видеокарты производства Nvidia могут лишь платы на чипсетах этой же фирмы. В случае, если материнская плата не обладает поддержкой этих технологий, две видеокарты смогут с ней работать, но в играх будет использоваться только одна, а вторая лишь даст возможность выводить изображение на пару дополнительных мониторов.
Заметим, что использование двух видеокарт не приводит к удвоению производительности. Средний результат, на который стоит рассчитывать - 50% прироста скорости. Кроме того, весь потенциал тандема будет раскрыт лишь при использовании мощного центрального процессора и монитора с высоким разрешением.

Что такое шейдеры

Шейдеры - микропрограммы, присутствующие в коде игры, с помощью которых можно изменять процесс построения виртуальной сцены, открывая возможности, недостижимые при использовании традиционных средств 3D-рендеринга. Современная игровая графика без шейдеров немыслима.

Вершинные шейдеры изменяют геометрию трехмерных объектов, благодаря чему можно реализовать естественную анимацию сложных моделей игровых персонажей, физически корректную деформацию предметов или настоящие волны на воде. Пиксельные шейдеры применяются для изменения цвета пикселей и позволяют создавать такие эффекты, как реалистичные круги и рябь на воде, сложное освещение и рельеф поверхностей. Кроме того, с помощью пиксельных шейдеров осуществляется постобработка кадра: всевозможные «кинематографические» эффекты размытия движущихся объектов, сверхъяркого света и т.д.

Существует несколько версий реализации шейдерной модели (Shader Model). Все современные видеокарты поддерживают пиксельные и вершинные шейдеры версии 4.0, обеспечивающие по сравнению с предыдущей - третьей - версией более высокую реалистичность эффектов. Shader Model 4.0 поддерживается API DirectX 10 , которая работает исключительно в среде Windows Vista. Кроме того, сами компьютерные игры должны быть «заточены» под DirectX 10.

Нужна ли AGP-видеокарта старой системе

Если «материнка» вашего ПК оснащена портом AGP, возможности апгрейда видеокарты сильно ограничены. Максимум, который может себе позволить обладатель такой системы - это видеокарты серии Radeon HD 3850 фирмы AMD (ATI).

По современным меркам, они обладают производительностью ниже среднего. Кроме того, подавляющее большинство материнских плат с поддержкой интерфейса AGP предназначено для устаревших процессоров Intel Pentium 4 и AMD Athlon XP, так что общее быстродействие системы все равно будет недостаточно высоким для современной трехмерной графики. Только на материнские платы для процессоров AMD Ahtlon 64 с разъемом Socket 939 стоит устанавливать новые видеокарты с портом AGP. Во всех остальных случаях лучше купить новый компьютер с интерфейсом PCI-E, памятью DDR 2 (или DDR 3) и современным ЦП.

Теги материала: графическая карта, видео, карта, ускоритель, графики

Современные видеокарты, в силу требований от них огромной вычислительной мощи при работе с графикой, оснащаются своим собственным командным центром, иначе говоря - графическим процессором.

Это было сделано для того, чтобы «разгрузить» центральный процессор , который из-за своей широкой «сферы применения», просто не в состоянии справляться с требованиями, которые выдвигает современная игровая индустрия.

Графические процессоры (GPU) по сложности абсолютно не уступают центральным процессорам, но из-за своей узкой специализации, в состоянии более эффективно справляться с задачей обработки графики, построением изображения, с последующим выводом его на монитор.

Если говорить о параметрах, то они у графических процессоров весьма схожи с центральными процессорами. Это уже известные всем параметры, такие как микроархитектура процессора, тактовая частота работы ядра, техпроцесс производства. Но у них имеются и довольно специфические характеристики. Например, немаловажная характеристика графического процессора – это количество пиксельных конвейеров (Pixel Pipelines). Эта характеристика определяет количество обрабатываемых пикселей за один такт роботы GPU. Количество данных конвейеров может различаться, например, в графических чипах серии Radeon HD 6000, их количество может достигать 96.

Пиксельный конвейер занимается тем, что просчитывает каждый последующий пиксель очередного изображения, с учётом его особенностей. Для ускорения процесса просчёта используется несколько параллельно работающих конвейеров, которые просчитывают разные пиксели одного и того же изображения.

Также, количество пиксельных конвейеров влияет на немаловажный параметр – скорость заполнение видеокарты . Скорость заполнения видеокарты можно рассчитать умножив частоту ядра на количество конвейеров.

Давайте рассчитаем скорость заполнения, к примеру, для видеокарты AMD Radeon HD 6990 (рис.2) Частота ядра GPU этого чипа составляет 830 МГц, а количество пиксельных конвейеров – 96. Нехитрыми математическими вычислениями (830х96), мы приходим к выводу, что скорость заполнения будет равна 57,2 Гпиксель/c.


Рис. 2

Помимо пиксельных конвейеров, различают ещё так называемых текстурные блоки в каждом конвейере. Чем больше текстурных блоков, тем больше текстур может быть наложено за один проход конвейера, что также влияет на общую производительность всей видеосистемы. В вышеупомянутом чипе AMD Radeon HD 6990, количество блоков выборки текстур составляет 32х2.

В графических процессорах, можно выделить и другой вид конвейеров – вершинные, они отвечают за расчёт геометрических параметров трёхмерного изображения.

Сейчас, давайте рассмотрим поэтапный, несколько упрощенный, процесс конвейерного расчёта, с последующим формированием изображения:

1 - й этап. Данные о вершинах текстур поступают в вершинные конвейеры, которые занимаются рассчётом параметров геометрии. На этом этапе подключается блок «T&L» (Transform & Lightning). Этот блок отвечает за освещение и трансформацию изображения в трёхмерных сценах. Обработка данных в вершинном конвейере проходит за счёт программы вершинного шейдера (Vertex Shader).

2 - ой этап. На втором этапе формирования изображения подключается специальный Z-буфер, для отсечения невидимых полигонов и граней трёхмерных объектов. Далее происходит процесс фильтрации текстур, для этого в «бой» вступают пиксельные шейдеры. В программных интерфейсах OpenGL или Direct3D описаны стандарты для работы с трёхмерными изображениями . Приложение вызывает определённую стандартную функцию OpenGL или Direct3D, а шейдеры эту функцию выполняют.

3–ий этап. В завершающем этапе построения изображения в конвейерной обработке, данные передаются в специальный буфер кадров.

Итак, только что мы вкратце рассмотрели структуру и принципы функционирования графических процессоров, информация,конечно, «не из лёгких» для восприятия, но для общего компьютерного развития, я думаю, будет весьма полезна:)

GPU (Graphics Processing Unit) — это процессор, предназначенный исключительно для операций по обработке графики и вычислений с плавающей точкой. Он в первую очередь существует для того, чтобы облегчить работу основного процессора, когда дело касается ресурсоемких игр или приложений с 3D-графикой. Когда вы играете в какую-либо игру, GPU отвечает за создание графики, цветов и текстур, в то время как CPU может заняться искусственным интеллектом или расчетами механики игры.

На что мы смотрим в первую очередь, выбирая себе смартфон? Если на минутку отвлечься от стоимости, то в первую очередь мы, конечно, выбираем размер экрана. Затем нас интересует камера, объем оперативной, количество ядер и частота работы процессора. И тут все просто: чем больше, тем лучше, а чем меньше, тем, соответственно, хуже. Однако в современных устройствах используется еще и графический процессор, он же GPU. Что это такое, как он работает и почему про него важно знать, мы расскажем ниже.

Архитектура графического процессора не сильно отличается от архитектуры CPU, однако она более оптимизирована для эффективной работы с графикой. Если заставить графический процессор заниматься любыми другими расчетами, он покажет себя с худшей стороны.

Видеокарты, которые подключаются отдельно и работают на высоких мощностях, существуют только в ноутбуках и настольных компьютерах. Если мы говорим об -устройствах, то мы говорим об интегрированной графике и том, что мы называем SoC (System-on-a-Chip). К примеру, в процессоре интегрирован графический процессор Adreno 430. Память, которую он использует для своей работы, это системная память, в то время как для видеокарт в настольных ПК выделяется доступная только им память. Правда, существуют и гибридные чипы.

В то время как процессор с несколькими ядрами работает на высоких скоростях, графический процессор имеет много процессорных ядер, работающих на низких скоростях и занимающихся лишь вычислением вершин и пикселей. Обработка вершин в основном крутится вокруг системы координат. GPU обрабатывает геометрические задачи, создавая трехмерное пространство на экране и позволяя объектам перемещаться в нем.

Обработка пикселей является более сложным процессом, требующим большой вычислительной мощности. В этот момент графический процессор накладывает различные слои, применяет эффекты, делает все для создания сложных текстур и реалистичной графики. После того как оба процесса будут обработаны, результат переносится на экран вашего смартфона или планшета. Все это происходит миллионы раз в секунду, пока вы играете в какую-нибудь игру.

Конечно же, этот рассказ о работе GPU является весьма поверхностным, но его достаточно для того, чтобы составить правильное общее представление и суметь поддержать разговор с товарищами или продавцом электроники либо понять — почему ваше устройство так сильно нагрелось во время игры. Позднее мы обязательно обсудим преимущества тех или иных GPU в работе с конкретными играми и задачами.

По материалам AndroidPit

Не многие пользователи знают, что видеокарты могут выполнять намного больше, чем просто отображать картинку на мониторе. Используя CUDA, Stream и остальные подобные технологии, можно существенно поднять производительность компьютера, взвалив на себя не свои вычисления. Ниже будет описан принцип работы.

Чтобы вывести на экран непрерывные кадры в какой-нибудь современной игры, компьютеру требуется хорошая производительность. Стоит предположить, что современные видеокарты по производительности соответствуют свежим версиям процессоров.

Стоит отметить, что когда видеоадаптер простаивает и не выполняет обработку изображения, ее возможности остаются невостребованными. Чтобы не было такого простоя и можно было взвалить на нее некоторые обязанности, что снизит нагрузку на процессор, необходимо применять специальные опции ускорения компьютера. Ниже будет подробная инструкция о принципах работы этой технологии, которая может увеличить производительность ПК.

Каким образом видеоплата увеличивает скорость работы компьютера?

Воспользоваться возможностями видеокарт могут только специальные приложения. Данные программы могут совмещаться с видеокартой и используют одну из 4-х технологий физического ускорения.

CUDA. Данную разработку создала корпорация Nvidia. Эта технология может применяться для проведения сложных вычислительных манипуляций и для редактирования видео и картинок.

Stream. Эта технология механического ускорения аналогична первой, но разработана изготовителем видеоадаптеров AMD.
Обе эти технологии поддерживаются всеми операционками, кроме Mac OS, и используют только с видеокартами подходящего изготовителя. Создатели ПО вынуждены проводить дополнительную работу, чтобы видеокарты обоих разработчиков смогли увеличивать скорость работы их приложений. Ниже представлены технологии, которые способны работать с платами обоих изготовителей.

OpenCL. Эта технология была выпущена корпорация Apple в 2008 году и поддерживается всеми операционками и любым ПО. Однако, на сегодняшний день нет приложений для ускорения компьютера с использованием этой технологии. Кроме того, по увеличению продуктивности OpenCL существенно позади от первых двух технологий.

DirectCompute. Эта технология была встроена компанией Microsoft в DirectX 11. Но она способна работать только на операционках Windows 7 и Vista, и то с небольшим пакетом приложений.

Какое увеличение производительности предоставляет видеокарта?

Прирост непосредственно зависит от графического адаптера и производительности остальных элементов компьютера. Увеличение производительности устанавливается утилитами и проводимыми операциями. На современном среднем ПК увеличение скорости преобразования высококачественного видео может достигать до 20-ти раз. А вот редактирование фильтрами и спецэффектами фотоснимком может ускориться в триста раз.

Что влияет на высокую продуктивность CUDA и подобных технологий?

CPU на материнке при выполнении сложных задач изначально разделяет процесс на несколько поменьше, а после выполняет их последовательную обработку. Полученный промежуточный результат размещается в маленькой, но быстрой памяти процессора. Когда отделы памяти переполняются, файлы перемещаются в кэш-память, которая также расположена в процессоре. Но на обмен информацией между процессором и оперативкой требуется довольно много времени, поэтому скорость получается не совсем высокой.

Видеокарты иногда могут проводить такие манипуляции значительно быстрее. На это может влиять несколько обстоятельств. Одно из них параллельные вычисления. При необходимости провести несколько подобных манипуляций, некоторые из них могут проводиться графическим модулем совместно с процессором.

К примеру, при работе с видео или картинками утилите необходимо изменять огромное количество пикселей, и при этом используя повторяющиеся способы. Специально для этого графический адаптер обладает сотнями мелких процессоров, которые носят названия потоковые.

Кроме того, необходим быстрый доступ к памяти. По аналогии с центральными процессами, графические адаптеры также располагают своей промежуточной памятью и оперативкой. Но в этом случае они обладают множеством регистров скоростной памяти, что существенно увеличивает скорость вычислений.

Какое число потоковых CPU обладают видеокарты?

На это влияет модель процессора. К примеру, GeForse GTX 590 располагает двумя модулями Fermi, каждый из которых обладает 512 потоковыми CPU. Одна из мощнейших видеоплат от AMD — Radeon HD 6990 – также оснащена парой модулей, в каждом из которых по 1536 процессоров. Но при всем этом, HD 6990 существенно проигрывает GTX 590 по скорости.

Как запустить CUDA или Stream?

Ничего запускать не следует, так как технологии представляют собой элемент аппаратной части видеокарт. После того, как драйвер графического адаптера установить приложение, которое поддерживает какую-то технологию, тогда автоматически произойдет увеличение скорости работы компьютера. Чтобы получить полную производительность, необходимо инсталлировать свежую версию драйвера.
Стоит отметить, что пользователям видеокарт AMD требуется скачать и инсталлировать набор AMD Media Codec Package.

Почему не все утилиты работают с этими технологиями?

До того момента, пока OpenCL не будет широко распространен, создателям программного обеспечения надо подстраивать каждое приложение для возможности работать с видеоплатами Nvidia и AMD. Но при этом не каждый производитель пойдет на дополнительные расходы.

Кроме того, не все приложения имеют возможность обеспечивать постоянный поток несложных операций вычислений, которые могут происходить параллельно. Это может отлично сработать совместно с программами по редактированию видео и графики. Для почтовиков или текстовых редакторов эти технологии не сильно помогут.

Супер ПК

К примеру, китайский ПК Tianhe-1А располагает 7168 графическими модулями Nvidia, которые поддерживают отличную производительность. При этом проходит 2,5 трлн вычислений в секунду. Этот компьютер расходует 4 мегаватта энергии. Столько электричества расходует городок с пятью тысячами человек населения.

Способен ли графический адаптер заменить центральный?

Такую замену провести невозможно. Устройство этих процессоров полностью разное. CPU представляет собой универсальный вычислительный блок, который имеет возможность обрабатывать и пересылать информацию другим элементам ПК. В свою очередь, видеокарты являются узконаправленными устройствами, несмотря на то, что выполняют маленькое количество операций, но при этом с высокой скоростью.

Что будет в будущем: универсальные чипы

Чтобы увеличить производительность CPU, корпорации Intel и AMD постоянно добавляют ядра в свои процессоры. Кроме того, они постоянно добавляют новые технологии, которые способны увеличить эффективность вычислительных операций и возможность параллельной обработки информации.

По сравнению с центральными процессорами, видеокарты уже располагают большим количеством простых ядер, которые способны очень быстро выполнить комплексные вычисления.

Но получается так, что начальные отличия в принципах работы видеокарты и CPU понемногу стираются. Поэтому разработка универсального чипа очень логична. На сегодняшний день пользователи компьютера могут использовать весь потенциал видеокарты без дорогих графических чипов.

Современные процессоры от ведущих разработчиков, на данный момент могут продемонстрировать возможность соединить графический адаптер и CPU и работать, как один универсальный вычислительный блок.

В любом из чипов ядра CPU и видеокарты размещаются на единственном кристалле. Это предоставляет возможность быстрее разделить вычислительные манипуляции между ядрами. Эти применяемые технологии носят имя Intel Quick Sync и AMD Арр. В данное время уже имеются отдельные приложения, которые применяют подобную технологию.

В общем, это все, что необходимо знать о различиях центрального процессора и видеокарты. Как видно из написанного, графический процессор способен выполнять некоторые операции центрального, особенно это касается современных компьютеров с мощными видеокартами.







2024 © gtavrl.ru.