Как включить рендеринг на видеокарте

Переезжаем на GPU Rendering, первый опыт(VrayRT 3.5 GPU).

Всем привет. За что мы любим 3д графику? За то, что она не дает заскучать, скорость появления новых технологий зашкаливает и нам нужно постоянно держаться на гребне волны, чтобы быть в теме. Мы можем просиживать за компьютером сутками ̶и̶ ̶г̶у̶с̶я̶м̶и̶ . Кто то любит ковыряться в машинах, а мы собираем своих франкенштейнов своими руками, чтобы увеличить скорость рендера на 5%, разгоняем процессоры, жжем материнки и видеокарты, ведь адреналин может выделяться не только в экстримальных местах, но и прямо за рабочим креслом :) С выходом Vray 3.5 сильно захотелось попробовать ГПУ рендеринг, и это превратилось в этот пост. Под катом все подробности выбора железа, установки, настройки, все подводные камни и ощущения от нереальных скоростей :)

После просмотра демо ролика мне буквально не сиделось на месте и я начал собирать информацию о ГПУ рендере везде где только мог, выяснилось что Bulgarov уже давно переехал на ГПУ:

и собрал какого-то нереального монстра с водяным охлаждением, а так же небезызсвестный DabartiCGI тоже перешел на ГПУ и во всю пропагандирует вегетарианство и сыроедство его.

У него система уже попроще, но всё равно довольно дорогая. Основные тезицы которые я почерпнул исследовав интернет такие:

1. Видеокарты могут быть разными(но просчет только Nvidia)

2. Количество памяти может быть разным. Оно не суммируется и используется наименьший объем памяти из всех доступных у видеокарт

3. Можно сочетать Ati/AMD(для отображения изображения с мониторов) и Nvidia для рассчетов

4. Sli режим не нужен, достаточно просто выбрать нужное количество видеокарт для просчетов

5. Основная проблема это охлаждение и питание.

Немудурствуя лукаво я зашел на интернет магазин и купил 7 видеокарт Nvidia 1070GTX 8Gb(25-35 тыс руб штука) которые были в наличии разных производителей и цены, чтобы проверить все тезисы выше, а так же 2 БП 1200 и 1000Ватт(8-10тр штука) чтобы точно хватило(заявленное потребление у видеокарт 150 ватт штука).

Первым делом выяснилось, что просто так вставить 7 видеокарт в одну материнскую плату невозможно, даже если в ней есть 7 PCI-express-x16, они попросту туда не влезут, поэтому покупать специальную материнскую плату не надо. Достаточно любой «Gaming» с 4хPCIexpress-x16(это стандартные длинные пазы для видеокарт) и 3xPCIexpress-x1(урезанные, обведены красным)

К сожалению моя настольная материнка была с тремя большими ГПУ слотами и совсем не подходила даже для простой ГПУ станции, поэтому я пошел на балкон:

У нормальных людей на балконе можно найти много чего полезного, а у меня там — рендерферма :) С открытым окном в минус 30 рендерится очень хорошо:) Оказалось что почти все материнки для Xeon «нормальные» и я выбрал Gigabyte x99 Gaming 5:

Она компануется 4мя длинными и 3мя короткими PCI через 1, что позволяет воткнуть 4 видеокарты в обычный корпус MidiTower за 1000 рублей. Вы спросите, а как же всё таки воткнуть все 7 видеокарт в одну материнскую оплату? Оказалось, что тут без рукожопства уже не обойтись и найти детали в обычном супермаркете электроники около дом нереально, потому что нужно расширить короткие PCIexpress слоты с помощью специальных расширителей — «Raiser» или «Extender PCI». Они есть разных видов, но мне посоветовали вот такие:

Попутно выяснилось что Fedex,DHL и все скоростные доставщики больше физлицам в РФ не отправляют ничего, продавец прискорбно сообщил об этом и добавил мне к заказу ещё 2 удлинителя(к 20 которым я купил) и отправил всё Почтой россии/EMS, я превратился в ждуна и собрал 4хГПУ систему:

До этого у меня была 980GTX 4 GB и я решил оставить её для тестов рендера с разной памятью. Zotac был самый дорогой, в металлическом корпусе, с диодной подсветкой и т п + ещё одна самая дешевая 1070gtx от нвидии из пластика и с всего 8 пинами питания вместо 16 как у остальных.

Проблемы при сборке:

1. Видеокарты очень длинные (возможно кому то придется вырезать мешающиеся запчасти)

3. Видеокарты лучше втыкать по одной, почему то на двух материнках изначально заработало только во втором слоте ГПУ с одной видеокартой(в биосе стоит по умолчанию первый PCIe)

4. Биос стартует гораздо дольше!

5. Windows может после старта висеть с черными экранами 2-5 минут каждый запуск(проверено на 7ке и 10ке). Просто ждите :)

Ну и вот так это всё примерно выглядит.

Я перешел на 4к рендеринг видео, поэтому мощностей всегда не хватает. Например этот 21 секундный ролик в Corona рендерился почти неделю, это конечно не приемлиемо:

Даже с использованием Vray один кадр с 4к честным дофом или моушен блюром рендерится около 2х часов на моем 44ядерном Xeon, что то типа такого:

Рекомендуем:  Как нарезать коническую шестерню на фрезерном станке

GPU на 4х видеокартах рендерит подобные кадры за 25-30 минут. При этом стоимость видеокарт в сумме около 2000$ , а процессор 2500$ Конечно настраивать ГПУ сцены несколько сложнее, некоторые вещи ещё не поддерживаются, но доработка практически любой сцены не занимает много времени.

Первый тест ГПУ я провел на сцене изначально сделанной под ЦПУ :

Превью рендеринг анимации 480*320 с честным дофом занял 3 часа, пока я ездил в магазин за едой на одном компьютере! Это очень круто.(сетка немного глючит изза неверного подбора ФПС, именно за этим такие тесты и прогоняются :)

Остальные видеокарты ушли во второй рабочий комп моему напарнику, и в ожидании удлинителей пока всё останется так как есть, а потом будем добивать рабочий объем до 7 ГПУ :) но это уже в следующем посте, а пока все — итак сильно затянул, не забывайте ставить оценки, если вам понравилось и репостить где надо и не надо.

Источник

Переезжаем на ГПУ рендеринг, Часть 2

Приветсвутю тебя, мой юный Шахтер! Да, да! теперь все визуализаторы где то внутри себя немного копают:) Ведь наступил золотой век рендеринга. Наконец то ваш компьютер почти ничем не ограничен в росте мощности, теперь не нужно держать на балконе целую рендер ферму чтобы считать картинки, достаточно и одного хорошего компьютера. В этой статье я расскажу о реальном опыте переезда на ГПУ рендеринг со всеми возможными проблемами и подводными камнями. Добро пожаловать под кат…

Исходными данными было наличие около 10 видеокарт 1070 различных форм и моделей и 15 рендер нод на процессорах Xeon, поддержка которых в рабочем состоянии превратилась в ад, поэтому было решено срочно избавиться от этого мусора и состряпать рендер ферму на ГПУ.

Недолго думая была куплена майнерская Asrock H110 PRO BTC+ материнская плата с поддержкой 13 PCI-e слотов для видеокарт

и собран живописный монстр на 10 видеокарт и 3 блока питания, которые синхронно запитывают их:

На данном лоте представлены 10 видеокарт в одной Windows системе, которые работают! При этом только 2 из них одинаковые, все остальные разные как по производителю, так и по модели, это сделано специально чтобы проверить стабильность работы такой системы. (Asus, Palit, Gigabyte, Nvidia, KFA )

На момент сборки вышла версия windows 10 которая обеспечивала поддержку 10 видеокарт в системе, windows 7 технически поддерживает не больше 6 штук(и судя по всему мелкомягкие не собираются ничего с этим делать), после этого драйверы “лишних” видеокарт пишут ошибку и работать отказываются, как их не проси.

Запуск любой системы сводится к запуску со всей этой горой железа и установке 1 видеодрайвера, а потом несколько перезагрузок вплоть до того момента, пока винда не поймет как над ней издеваются и не примет всё как есть (обеспечит драйверами все видеокарты) :)

Если вам подобное удастся то, рано радоваться, с этим всем ещё надо как то взлететь :) то есть начать суть процесса — ̶М̶А̶Й̶Н̶И̶Н̶Г̶!̶ Рендеринг!

Мы давно и сильно зависимы от Vray по многим причинам, поэтому будем рассматривать его и Redshift.

Итак, как вы видели на картинке в шапке, Вирей может рендерить 10 видеокартами одновременно(VrayRT CUDA 3.6 ) Но делает он это абсолютно бесполезно, рендеринг на 5х1080 видеокартах тестовый сцены с чайниками (HDR+2 VrayLight+motionBlur+DOF) занимает 6 минут, а 10х1080 — 9 минут. При рендере большим количеством видеокарт Врей сталкивается с большой проблемой распределения ресурсов процессора и памяти, что приводит к тотальному провалу рендертаймов, к тому же Windows 10 дополнительно жрет 20% процессора относительно рендеринга в 7ке. При этом Вирей грузит видео карты на 100% весь период времени, ощущение такое что вы на грузовике Прогресс пытаетесь стартовать к МКС. Куда девается вся мощность скорее всего знает только Дружко

По ощущениям эффективность рендеринга вирея линейна до 3х видеокарт в системе, после чего производительность резко падает… (тесты делались на разных материнских платах, количестве оперативной памяти и процессорах).

Все ксеоны уже давно переехали к новому хозяину и я уже было думал броситься с балкона 26го этажа прямо в сугроб, но на выручку пришел священный REDSHIFT

При этом он ограничен 8ю картами прямо на программном уровне.

Но как обычно нельзя просто так взять и решить все проблемы, в виндовс 10 по необъяснимым причинам больше 4х видеокарт редшифт запустить на рендеринг не мог и крашился с вероятностью 146% (Windows 10 официальный с сайта майкрософт, билд обеспечивающий поддержку 10 гпу).

Конечно же прошло немало часов и попыток переустановки драйверов, версий 3д макса, редшифта, танцев с бубнами, но помогло только одно — установка Windows 7.

Пришлось отказаться от 4х видеокарт и оставить в системе 6 штук, которые успешно запустились и начали считать всеми любимые чайники

К моему ужасу редшифт посчитал их за 2 минуты и похоронил Vray окончательно. Казалось бы вот оно — Счастье! Но и это оказалось не всё, Редшифт в продакшен режиме показывал стабильную загрузку ГПУ на 45 процентов мощности какие бы настройки рендера ему не запихивали:

Рекомендуем:  Nanostation m2 подключение ip камеры

“Это какой то заговор!” — скажите вы, я лишь отвечу:

Нагрузить Redshift на 80-90 процентов можно включив Progressive режим рендеринга, который при этом не позволяет считать Render Elements нивкаком виде.

Разные видеокарты в одной системе работают абсолютно стабильно!

Вирей сильно зависит от Процессора во время рендера на ГПУ. На слабом CPU потери мощности рендеринга могут быть даже с 1 Видеокартой, Редшифт такой проблемы не имеет.

Майнерские материнки в целом подходят для рендеринга, но важно понимать что они ограничены моделями процессоров и количеством Оперативной памяти.

Операционка крайне важна и рассчитывать сейчас на стабильные решения не стоит, вероятно пройдет какое то время, прежде чем RS и остальные дотянуться до тестирования на новейших системах и залатают дыры в поддержке мульти ГПУ.

Специальные майнерские видеокарты не умеют рендерить (было куплено 3 штуки для проверки). Их драйвера сильно отличаются от тех на которых пишется CUDA рендереров и вероятность того что они будут рендерить правильно крайне мала(прецеденты были, но это ничтожно малый процент)

Нельзя покупать видеокарты с одним кулером, они улетят с вами на луну

Блоки питания от 1000 ВТ и обязательно с огромным количеством 6+2pin или 8pin PCI, иначе вам придется питать все несколькими, а это не супер надежно. (Идеальный вариант — серверный БП на 2400WT)

Старые материнские платы с 6-7 PCI слотами с большой вероятность не будут работать, потому что не рассчитаны именно на видеокарты в этих слотах и число линий не соовтествует требованиям, о чем вам с удовольствием скажет винда

8 гб достаточно для текущих задач, истратить видео память представляется крайне сложной задачей, которая ещё и решается редшифтом с помощью использования Оперативной памяти

Октан, центилеос, Фсторм и прочие не были представлены потому что их материаловедение не вписывается в наш пайплайн уж точно и предыдущие их тесты не выявили существенных преимуществ по скорости относительно RS и уж точно не стало удобнее чем Vray в плане работы с материалами и сценой.

Немного рендера с дофчиком и моушен блюром для расслабления глаз.

На текущий момент идеального решения для работы с ГПУ не найдено, оптимальной рендер нодой является система из 6 видеокарт на Winows 7, вероятно очень скоро станет возможно работа редшифта с 8 видеокартами на Win10, но для этого нужно ждать новых релизов как одного, так и другого. Vray стабильно проигрывает в производительности, стабильности да и всём остальном. Забыть его не позволяет лишь широкая распространенность в той сфере в которой мы работаем (стоки и продажа 3д моделей).

PS: 35 видеокарт майнят около 100$ в сутки пока не рендерят :)) Майнить ВЫГОДНО!

Не забываем лайкать и подписываться на мой ВК )

Источник

Рендеринг с ускорением графического процессора и аппаратное кодирование/декодирование

В этой статье говорится об Adobe Insight (с ускорением графического процессора) и аппаратном декодировании/кодировании (Intel® Quick Sync) в Adobe Premiere Pro и Adobe Media Encoder.

Adobe Premiere Pro и Adobe Media Encoder могут использовать имеющиеся в вашей системе графические процессоры для распределения нагрузки между ЦП и ГП для повышения производительности. В настоящее время большая часть обработки выполняется центральным процессором, а графический процессор помогает в обработке определенных задач и функций.

Модуль рендеринга Mercury Playback Engine (с ускорением графического процессора) используется для рендеринга эффектов и функций с ускорением графического процессора.
Здесь представлен список эффектов с ускорением графического процессора в Adobe Premiere Pro. Чтобы найти эффекты с ускорением графического процессора, перейдите на панель Эффекты и найдите значок «Ускоренные эффекты».

Значок эффектов с ускорением графического процессора

Помимо обработки этих эффектов, Mercury Playback Engine (с ускорением графического процессора) используется для обработки изображений, изменения размеров, преобразования цветового пространства, изменения цвета и многого другого. Он также используется для воспроизведения и очистки временной шкалы и полноэкранного воспроизведения с использованием Mercury Transmit.

Здесь представлен список рекомендуемых графических карт для Adobe Premiere Pro.
Рекомендуется использовать графические процессоры с 4 ГБ видеопамяти, но объем памяти может варьироваться в зависимости от типа работы, выполняемой в Adobe Premiere Pro.

Общие требования к объему видеопамяти:

  • 1080p — 4 ГБ видеопамяти
  • 4К — 6 ГБ видеопамяти
  • 6K или выше — 8 ГБ видеопамяти или больше

Для ВР необходим объем видеопамяти не менее 6 ГБ. При работе со стереоскопическими кадрами с более высоким разрешением (например, 8K x 8K), вам может понадобиться больший объем видеопамяти. При использовании графических процессоров NVIDIA убедитесь в том, что установлена последняя версия драйвера, поддерживающая CUDA 9.2.

Важно помнить о том, что покупка более старой видеокарты означает, что поддержка драйверов закончится раньше, чем для новой карты.

  • Для Adobe Premiere Pro перейдите в «Файл» > «Настройки проекта» > «Общие» > «Рендеринг и воспроизведение видео», установите для параметра Модуль рендеринга значение Mercury Playback Engine GPU Acceleration (OpenCL/CUDA/Metal).
Рекомендуем:  Как правильно сделать подключение батарей к газовому котлу

Установка модуля рендеринга в Adobe Premiere Pro

  • Для Adobe Media Encoder перейдите в «Настройки» > «Общие» и установите для параметра Модуль рендеринга значение Mercury Playback Engine GPU Acceleration (OpenCL/CUDA/Metal) в разделе Рендеринг видео.

Установка модуля рендеринга в Adobe Media Encoder

В Adobe Media Encoder Модуль рендеринга также можно установить в правом нижнем углу панели Очередь.

Если параметр Mercury Playback Engine GPU Acceleration недоступен после обновления или переустановки Adobe Premiere Pro, выполните чистую установку драйверов графического процессора для решения этой проблемы.

  • Чистая установка драйверов NVIDIA.
  • Чистая установка драйверов AMD®.

Adobe Premiere Pro использует один графический процессор во время воспроизведения и нескольких графических процессоров для выполнения других задач, таких как Рендеринг точки входа и выхода и экспорт. Можно настроить CrossFire для представления нескольких графических процессоров в качестве одного логического ГП, и в этом случае Adobe Premiere Pro рассматривает его как один графический процессор.

В случае использования конфигурации с несколькими графическими процессорами (отличной от SLI или CrossFire) рекомендуется отключить функцию автоматического переключения графического процессора или графики на основе системы или драйвера.

Модуль Mercury Playback Engine, работающий на выделенном графическом процессоре, не используется для обработки всего, что связано с графическим процессором. Встроенный графический процессор может использоваться для определенных задач, таких как кодирование и декодирование определенных кодеков и действия пользовательского интерфейса, которые могут отображаться при отслеживании использования графического процессора.

Использование графического процессора зависит от нескольких факторов. Использование графического процессора при редактировании или рендеринге может быть максимальным в зависимости от количества используемых эффектов или функций с ускорением графического процессора и его вычислительных возможностей. Таким образом, мощный графический процессор, такой как NVIDIA RTX 2080, может работать быстрее, чем NVIDIA GTX 1060, но при этом показывать менее интенсивное использование. Это происходит потому, что он более мощный и ему может потребоваться меньше аппаратных ресурсов для обработки той же информации, что и NVIDIA GTX 1060 или другим графическим процессорам среднего класса. При использовании нескольких эффектов с ускорением графического процессора интенсивность его работы может сначала быть низкой, но затем увеличиться при использовании большего количества эффектов с ускорением графического процессора.

Это относится только к эффектам VR. Это сообщение появляется, когда у графического процессора недостаточно видеопамяти для обработки эффекта.

Кодирование с аппаратным ускорением

Intel® Quick Sync — это технология Intel®, которая использует специальные возможности обработки мультимедиа Intel® Graphics Technology для быстрого декодирования и кодирования, позволяя процессору выполнять другие задачи и повышать производительность. В настоящее время поддерживается только кодирование с помощью кодеков h.264 и HEVC (h.265). Эта функция доступна только в том случае, если используется процессор Intel® с поддержкой Intel® Quick Sync.

Здесь представлены системные требования для кодирования с аппаратным ускорением.

Включение и отключение аппаратного кодирования зависит от типа используемого процессора Intel®. Если поддерживаемый процессор не используется или технология Intel® Quick Sync отключена в BIOS, этот параметр может быть недоступен.

Чтобы его включить, выберите H.264/HEVC из раскрывающегося списка форматов в разделе Настройки экспорта. Затем на вкладке Видео перейдите в Настройки кодирования и установите для параметра Производительность значение Аппаратное кодирование. При выборе Программного кодирования отключится аппаратное кодирование и Adobe Premiere Pro не будет использовать Intel® Quick Sync для кодирования медиафайлов (это может увеличить время рендеринга).

Включить аппаратное кодирование

При использовании аппаратного кодирования графический процессор может интенсивнее работать на встроенном процессоре Intel®, а не на выделенном ГП.

Поддерживаемые платформы кодеков

Кодирование: H.264/AVC (8-разрядный), HEVC 4:2:0 (8-разрядный и 10-разрядный) до 4096×4096. Начиная с 10-го поколения процессоров Intel® Core™ и более поздних, кодирование HEVC поддерживается до 8192×8192.

10-разрядное кодирование HEVC видео с выборкой 4:2:0 поддерживается процессорами Intel® Core™ 9-го, 10-го, 11-го и 12-го поколений. Дополнительные сведения см. в документации Intel.

Чтобы эта функция работала, требуется процессор Intel® с поддержкой Intel® Quick Sync. Проверьте, отвечает ли процессор Intel® требованиям для аппаратного кодирования. Если BIOS вашей системы поддерживает включение и отключение графического процессора Intel®, убедитесь, что он всегда включен, чтобы аппаратное кодирование работало. Некоторые системы, такие как Surface Studio, могут не включать графический процессор Intel®, что может привести к тому, что параметр аппаратного кодирования будет недоступен.

При наличии поддерживаемого ЦП Intel® с включенным ГП Intel® и невозможности использования аппаратного кодирования убедитесь, что ГП Intel® указан на вкладке диспетчера задач «Производительность» (только для Windows®). Если графический процессор Intel® отсутствует в списке, проверьте, включен ли он в диспетчере устройств, и обновите графические драйверы Intel® до последней версии.

Графический процессор Intel® указан в диспетчере задач и диспетчере устройств

Источник

Adblock
detector