Gpu out of memory ошибка

Ошибки Видеокарты При Майнинге

Самое полное собрание ошибок в майнинге на Windows, HiveOS и RaveOS и их быстрых и спокойных решений

Can’t find nonce with device CUDA_ERROR_LAUNCH_FAILED

Ошибка майнера Can't find nonce

Ошибка майнера Can’t find nonce

Ошибка говорит о том, что майнер не может найти нонс и сразу же сам предлагает решение — уменьшить разгон. Особенно начинающие майнеры стараются выжать из видеокарты максимум — разгоняют слишком сильно по ядру или памяти. В таком разгоне видеокарта даже может запуститься, но потом выдавать ошибки как указано ниже. Помните, лучше — стабильная отправка шар на пул, чем гонка за цифрами в майнере.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

Phoenixminer Connection to API server failed — что делать?

Ошибка Connection to API server failed

Ошибка Connection to API server failed

Такая ошибка встречается на PhoenixMiner на операционной систему HiveOS. Она говорит о том, что майнинг-ферма/риг не может подключиться к серверу статистики. Что делать для ее решения:

  • Введите команду net-test и запомните/запишите сервер с низким пингом. После чего смените его в веб интерфейсе Hive (на воркере) и перезагрузите ваш риг.
  • Если это не помогло, выполните команду dnscrypt -i && sreboot

Phoenixminer CUDA error in CudaProgram.cu:474 : the launch timed out and was terminated (702)

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Ошибка майнера Phoenixminer CUDA error in CudaProgram

Эта ошибка, как и в первом случае, говорит о переразгоне карты. Откатите видеокарту до заводских настроек и постепенно поднимайте разгон до тех пор, пока не будет ошибки.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Ошибка майнера Unable to enum CUDA GPUs: invalid device ordinal

Проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).
Если все ок, то проверяем райзера. Часто бывает, что именно райзер бывает причиной такой ошибки.

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Ошибка майнера Unable to enum CUDA GPUs: Insufficient CUDA driver: 5000

Аналогично предыдущей ошибке — проверяем драйвера видеокарты и саму видеокарту на работоспособность (как она отмечена в диспетчере устройств, нет ли восклицательных знаков).

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка майнера NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

Ошибка code 1073740791 nbminer возникает, если ваш риг/майнинг-ферма собраны из солянки Nvidia+AMD. В этом случае разделите майнинг на два .bat файла (или полетника, если вы на HiveOS). Один — с картами AMD, другой с картами Nvidia.

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Ошибка майнера NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2)

Одна из самых распространённых ошибок на Windows — нехватка памяти, в данном случае на майнере Nbminer, но встречается и в майнере Nicehash. Чтобы ее исправить — надо увеличить файл подкачки. Файл подкачки должен быть равен сумме гб всех видеокарт в риге плюс 10% запаса. Как увеличить файл подкачки — читаем тут.

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Ошибка майнера GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

В данном случае скорее всего виноват не файл подкачки, а переразгон по видеокарте, которая идет под номером 0. Сбавьте разгон и ошибка должна пропасть.

Socket error. the remote host closed the connection, в майнере Nbminer

Socket error. the remote host closed the connection

Также может быть описана как «ERROR — Failed to establish connection to mining pool: Socket operation timed out».
Сетевой конфликт — проверьте соединение рига с интернетом. Перегрузите роутер.
Также может быть, что провайдер закрывает соединение с пулом. Смените пул, попробуйте VPN или измените адреса DNS на внешнего провайдера, например cloudflare 1.1.1.1, 1.0.0.1

Server not responded on share, на майнере Gminer

Server not responded on share

Такая ошибка говорит о том, что у вас что-то с подключением к интернету, что критично для Gminer. Попробуйте сделать рестарт роутера и отключить watchdog на майнере.

DAG has been damaged check overclocking settings, в майнере Gminer

Также в этой ошибке может быть указано Device not responding, check overclocking settings.
Ошибка говорит о переразгоне, попробуйте сначала убавить его.
Если это не помогло, смените майнер — Gminer никогда не славился работой с видеокартами AMD. Мы рекомендуем поменять майнер на Teamredminer, а если вам критична поддержка майнером одновременно Nvidia и AMD видеокарт, то используйте Lolminer.
Если смена майнера не поможет, переставьте видеодрайвер.
Если и это не поможет, то нужно тестировать эту карту отдельно в слоте X16.

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. :)

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown…
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Ошибка майнера CAN'T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN'T GET BUSID, CODE -6

Ошибка майнера CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

В конкретном случае была проблема в блоке питания, он не держал 3 видеокарты. После замены блока питания ошибка пропала.
Если вы уверены, что ваш мощности вашего блока питания достаточно, попробуйте сменить майнер.

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

Ошибка 511 градусов видеокарта

Ошибка 511 градусов видеокарта

Ошибка 511 говорит о неисправности райзера или питания карты. Проверьте все соединения. Для выявления неисправности рекомендуется запустить систему с одной картой. Протестировать, и затем добавлять по одной карте.

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

logs-on

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

nvidia-driver-update —list

gpu fault detected 146

Скорее всего вы пытаетесь майнить с помощью Phoenix miner. Решения два:

  1. Откатитесь на более старую версию, например на 5.4с
  2. (Рекомендуемый вариант) Используйте Trex для видеокарт Nvidia и TeamRedMiner для AMD.

Waiting interface to come up — не работает VPN на HiveOS

Waiting interface to come up

Начните с логов, чтобы понять какая именно ошибка вызывает эту проблему.
Команды для получения логов:
systemctl status openvpn@client
journalctl -u openvpn@client -e —no-pager -n 100

Как узнать ip адрес воркера hive os

Как узнать ip адрес воркера hive os

Самое простое — зайти в воркера и прокрутить страницу ниже видеокарт. Там будет указан Remote IP — это и есть внешний IP.
Альтернативный вариант — вы можете проверить ваш внешний айпи адрес hive через консоль Hive Shell:
Выполните одну из команд:
curl 2ip.ru
wget -qO- eth0.me
wget -qO- ipinfo.io/ip
wget -qO- ipecho.net/plain
wget -qO- icanhazip.com
wget -qO- ipecho.net
wget -qO- ident.me

Repository update failed в HiveOS

Иногда встречается на HiveOS. Полный текст ошибки:

Some index files failed to download. They have been ignored, or old ones used instead.
Repository update failed
------------------------------------------------------
> Restarting autofan and watchdog
> Starting miners
Miner screen is already running
Run miner or screen -r to resume screen
Upgrade failed

Решение:

  1. Выполнить команду apt update && selfupgrade -f
  2. Если не сработала и она, то 99.9%, что разработчики HiveOS уже знают об этой проблеме и решают ее. Попробуйте выполнить обновление через некоторое время.

Rave os не запускается. Boot aborted Rave os

Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

В большинстве случаев эта проблема решается уменьшением разгона (особенно по памяти) на конкретной видеокарте (на скрине это карта номер 0).
Если уменьшение разгона не помогает, то попробуйте обновить драйвера.
Если обновление драйверов не привело к решению проблемы, то попробуйте поменять райзер на этой карте на точно работающий.
Если и это не помогает, перепроверьте все кабельные соединения и мощность блока питания, хватает ли его для вашей конфигурации.

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes

Что приводит к появлению этой ошибки? Вероятно, вы переразогнали видеокарту (часто сильно гонят по памяти), сбавьте разгон. На скрине видно, что проблему дает именно GPU под номером 1 — начните с нее.
Вторая частая причина — нехватка питания БП на систему с видеокартами. Учтите, что сама система потребляет не менее 100 вт, каждый райзер еще закладывайте 50 вт. БП должно хватать с запасом в 20%.

Miner restarted after error RaveOS

Смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к miner restarted. После этого найдите ее на этой странице и исправьте. Проблема уйдет. :)

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Аналогично предыдущему пункту — смотрите логи майнера, там будет указана конкретная ошибка, которая приводит к рестарту воркера. Пофиксите ту ошибку — уйдет и эта проблема.

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Эта ошибка означает, что значения разгона между собой конфликтуют или выходят за пределы допустимых. Перепроверьте их. Скиньте разгон на стоковый и попробуйте еще раз.
В редких случаях причиной этой ошибки также становится райзер.

Error installing hive miners

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. :)

Warning: Nvidia settings applied with errors

Переразгон. Снизьте значения частот ядра и памяти. После этого перезагрузите риг.

Nvtool error или Danger: nvtool error

Скорее всего при установке драйвера появилась проблема с модулем nvtool
Попробуйте переустановить драйвер Nvidia командой через Hive shell:
nvidia-driver-update версия_драйвера —force
Или попробуйте обновить систему полностью командой из Hive shell:
hive-replace -y —stable

nvtool error

Перестал отображаться кулер видеокарты HiveOS

0% скорости вращения кулера.
Это может произойти по нескольким причинам:

  • кулер действительно не крутится
  • датчик оборотов отключен или сломан
  • видеокарта слишком агрессивно работает (высокий разгон)
  • неисправен райзер или одно из его частей

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Проблема с скоростью кулеров на GPU 5
0% скорости вращения кулера / ошибки в целом
Это может произойти по нескольким причинам:
— кулер действительно не крутится
— датчик оборотов отключен или сломан
— видеокарта слишком агрессивно работает (высокий разгон)
Начните с визуальной проверки карты и ее кулера.

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Уменьшите разгон и проверьте контакты райзера

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Ошибка Kernel-Power код 41

Проверьте все провода (от БП до карт, от БП до райзеров), возможно где-то идёт оплавление. Если визуальный осмотр показал, что все ок, то ошибка программная и вам нужно переустановить Windows.

Danger: hive-replace -y —stable (failed, exitcode=137)

Очень редкая ошибка, которая вылезла в момент удаленного обновления образа HiveOS. Она не встречается в тематических майнинг группах и сайтах. Не поверите что произошло.
На балконе, где стоял риг, поселилась семья голубей. Они засрали риг, в прямом смысле, из-за этого он постоянно уходил в оффлайн. После полной продувки материнской платы и видеокарт проблема решилась сама.

MALFUNCTION HIVEOS

Malfunction — неисправность. Причин и решений может быть несколько:

  • Вам следует переустановить видео драйвер;
  • Если драйвер не помог, тогда отключайте все GPU и поочередно вставляйте по 1 шт, и смотрите вызовет ли какая-то видеокарта подобную ошибку или нет. Если да, то возможно это райзер.
  • Неисправен носитель, на который записана Hive OS, запишите образ еще раз.

Не нашли своей ошибки? Помогите сделать мир майнинга лучше. Отправьте ее по этой форме и мы обновим наш гайд в самое ближайшее время.

Содержание

  1. Frequent Mining pool disconnected: «The remote host closed the connection» #41
  2. Comments
  3. Footer
  4. Ошибки Видеокарты При Майнинге
  5. UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL
  6. UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000
  7. NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED
  8. NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?
  9. GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0
  10. Socket error. the remote host closed the connection, в майнере Nbminer
  11. Server not responded on share, на майнере Gminer
  12. DAG has been damaged check overclocking settings, в майнере Gminer
  13. ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6
  14. TREX: Can’t unlock GPU
  15. CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6
  16. ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА
  17. GPU driver error, no temps в HiveOS — что делать?
  18. GPU are lost, rebooting
  19. exitcode=3 в HiveOS
  20. exitcode=1 в HiveOS
  21. gpu fault detected 146
  22. Waiting interface to come up — не работает VPN на HiveOS
  23. Как узнать ip адрес воркера hive os
  24. Repository update failed в HiveOS
  25. Rave os не запускается. Boot aborted Rave os
  26. Failed to allocate memory Raveos
  27. gpu_driver_fault, GPU #0 fault в RaveOS
  28. Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS
  29. Miner restarted after error RaveOS
  30. Miner restart limit reached. Worker rebooting by flag auto в RaveOS
  31. Miner cannot be started, ОС RaveOS
  32. Overclock can’t be applied в RaveOS
  33. Error installing hive miners
  34. Warning: Nvidia settings applied with errors
  35. Nvtool error или Danger: nvtool error
  36. Перестал отображаться кулер видеокарты HiveOS
  37. ERROR: parsing JSON failed
  38. NVML: can’t get fan speed for GPU #5, error code 999 hive os
  39. Can’t get power for GPU #2
  40. GPU1 search error: unspecified launch failure
  41. Warning: Autofan: unable to set fan speed, rebooting
  42. Ошибка: «socket was closed remotely (by pool)» — Решено!
  43. Добавить комментарий Отменить ответ
  44. Промокод на скидку в интернет магазине для читателей моего сайта

Frequent Mining pool disconnected: «The remote host closed the connection» #41

I tried the latest 3.3 GPU miner on my 2x GTX1080 card i7 8700 machine. I have very good network with no issues to any parts of the world. I tried Antpool, BTCC pool. uuPool and F2Pool. All of them have the same Mining pool disconnected: «The remote host closed the connection» issue after just 2-3 minutes (some times even shorter) of run time. Also, none of the submitted shared seems to show of my miner accounts (all of which are working perfectly fine with my B3).

Any clue as to what the problem is? Also, where are the logs located?
Thanks in advance for your help!

The text was updated successfully, but these errors were encountered:

The dev fee is mining on f2pool. That normally connects after a few minutes. But if you say you tried that then must be something else. I’m assuming v3.0 was ok for you? Theres no hash rate improvement in 3.3 versus 3.0

thanks @monkins1010. No v3.0 didn’t work for me either. Are you saying that because dev fee is mining on f2pool, the miner will need to disconnect from whatever the connected mining pool (other than f2pool) that it is on periodically and switch back and forth? Where are the logs located?

@SuperCUDA Hi, where is your location? The remote connection closed cound due to

  1. low hashrate which result in no submit in a relative long time, and could cause the pool disconnect.
  2. Bad network connection quality, high latency, unstable connection .

@nebutech-admin Thanks for your quick response. I am in the US, resides in a major city on east coast, with fat internet pipe provided by Comcast. Gigabit connection to the rest of the world without any problems. Able to stream multiple HD videos simultaneously. The console displayed hash rate is fairly consistent at 1200 H/s. Could you please tell me where are the log files located so I can do some basic troubleshooting? Thanks!

@SuperCUDA Sorry, there is no debug level log file. The only visible log is the stdout on cmd line.

© 2023 GitHub, Inc.

You can’t perform that action at this time.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.

Источник

Ошибки Видеокарты При Майнинге

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

UNABLE TO ENUM CUDA GPUS: INVALID DEVICE ORDINAL

UNABLE TO ENUM CUDA GPUS: INSUFFICIENT CUDA DRIVER: 5000

NBMINER MINING PROGRAM UNEXPECTED EXIT.CODE: -1073740791, REASON: PROCESS CRASHED

NBMINER CUDA ERROR: OUT OF MEMORY (ERR_NO=2) — как исправить?

GMINER ERROR ON GPU: OUT OF MEMORY STOPPED MINING ON GPU0

Socket error. the remote host closed the connection, в майнере Nbminer

DAG has been damaged check overclocking settings, в майнере Gminer

ERROR: Can’t start T-Rex, failed to initialize device map: can’t get busid, code -6

Ошибки настройки памяти с кодом -6 обычно указывают на проблему с драйвером.

Если у вас Windows, используйте программу DDU (DisplayDriverUninstaller), чтобы полностью удалить все драйверы Nvidia.
Перезагрузите систему.
Установите новый драйвер прямо с сайта Nvidia.
Перезагрузите систему снова.
Если у вас HiveOS/RaveOS — накатите чистый образ системы. Чтобы наверняка. 🙂

TREX: Can’t unlock GPU

Полный текст ошибки:
TREX: Can’t unlock GPU [ID=1, GPU #1], error code 15
WARN: Miner is going to shutdown.
WARN: NVML: can’t get fan speed for GPU #1, error code 15
WARN: NVML: can’t get power for GPU #1, error code 15
WARN: NVML: can’t get mem/core clock for GPU #1, error code 17

Решение:

  1. Проверьте все кабельные соединения видеокарты и райзера, особенно кабеля питания.
  2. Если с первый пунктом все ок, попробуйте поменять райзер на точно рабочий.
  3. Если ошибка остается, вставьте видеокарту в разъем х16 напрямую в материнскую плату.

CAN’T START MINER, FAILED TO INITIALIZE DEVIS MAP, CAN’T GET BUSID, CODE -6

Зарабатывай на чужих сделках на бирже BingX. Подробнее — тут.

ОШИБКА 511 ГРАДУСОВ НА ВИДЕОКАРТА

GPU driver error, no temps в HiveOS — что делать?

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

GPU are lost, rebooting

Это не ошибка, а ее последствие. Что узнать какая ошибка приводит к перезагрузке карт, сделайте следующее:

Включите сохранение логов (по умолчанию они выключены) командой

И перезагрузите риг.
После того как ошибка повторится можно будет скачать логи командами ниже.
Вы можете использовать следующую команду, чтобы загрузить логи майнера прямо с панели мониторинга;

message file «miner.log» -f=/var/log/miner/minername/minername.log

Итак, скажем, например, мне нужны логи TeamRedMiner
message file «teamredminer.log» -f=/var/log/miner/teamredminer/teamredminer.log

Отправленная командная строка будет выделена синим цветом. Загружаемый файл будет отображаться белым цветом. Нажав на него, вы сможете его скачать.
Эта команда позволит скачать лог системы

message file «syslog» -f=/var/log/syslog

exitcode=3 в HiveOS

Вероятнее всего, вы получили эту ошибку, майнив на HiveOS. Причин ее появления может быть несколько — как софтовая, так и аппаратная (например райзер).
Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — проверьте райзер.

exitcode=1 в HiveOS

Данная ошибка возникает когда есть проблема с датой в биосе материнской платы (сбитое время) и (или) есть проблема с интернетом.
Если сбито время, то удаленно вы не сможете подключиться.
Тем не менее, обновление драйверов Nvidia должно пройти командой:

gpu fault detected 146

Waiting interface to come up — не работает VPN на HiveOS

Как узнать ip адрес воркера hive os

Repository update failed в HiveOS

Rave os не запускается. Boot aborted Rave os

Перепроверьте все настройки ПК и БИОСа материнской платы:
— Установите загрузочное устройство HDD/SSD/M2/USB в зависимости от носителя с ОС.
— Включите 4G decoding.
— Установите поддержку PCIe на Auto.
— Включите встроенную графику.
— Установите предпочтительный режим загрузки Legacy mode.
— Отключите виртуализацию.

Если после данных настроек не определяется часть карт, то выполните следующие настройки в BIOS (после каждого пункта требуется полная перезагрузка):

— Отключите 4G decoding
— Перезагрузка
— Отключите CSM
— Перезагрузка
— Включите 4G decoding, установите PCI-E Gen2/3, а при отсутствии Gen2/3, можно выбрать Gen1

Failed to allocate memory Raveos

Эта же ошибка может называться как:
failed to allocate initramfs memory bailing out, failed to load idlinux c.32
или
failed to allocate memory for kernel boot parameter block
или
failed to allocate initramfs memory raveos bailing

Но решение у нее одно — вы должны правильно настроить БИОС материнской платы.

gpu_driver_fault, GPU #0 fault в RaveOS

gpu_driver_fault, GPU #0 fault в RaveOS

Gpu driver fault. All tasks have been stopped. Worker will be rebooted after 5 minutes в RaveOS

Miner restarted after error RaveOS

Miner restart limit reached. Worker rebooting by flag auto в RaveOS

Miner cannot be started, ОС RaveOS

Непосредственно перед этой ошибкой обычно пишется еще другая, которая и вызывает эту проблему. Но если ничего нет, то:

  1. Поставьте майнер на паузу, перезагрузите риг и в консоли выполните команды clear-miners clear-logs и fix-fs. Запустите майнинг.
  2. Если ошибка не ушла, перепишите образ RaveOS.

Overclock can’t be applied в RaveOS

Error installing hive miners

Можно попробовать обойтись малой кровью и вбить в HiveOS команду:
hive-replace -y —stable
Система по новой накатит стабильную версию HiveOS.

Если ошибка не уйдет — физически перезапишите образ. Если у вас флешка, то скорее всего она умерла. Купите SSD. 🙂

Warning: Nvidia settings applied with errors

Перестал отображаться кулер видеокарты HiveOS

ERROR: parsing JSON failed

Необходимо выполнить на риге локально (с клавиатурой и монитором) следующую команду:
net-test

Данная команда покажет ваше текущее состояние подключения к разным зеркалам API серверов HiveOS.
Посмотрите, к какому API у вас наименьшая задержка (ping), и когда воркер снова появится в панели, измените стандартное зеркало на то, что ближе к вам.
После смены зеркала, в обязательном порядке перезагрузите ваш воркер.
Изменить сервер API вы можете командой nano /hive-config/rig.conf
После смены нажмите ctrl + o и ентер для того чтобы сохранить файл.
После этого выйдите в консоль командой ctrl + x, f10 и выполните команду hello

NVML: can’t get fan speed for GPU #5, error code 999 hive os

Can’t get power for GPU #2

Как правило эта ошибка встречается рядом вместе с другими:
Attribute ‘GPUGraphicsClockOffset’ was already set to 0
Attribute ‘GPUMemoryTransferRateOffset’ was already set to 2200
Attribute ‘GPUFanControlState’ (hive1660s_ETH:0[gpu:2]) assigned value
0.

20211029 12:40:50 WARN: NVML: can’t get fan speed for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get power for GPU #2, error code 999
20211029 12:40:50 WARN: NVML: can’t get mem/core clock for GPU #2, error code 999

Решение:

Проверьте корректность установки драйвера на видеокарте.
Убедитесь что нет проблем с драйвером, если все в порядке, то попробуйте другой параметр разгона. Например уменьшить разгон по памяти.

GPU1 search error: unspecified launch failure

Warning: Autofan: unable to set fan speed, rebooting

Найдите логи майнера, посмотрите какие ошибки майнер пишет в логах. Например:

kernel: [12112.410046][ T7358] NVRM: GPU at PCI:0000:0c:00: GPU-236e3bef-2e03-6cdb-0518-7ac01eb8736d
kernel: [12112.410049][ T7358] NVRM: Xid (PCI:0000:0c:00): 62, pid=7317, 0000(0000) 00000000 00000000
kernel: [12112.433831][ T7358] NVRM: Xid (PCI:0000:0c:00): 45, pid=7317, Ch 00000010
CRON[21094]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

Исходя из логов, мы видим что есть проблема с видеокартой на слоте PCIE 0c:00 (под номером Gpu пишется номер PCIE слота) с ошибками 45 и 62
Коды ошибок (других, которые также могут быть там) и что с ними делать:

• 13, 43, 45: ошибки памяти, снизить MEM
• 8, 31, 32, 61, 62: снизить CORE, возможно и MEM
• 79: снизить CORE, проверить райзер

Источник

Ошибка: «socket was closed remotely (by pool)» — Решено!

Большинство майнеров сталкиваются со следующей ошибкой майнинга: socket was closed remotely (by pool), как на рисунке ниже. Данная ошибка может возникнуть из-за нескольких проблем, ниже рассмотрим каждую.

В первую очередь мы написали в службу поддержку ethermine.org. получили вот такой ответ:

«Thank you for your response, this seems to be related to the newest version of claymore miner. Please try rolling back a version, this should solve this.»

Перевод ответа: «Решением проблемы является использование более старой версии Claymore.»

Если вам указанный выше совет не помог, то рекомендуем попробовать следующие установки:

  1. Подключите интернет к ферме не по wifi сети. Если это решит проблему, то достаточно будет приемник отвести на небольшое расстояние от фермы. Сделать это можно при помощи usb удлинителя, если имеется адаптер.
  2. Переключите ферму на другой пул (на другой сервер).

Добавить комментарий Отменить ответ

Промокод на скидку в интернет магазине для читателей моего сайта

Доброго дня, любимый читатель! Я являюсь менеджером сайта OZON.ru и хочу поделиться с вами промокодом на скидку 300 руб. для первого заказа: OZON0NB71A (Условия акции). Если вы уже совершали покупки на сайте озон, то активировав указанный выше промокод, вы получите дополнительные скидки на товары. На озоне вы сможете приобрести электронику и комплектующие к ним по приятным ценам и удобной доставкой.

Cрок действия приветственных баллов — 5 дней. Баллами можно оплатить 25% от стоимости покупок.

Источник

I’m using a GPU on Google Colab to run some deep learning code.

I have got 70% of the way through the training, but now I keep getting the following error:

RuntimeError: CUDA out of memory. Tried to allocate 2.56 GiB (GPU 0; 15.90 GiB total capacity; 10.38 GiB already allocated; 1.83 GiB free; 2.99 GiB cached)

I’m trying to understand what this means. Is it talking about RAM memory? If so, the code should just run the same as is has been doing shouldn’t it? When I try to restart it, the memory message appears immediately. Why would it be using more RAM when I start it today than it did when I started it yesterday or the day before?

Or is this message about hard disk space? I could understand that because the code saves things as it goes on and so the hard disk usage would be cumulative.

Any help would be much appreciated.


So if it’s just the GPU running out of memory — could someone explain why the error message says 10.38 GiB already allocated — how can there be memory already allocated when I start to run something. Could that be being used by someone else? Do I just need to wait and try again later?

Here is a screenshot of the GPU usage when I run the code, just before it runs out of memory:

enter image description here


I found this post in which people seem to be having similar problems. When I run a code suggested on that thread I see:

Gen RAM Free: 12.6 GB  | Proc size: 188.8 MB
GPU RAM Free: 16280MB | Used: 0MB | Util   0% | Total 16280MB

which seems to suggest there is 16 GB of RAM free.

I’m confused.

Bug report for Colab: http://colab.research.google.com/.

For questions about colab usage, please use stackoverflow.

  • Describe the current behavior:

I’m using a GPU on Google Colab to run some deep learning code.

I have got 70% of the way through the training, but now I keep getting the following error:

RuntimeError: CUDA out of memory. Tried to allocate 2.56 GiB (GPU 0; 15.90 GiB total capacity; 10.38 GiB already allocated; 1.83 GiB free; 2.99 GiB cached)

When I try to restart it, the memory message appears immediately.

  • Describe the expected behavior:

The notebook has been running the same script fine and I have restarted the code many times on previous days. I’ve never had a RAM issue.

Could someone explain why the error message says 10.38 GiB already allocated — how can there be memory already allocated when I start to run something. Could that be being used by someone else? Do I just need to wait and try again later?

I have also tried to reset the runtime but the same thing happens.

https://colab.research.google.com/drive/1p_2kQmKSM2lkkJ_16p8NEAJeUJ0cw_pB

  • The web browser you are using (Chrome, Firefox, Safari, etc.):

Chrome

  • Link to self-contained notebook that reproduces this issue
    (click the Share button, then Get Shareable Link):

[https://colab.research.google.com/drive/1p_2kQmKSM2lkkJ_16p8NEAJeUJ0cw_pB](https://colab.research.google.com/drive/1p_2kQmKSM2lkkJ_16p8NEAJeUJ0cw_pB
gpu
)

  • #1

Конечно проблема старая, бывала у всех. Но час за часом не нахожу решение(
При подключении 4-й видеокарты. через 2 мин, майнер выдает ошибку с синим экраном, перезагрузкой.
3 видеокарты работают стабильно. Возможно в биос следует выбрать режим Gen2 или Auto, в какой-то строке. Но в UEFI 3.2 не нахожу ничего похожего и хз существует ли строка.
Какое решение проблемы, скажите плиз или имя/ссылка темы? Благодарствую)

2022.04.11:01:25:26.604: GPU2 CUDA error in CudaProgram.cu:206 : out of memory (2)
2022.04.11:01:25:26.604: GPU2 GPU2: Failed to initialize search buffers: out of memory
2022.04.11:01:25:26.605: GPU2 GPU2 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.605: wdog Fatal error detected. Restarting.
2022.04.11:01:25:26.654: GPU1 GPU1: DAG 97%
2022.04.11:01:25:26.654: GPU1 GPU1 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.960: GPU3 GPU3 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:28.587: hwmc GPU4: unable to get temperature — GPU is lost (15)
2022.04.11:01:25:28.587: hwmc GPU4: unable to get fan speed — GPU is lost (15)
_____
4 шт 1060 6Gb (др. 512.15-desktop-win10-win11-64bit-international-dch-whql)
Мат.пл. B450 Gaming X
BIOS — UEFI 3.2
Windows 10 x64
AMD Athlon 200GE with Radeon Vega Graphics 3.20 GHz
Озу: 8gb
SSD / 80Gb файл подкачки
BAT: EthDcrMiner64.exe -epool eth.2miners.com:2020 -ewal —————————- -eworker worker1 -epsw x -eres 0
Claymore.s.dual.ethereum.v15.0.-.widows

  • #2

Конечно проблема старая, бывала у всех. Но час за часом не нахожу решение(
При подключении 4-й видеокарты. через 2 мин, майнер выдает ошибку с синим экраном, перезагрузкой.
3 видеокарты работают стабильно. Возможно в биос следует выбрать режим Gen2 или Auto, в какой-то строке. Но в UEFI 3.2 не нахожу ничего похожего и хз существует ли строка.
Какое решение проблемы, скажите плиз или имя/ссылка темы? Благодарствую)

2022.04.11:01:25:26.604: GPU2 CUDA error in CudaProgram.cu:206 : out of memory (2)
2022.04.11:01:25:26.604: GPU2 GPU2: Failed to initialize search buffers: out of memory
2022.04.11:01:25:26.605: GPU2 GPU2 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.605: wdog Fatal error detected. Restarting.
2022.04.11:01:25:26.654: GPU1 GPU1: DAG 97%
2022.04.11:01:25:26.654: GPU1 GPU1 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.960: GPU3 GPU3 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:28.587: hwmc GPU4: unable to get temperature — GPU is lost (15)
2022.04.11:01:25:28.587: hwmc GPU4: unable to get fan speed — GPU is lost (15)
_____
4 шт 1060 6Gb (др. 512.15-desktop-win10-win11-64bit-international-dch-whql)
Мат.пл. B450 Gaming X
BIOS — UEFI 3.2
Windows 10 x64
AMD Athlon 200GE with Radeon Vega Graphics 3.20 GHz
Озу: 8gb
SSD / 80Gb файл подкачки
BAT: EthDcrMiner64.exe -epool eth.2miners.com:2020 -ewal —————————- -eworker worker1 -epsw x -eres 0
Claymore.s.dual.ethereum.v15.0.-.widows

Пытаться майнить клэймором майнеров в 2022 году, вы серьезно? Это вброс чтоли чтобы админы ветку удалили или что? Другие майнеры по каким то причинам не хотите пробовать?

  • #3

так то и файл подкачки в винде не лишним будет увеличить. ну а про клей товарищ выше написал. поясню — клей сдох уж как год точно назад, если не два)).

  • #4

так то и файл подкачки в винде не лишним будет увеличить. ну а про клей товарищ выше написал. поясню — клей сдох уж как год точно назад, если не два)).

Да там вроде и так файл подкачки 80гб,куда больше то.А вот озу для 4х карт стоит добавить,там половину скорее всего система съедает.

  • #5

Пытаться майнить клэймором майнеров в 2022 году, вы серьезно? Это вброс чтоли чтобы админы ветку удалили или что? Другие майнеры по каким то причинам не хотите пробовать?

Феникс много ошибок выдавал, каждый день, тем не понравился. Trex и с 3 картами не стал запускаться. Клеймор хотя бы держит стабильно 3 карты, может и имеет минусы, но он проще всего

  • #6

Конечно проблема старая, бывала у всех. Но час за часом не нахожу решение(
При подключении 4-й видеокарты. через 2 мин, майнер выдает ошибку с синим экраном, перезагрузкой.
3 видеокарты работают стабильно. Возможно в биос следует выбрать режим Gen2 или Auto, в какой-то строке. Но в UEFI 3.2 не нахожу ничего похожего и хз существует ли строка.
Какое решение проблемы, скажите плиз или имя/ссылка темы? Благодарствую)

2022.04.11:01:25:26.604: GPU2 CUDA error in CudaProgram.cu:206 : out of memory (2)
2022.04.11:01:25:26.604: GPU2 GPU2: Failed to initialize search buffers: out of memory
2022.04.11:01:25:26.605: GPU2 GPU2 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.605: wdog Fatal error detected. Restarting.
2022.04.11:01:25:26.654: GPU1 GPU1: DAG 97%
2022.04.11:01:25:26.654: GPU1 GPU1 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:26.960: GPU3 GPU3 initMiner error: Unable to initialize CUDA miner
2022.04.11:01:25:28.587: hwmc GPU4: unable to get temperature — GPU is lost (15)
2022.04.11:01:25:28.587: hwmc GPU4: unable to get fan speed — GPU is lost (15)
_____
4 шт 1060 6Gb (др. 512.15-desktop-win10-win11-64bit-international-dch-whql)
Мат.пл. B450 Gaming X
BIOS — UEFI 3.2
Windows 10 x64
AMD Athlon 200GE with Radeon Vega Graphics 3.20 GHz
Озу: 8gb
SSD / 80Gb файл подкачки
BAT: EthDcrMiner64.exe -epool eth.2miners.com:2020 -ewal —————————- -eworker worker1 -epsw x -eres 0
Claymore.s.dual.ethereum.v15.0.-.widows

Меняйте майнер,смотрите сколько система потребляет озу с 4-мя картами,и скорее всего нужно добавить.

  • #7

эууу стоп стоп стоп))
атлон 200 со встройкой) выбрось 2 карты и на 2х оставшихся ошибок не будет)
и впредь не забывай о линиях ПСИ-Е и о том, почему и от чего майнеры не любят атлоны а предпочитают интелы для ГПУ ригов)

  • #8

Меняйте майнер,смотрите сколько система потребляет озу с 4-мя картами,и скорее всего нужно добавить.

До сих пор есть риг,в котором стоят 1060 6гиговые,так на старючей 970й,с 4 гигами памяти и на фениксе-никаких проблем.Так что ему надо копать в другую сторону.
Зы-и да,скорее всего в этом проблема(выше написали),и ему не нужно подкачки 80 гиг на 4 6гиговых карты,это слишком уж жирно.Хватит 6 на 4 -24гига,и можно еще 10точку сверху на всякий пожарный докинуть.

  • #9

До сих пор есть риг,в котором стоят 1060 6гиговые,так на старючей 970й,с 4 гигами памяти и на фениксе-никаких проблем.Так что ему надо копать в другую сторону.
Зы-и да,скорее всего в этом проблема(выше написали),и ему не нужно подкачки 80 гиг на 4 6гиговых карты,это слишком уж жирно.Хватит 6 на 4 -24гига,и можно еще 10точку сверху на всякий пожарный докинуть.

Да,возможно,тоже не обратил сразу внимания 6 утра,еще не проснулся )

  • #10

До сих пор есть риг,в котором стоят 1060 6гиговые,так на старючей 970й,с 4 гигами памяти и на фениксе-никаких проблем.Так что ему надо копать в другую сторону.
Зы-и да,скорее всего в этом проблема(выше написали),и ему не нужно подкачки 80 гиг на 4 6гиговых карты,это слишком уж жирно.Хватит 6 на 4 -24гига,и можно еще 10точку сверху на всякий пожарный докинуть.

Что значит «копать в другую сторону»?
К Фениксу попробую вернуться позднее.
T Rex, выдаёт ошибку, что карты в переразгоне (хотя я не юзаю разгон впринципе, ни бёрнер, ни в батнике). И сразу закрывается, хотя б без синего экрана. Но ни одну карту не запустил
Попробовал клеймор, с 3 картами всё запустил. И по принципу, не ломай, что работает, продолжаю олд-скул

  • #11

Феникс много ошибок выдавал, каждый день, тем не понравился. Trex и с 3 картами не стал запускаться. Клеймор хотя бы держит стабильно 3 карты, может и имеет минусы, но он проще всего

Нет там никаких ошибок, значит вы либо параметр straps неверно выставляете, либо на картах переразгон по памяти. Попробуйте nbminer, gminer, lolminer. Клеймором уже год назад было пользоваться бесполезно. Разработка и поддержка майнера уже давно приостановлена.

  • #12

T Rex, выдаёт ошибку, что карты в переразгоне (хотя я не юзаю разгон впринципе, ни бёрнер, ни в батнике). И сразу закрывается, хотя б без синего экрана. Но ни одну карту не запустил
Попробовал клеймор, с 3 картами всё запустил. И по принципу, не ломай, что работает, продолжаю олд-скул

Какой БП на риге?

Если без разгона и страпов вылетает t-rex, возможно проблемы с картой или райзером, или драйвером, или БП. Но не с t-rex’ом

Реально для 1060 нужны t-rex или gminer с включенными страпами. Даунвольт обязательно, инспектором или бернером, даже если не разгоняете, зачем карты греть зря.

Универсальное решение — поставить хайв или рейв чтоб понять, проблемы с настройками в винде, или с железом.

Апд: запустите 2 копии клеймора, один с -d 0,1, другой с -d 2,3 (или как оно пишется в клейморе, уже не помню)

  • #13

Claymore.s.dual.ethereum.v15.0.-.widows

Это рофл что ли?
Настройки на ВК какие, что все майнеры падают от переразгона?

R X

Друг форума


  • #14

Я вот тоже сразу подумал про блок питания. 3 работают , а на четвёртую напруги не хватает.

  • #15

Что значит «копать в другую сторону»?

Ну у тебя логе —
2022.04.11:01:25:28.587: hwmc GPU4: unable to get temperature — GPU is lost (15)
2022.04.11:01:25:28.587: hwmc GPU4: unable to get fan speed — GPU is lost (15)
Гпу из лост- Гпу потеряна.Отлетает у тебя карта,винда теряет ее,или по переразгону,или скорее всего по просадке питания.Проверяй райзер,провода,верхнее питание,карта отлетает.Ну и по нехватке памяти- однозначно более свежий майнер,тот же феникс или НБ майнер,и копать работоспособность карт уже на них.Забудь про клеймор,он уже давно остановился в древних временах,его нужно исключить из экспериментов.

  • #16

Все про ОЗУ пишут… 4гб на 12 карт на винде работает без костылей.

Автор, при разгоне карты отваливаются таким же образом, запусти в стоке, если ошибки нет, значит разгон виноват, если тоже самое, то отключить другие карты и оставить проблемную карту и посмотреть будет ли она одна работать, если да, тогда стоит задуматься о менее бюджетной основе. Ну и как уже сказали, майнер феникс будет без нареканий работать, если там ошибки и проблемы, то проблемы скорее с железом/настройками, а не в самом майнере.

Перечислено 7 исправлений для стабильной диффузионной проблемы нехватки памяти Cuda.

Stable Diffusion — это один из инструментов искусственного интеллекта, который люди используют для создания искусства искусственного интеллекта, потому что он находится в открытом доступе и бесплатен для использования. Программу можно использовать локально на компьютере с выделенным графическим процессором или удаленно через Демо HuggingFace. Следующий пост должен помочь вам устранить ошибку «Cuda Out of Memory» и включить Stable Diffusion, если вы пытались использовать его на своем компьютере, но столкнулись с проблемами.

Исправьте «Cuda Out of Memory» в Stable Diffusion, используя эти 7 методов.

Вы должны быть в состоянии исправить ошибку «Cuda Out of Memory» в Stable Diffusion с помощью следующего списка исправлений.

1. Перезагрузите систему

Если ранее Stable Diffusion работал без каких-либо проблем, возможно, простой перезапуск системы решит проблему, поскольку программное обеспечение Stable Diffusion могло потерять доступ к некоторым компонентам графического процессора. После перезагрузки системы некоторые пользователи (1,2) смогли быстро устранить ошибку «Cuda Out of Memory» на своем ПК.

2. Установите Anaconda вместе с Nvidia CUDA Toolkit.

Установка и использование приглашения Anaconda — еще один обходной путь, предлагаемый пользователями (1,2), чтобы без проблем запускать Stable Diffusion. Для тех из вас, кто не знает, Анаконда — это бесплатный инструмент управления средой, который может устанавливать и запускать пакеты приложений Python. Чтобы без проблем использовать Stable Diffusion, установите Anaconda (видео-инструкции), получите NVIDIA CUDA Toolkit, а затем следуйте указаниям из репозитория Python GitHub по вашему выбору.

3. Используйте оптимизированную версию Stable Diffusion.

Если проблема «Cuda Out of Memory» не устранена, вы можете попробовать использовать оптимизированную версию Stable Diffusion, которая доступна здесь. Чтобы решить эту проблему, загрузите оптимизированную версию Stable Diffusion и вставьте ее содержимое в папку stable-diffusion-main, если на вашем компьютере уже установлена ​​исходная версия Stable Diffusion.

Подробные инструкции о том, как это сделать, см. Reddit пост.

4. Попробуйте создать изображения с более низким разрешением

Вы можете столкнуться с проблемой «Cuda Out of Memory», если попытаетесь создать фотографии с более высоким разрешением. Это связано с тем, что фотографии более высокого качества требуют гораздо большей памяти графического процессора. Понижение разрешения изображения, которое можно сделать, изменив значения высоты и ширины внутри Stable Diffusion, позволило пользователям (1,2), чтобы решить проблему. Если объем оперативной памяти вашего графического процессора меньше 4 ГБ, вы можете попробовать выбрать 512 x 512 или 256 x 256 в качестве требуемых разрешений или выбрать что-то меньшее.

5. Уменьшите размер выборки до одного

Stable Diffusion по умолчанию создает множество изображений одновременно, как и любой другой генератор изображений. Но если вы используете много фотографий, вашему графическому процессору может не хватить памяти, и вы получите ошибку «Cuda Out of Memory». Используйте «-n образцы 1» в приглашении ввода, чтобы исправить это, уменьшив размер выборки до 1. Этот пост Reddit показывает, что многие пользователи, похоже, добились успеха с это решение.

6. Проверьте память графического процессора

Рекомендуется использовать графический процессор с объемом памяти не менее 6 ГБ для запуска Stable Diffusion без каких-либо проблем, хотя вы можете обойтись и графическим процессором с 4 ГБ ОЗУ (см. 1,2,3). Все, что меньше, не позволит программному обеспечению Stable Diffusion использовать память вашего графического процессора, заставляя вас запускать его непосредственно на вашем процессоре, что может увеличить время создания каждого изображения как минимум до двух минут.

Лучший вариант — обновить видеокарту до версии с не менее 6 ГБ ОЗУ, если вы хотите предотвратить появление сообщения «Cuda Out of Memory».

7. Отредактируйте файл webui-user.bat с оптимизированными командами.

Stable Diffusion выполняет команды для создания образов на вашем компьютере через файл webui-user.bat. Чтобы проверить, устраняет ли обновление этого файла оптимизированными командами системную ошибку «Cuda Out of Memory», попробуйте сделать это. Найдите файл webui-user.bat в папке Stable Diffusion, щелкните его правой кнопкой мыши и выберите «Правка» > «Блокнот», чтобы начать. Затем вы можете протестировать каждую оптимизацию командной строки на этом Страница GitHub чтобы увидеть, какой из них лучше всего подходит для вас. Подробные инструкции см. в этих сообщениях Reddit (1,2,3).

Вам не нужно ничего делать, чтобы решить проблему «Cuda Out of Memory» в Stable Diffusion.

Понравилась статья? Поделить с друзьями:
  • Gprs недоступен попробуйте позже ошибка starline
  • Gprinter gp 2120t ошибка печати
  • Gpresult ошибка неправильное пространство имен
  • Google диск произошла ошибка сервера
  • Google диск для windows ошибка