Ständige Abstürze mit RX 6700 XT unter Linux – besonders im Desktopbetrieb, keine Reboots, Login-Screen

Wenn die Karte unter Last stabil läuft, sieht die eigentlich weitgehend okay aus. Früher gab's häufig Abstürze (nur) im Idle mit Netzteilen, die plötzliche Lastwechsel (aus dem Idle nach Busy) nicht gut schaffen. Vielleicht ist das Netzteil hier in der Richtung nicht mehr in Ordnung. Wie alt ist es denn?
 
  • Gefällt mir
Reaktionen: Tanzmusikus und TheChris80
Astryn02 schrieb:
anderes netzteil testen wird schwer da ich kein anderes besitze.
Wenn Du einen Computerladen in der Nähe hast, kannst Du da idR für ein Pfand ein Netzteil für einen Tag ausborgen.
 
Astryn02 schrieb:
Unigine Heaven + glmark2 (GPU): stabil, keine Hänger
Keine Hänger also auch keine Artefakte?

Von daher tippe ich wie @GrumpyCat auf das Netzeil denn deine GPU läuft ja unter last normal.

Was du noch testen kannst ist mit CoreCTRL den minimal Takt anheben und schauen was passiert.
corectl.png
 
Zuletzt bearbeitet:
GrumpyCat schrieb:
Wenn die Karte unter Last stabil läuft, sieht die eigentlich weitgehend okay aus. Früher gab's häufig Abstürze (nur) im Idle mit Netzteilen, die plötzliche Lastwechsel (aus dem Idle nach Busy) nicht gut schaffen. Vielleicht ist das Netzteil hier in der Richtung nicht mehr in Ordnung. Wie alt ist es denn?
das netzteil müsste jetzt so um die 2,5 jahre alt sein
Ergänzung ()

TheChris80 schrieb:
Keine Hänger also auch keine Artefakte?

Von daher tippe ich wie @GrumpyCat auf das Netzeil denn deine GPU läuft ja unter last normal.

Was du noch testen kannst ist mit CoreCTL den minimal Takt anheben und schauen was passiert.Anhang anzeigen 1634009
werd ich auch mal testen
Ergänzung ()

GrumpyCat schrieb:
Wenn die Karte unter Last stabil läuft, sieht die eigentlich weitgehend okay aus. Früher gab's häufig Abstürze (nur) im Idle mit Netzteilen, die plötzliche Lastwechsel (aus dem Idle nach Busy) nicht gut schaffen. Vielleicht ist das Netzteil hier in der Richtung nicht mehr in Ordnung. Wie alt ist es denn?
aber müsste dann nicht der ganze pc abschmieren? ich werd ja immer nur zum login screen geschmissen
 
Zuletzt bearbeitet:
Astryn02 schrieb:
aber müsste dann nicht der ganze pc abschmieren? ich werd ja immer nur zum login screen geschmissen
Wenn das immer wirklich genau das ist, hört es sich eher nach Software-Problem an. Vielleicht hat ein Update was verschlimmbessert? Trotzdem seltsam, wenn das nur Idle auftritt. Wirklich auch wenn Du gar nichts machst und kein Programm läuft?

Hast Du mal in die Logs geschaut? In der Konsole sudo dmesg oder ähnliches.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
@GrumpyCat naja wenn ich halt am browsen bin oder im datei manager bin oder letzten bei minecraft aber ebend nicht bei hohen lasten.

ne ich glaub den log hab ich mir noch nicht angeguckt
 
32 GB (2×16 GB) G.Skill Ripjaws DDR5-6000

frisch erweitert den Ram oder die Konfig geändert?

Wenn die Grafikkarte auch nur einen Run Fehlerfrei durchläuft dann ist die Grafikkarte auch nicht hinnüber.
 
@therealcola nope RAM hab ich seid anfang an so. nur xmp eingeschaltet aber auch wenn xmp aus ist kommen die abstürze
 
mit welchen taktraten läuft der Speicher denn wenn XMP aus ist? bei deinem Prozessor AMD Ryzen 5 scheinen 5200 MT/s Standard zu sein

also hast du schon den Ram mit diesen Taktraten betrieben und weiterhin den Fehler?

mit XMP an läuft er ja auf 6000mhz was Overclock ist bei deinem Prozessor und 5200mhz wären default

Vielleicht auch mal testweise noch weiter runter 4800 oder so und dann mal testen. Default Bios Laden kann auch nicht schaden hast du da irgendwas umgestellt oder wolltest den Prozessor schneller machen etc. ?
 
  • Gefällt mir
Reaktionen: Tanzmusikus
@therealcola bei ausgeschaltetem xmp läuft der ram mit 4800mt/s. hab mein bios komplett zurückgesetzt ohne erfolg also pbo aus xmp aus
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Grafikkarte aus und einbauen sicher sein das alles richtig steckt evt. andere Stromstecker vom Netzteil testen. Damit mein ich zwei andere PCI Stromstecker Schienen...

Ansonsten wurde eigentlich schon alles gesagt in vorherigen Posts.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Am besten nichts groß im bios herumspielen, man bekommt dadurch nur Probleme und selten ein Mehrwert.
Ich vermute aber das das Problem woanders liegt.
 
@Astryn02
Bitte auch mal mit nur einem RAM-Modul testen ... und andere RAM-Slots ausprobieren.
"Auto-OC" der CPU deaktivieren, dafür "Manual" oder "Manual-OC" ... oder was gibt's da im MSI-BIOS?

therealcola schrieb:
evt. andere Stromstecker vom Netzteil testen. Damit mein ich zwei andere PCI Stromstecker Schienen...
Das ist eine gute Idee. 👍
@Astryn02
Wenn das Netzteil einzelne Rails (Stromschienen) besitzt, hilft eventuell ein Tausch der beiden Powerkabel.
Das BQ-NT ist eigentlich sehr gut. Überprüfe die Powerkabel auf richtigen Sitz im NT und der GPU.
Hoffentlich sind die CPU-Kabel auch korrekt gesteckt mit festem Sitz.

Viel Erfolg !!
 
ich weiß ihr seit grad an einer andern ecke und vielleicht hab ichs überlesen, aber:
wenn das DE abschmiert und dann login kommt, wär vielleicht in Logs was zu finden?
 
Bei solchen Freezes bei Verwendung des amdgpu-Tribers wird empfohlen, den Kernelparameter
Code:
amdgpu.dcdebugmask=0x10
bzw.
Code:
amdgpu.dcdebugmask=0x12
zu setzen (Archwiki).
 
  • Gefällt mir
Reaktionen: Tanzmusikus
ich hab mir jetzt mal von ChatGPT ein skript anfertigen lassen welches meine Komponenten live ausliest und alles alle 5s in einem Log Abspeichert. muss jetzt nur warten bis er wieder abstürzt
 
Braucht man eigentlich in Deinem Fall nicht, wenn der "Absturz" Dich direkt in den Login-Chooser befördert, loggst Du Dich halt wieder ein und machst eben sudo dmesg, da sind immer die letzten relevanten Sachen drin unabhängig von der Login-Session. Kannst ja auch ohne Absturz mal ausprobieren, um ein Gefühl dafür zu bekommen, schadet nix.
 
  • Gefällt mir
Reaktionen: xXDariusXx und Tanzmusikus
Zurück
Oben