Forum |  HardWare.fr | News | Articles | PC | S'identifier | S'inscrire | Shop Recherche
2311 connectés 

  FORUM HardWare.fr
  Linux et OS Alternatifs
  Hardware

  encore des crash/freeze Ryzen 5 4600G + Debian 11 - Pcmanfm/amdgpu?

 


 Mot :   Pseudo :  
 
Bas de page
Auteur Sujet :

encore des crash/freeze Ryzen 5 4600G + Debian 11 - Pcmanfm/amdgpu?

n°1484961
rat de com​bat
attention rongeur méchant!
Posté le 25-06-2023 à 23:03:13  profilanswer
 

Bonsoir,
 
j'ouvre un sujet dédié plutôt que de spammer sur le sujet Debian. :o
 
Rappel de ma config:
Asus PRIME B350M-A
Ryzen 5 4600G
DDR4 G.Skill 2x16 Go
Debian 11 Xfce à jour avec le dernier noyau (6.3.9 actuellement) compilé moi-même et amdgpu
 
Subitement et après une semaine sans soucis avec mon nouveau 4600G j'ai encore des freezes/plantages. Cette fois ci je crois avoir trouvé un moyen de provoquer le problème: Ouvrir une console, su - , pcmanfm & puis faire une recherche "amd*.bin" sur tout le disque. Après quelque secondes le système plante/freeze. REISUB fonctionne parfois seulement. Dans journalctl j'ai eu ceci, mais une seule fois, hasard ou pas?

Jun 25 22:41:56 home kernel: bdi 8:0: the stable_pages_required attribute has been removed. Use the stable_writes queue attribute instead.
Jun 25 22:41:56 home kernel: block dm-0: the capability attribute has been deprecated.
Jun 25 22:41:56 home kernel: WARNING! power/level is deprecated; use power/control instead
Jun 25 22:42:10 home kernel: sysrq: Keyboard mode set to system default
Jun 25 22:42:21 home kernel: rcu: INFO: rcu_preempt detected stalls on CPUs/tasks:
Jun 25 22:42:21 home kernel: rcu:         3-....: (19 ticks this GP) idle=fa4c/1/0x4000000000000000 softirq=51726/51735 fqs=729
Jun 25 22:42:21 home kernel: rcu:         (detected by 6, t=5253 jiffies, g=188401, q=522 ncpus=12)
Jun 25 22:42:21 home kernel: Sending NMI from CPU 6 to CPUs 3:
Jun 25 22:42:21 home kernel: NMI backtrace for cpu 3
Jun 25 22:42:21 home kernel: CPU: 3 PID: 4168 Comm: pool-pcmanfm Tainted: G S          E      6.3.9 #1
Jun 25 22:42:21 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jun 25 22:42:21 home kernel: RIP: 0010:amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:21 home kernel: Code: 44 8d 2c b5 00 00 00 00 41 54 41 89 f4 53 48 89 fb 4c 3b af f0 08 00 00 73 5c 83 e2 02 74 1a 4c 03 ab f8 08 0>
Jun 25 22:42:21 home kernel: RSP: 0018:ffffb4e3086a7da0 EFLAGS: 00000286
Jun 25 22:42:21 home kernel: RAX: 00007f458f2045c0 RBX: ffff8ea95b340000 RCX: 0000000000000000
Jun 25 22:42:21 home kernel: RDX: 0000000000000000 RSI: 0000000000000100 RDI: ffff8ea95b340000
Jun 25 22:42:21 home kernel: RBP: ffff8ea95b340000 R08: ffffb4e3086a7f08 R09: 00007f458f2045c0
Jun 25 22:42:21 home kernel: R10: 0000000000020000 R11: 0000000000000000 R12: 0000000000000100
Jun 25 22:42:21 home kernel: R13: 00000000ffffffff R14: 0000000000000400 R15: ffffb4e3086a7f08
Jun 25 22:42:21 home kernel: FS:  00007f458f207700(0000) GS:ffff8eb04e4c0000(0000) knlGS:0000000000000000
Jun 25 22:42:21 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jun 25 22:42:21 home kernel: CR2: 00007f45840ea000 CR3: 000000018c340000 CR4: 0000000000350ee0
Jun 25 22:42:21 home kernel: Call Trace:
Jun 25 22:42:21 home kernel:  <NMI>
Jun 25 22:42:21 home kernel:  ? nmi_cpu_backtrace+0x95/0x110
Jun 25 22:42:21 home kernel:  ? nmi_cpu_backtrace_handler+0xd/0x20
Jun 25 22:42:21 home kernel:  ? nmi_handle+0x5e/0x150
Jun 25 22:42:21 home kernel:  ? default_do_nmi+0x40/0x100
Jun 25 22:42:21 home kernel:  ? exc_nmi+0x112/0x140
Jun 25 22:42:21 home kernel:  ? end_repeat_nmi+0x16/0x67
Jun 25 22:42:21 home kernel:  ? amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:21 home kernel:  ? amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:21 home kernel:  ? amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:21 home kernel:  </NMI>
Jun 25 22:42:21 home kernel:  <TASK>
Jun 25 22:42:21 home kernel:  amdgpu_debugfs_process_reg_op.isra.0+0x1fa/0x480 [amdgpu]
Jun 25 22:42:21 home kernel:  amdgpu_debugfs_regs_read+0x1f/0x30 [amdgpu]
Jun 25 22:42:21 home kernel:  full_proxy_read+0x53/0x80
Jun 25 22:42:21 home kernel:  vfs_read+0xa6/0x2e0
Jun 25 22:42:21 home kernel:  ? alloc_fd+0xae/0x190
Jun 25 22:42:21 home kernel:  ? kmem_cache_free+0x15/0x300
Jun 25 22:42:21 home kernel:  ? __fget_light.part.0+0x83/0xd0
Jun 25 22:42:21 home kernel:  ksys_read+0x5f/0xe0
Jun 25 22:42:21 home kernel:  do_syscall_64+0x3b/0x90
Jun 25 22:42:21 home kernel:  entry_SYSCALL_64_after_hwframe+0x72/0xdc
Jun 25 22:42:21 home kernel: RIP: 0033:0x7f4591a39369
Jun 25 22:42:21 home kernel: Code: 00 48 8b 0d 29 3b 0c 00 45 31 c0 64 83 39 0b 75 c6 eb b4 e8 b9 fb ff ff 66 0f 1f 84 00 00 00 00 00 48 39 ca 7>
Jun 25 22:42:21 home kernel: RSP: 002b:00007f458f2045a8 EFLAGS: 00000246 ORIG_RAX: 0000000000000000
Jun 25 22:42:21 home kernel: RAX: ffffffffffffffda RBX: 000000000000492a RCX: 00007f4591a39369
Jun 25 22:42:21 home kernel: RDX: 0000000000001000 RSI: 00007f458f2045c0 RDI: 0000000000000011
Jun 25 22:42:21 home kernel: RBP: 00007f458417a550 R08: 0000000000000000 R09: 000000000009b480
Jun 25 22:42:21 home kernel: R10: 0000000000000000 R11: 0000000000000246 R12: 00007f458417acb0
Jun 25 22:42:21 home kernel: R13: 00007f45840dded0 R14: 0000000000000011 R15: 00007f458f2045c0
Jun 25 22:42:21 home kernel:  </TASK>
Jun 25 22:42:21 home kernel: INFO: NMI handler (nmi_cpu_backtrace_handler) took too long to run: 1.113 msecs
Jun 25 22:42:25 home kernel: watchdog: BUG: soft lockup - CPU#11 stuck for 26s! [InputThread:1066]
Jun 25 22:42:25 home kernel: Modules linked in: xt_CHECKSUM(E) xt_MASQUERADE(E) xt_conntrack(E) ipt_REJECT(E) nf_reject_ipv4(E) xt_tcpudp(E) nft>
Jun 25 22:42:25 home kernel:  ppdev(E) libcrc32c(E) lp(E) nfnetlink(E) parport(E) fuse(E) drm(E) configfs(E) efivarfs(E) ip_tables(E) x_tables(E>
Jun 25 22:42:25 home kernel: CPU: 11 PID: 1066 Comm: InputThread Tainted: G S          E      6.3.9 #1
Jun 25 22:42:25 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jun 25 22:42:25 home kernel: RIP: 0010:amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:25 home kernel: Code: 44 8d 2c b5 00 00 00 00 41 54 41 89 f4 53 48 89 fb 4c 3b af f0 08 00 00 73 5c 83 e2 02 74 1a 4c 03 ab f8 08 0>
Jun 25 22:42:25 home kernel: RSP: 0018:ffffb4e300a0f8a8 EFLAGS: 00000282
Jun 25 22:42:25 home kernel: RAX: ffffffffc2518f60 RBX: ffff8ea95b340000 RCX: 0000000000000000
Jun 25 22:42:25 home kernel: RDX: 0000000000000000 RSI: 0000000000003b38 RDI: ffff8ea95b340000
Jun 25 22:42:25 home kernel: RBP: ffffb4e300a0f968 R08: 0000000000000001 R09: ffffb4e300a0f8f0
Jun 25 22:42:25 home kernel: R10: 0000000000000001 R11: 00000000000005a0 R12: 0000000000003b38
Jun 25 22:42:25 home kernel: R13: 00000000ffffffff R14: 0000000000003b38 R15: 00000000000000cb
Jun 25 22:42:25 home kernel: FS:  00007fad1d89d700(0000) GS:ffff8eb04e6c0000(0000) knlGS:0000000000000000
Jun 25 22:42:25 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jun 25 22:42:25 home kernel: CR2: 000055eda4bee070 CR3: 00000001036d8000 CR4: 0000000000350ee0
Jun 25 22:42:25 home kernel: Call Trace:
Jun 25 22:42:25 home kernel:  <IRQ>
Jun 25 22:42:25 home kernel:  ? watchdog_timer_fn+0x1b6/0x220
Jun 25 22:42:25 home kernel:  ? __pfx_watchdog_timer_fn+0x10/0x10
Jun 25 22:42:25 home kernel:  ? __hrtimer_run_queues+0x112/0x2b0
Jun 25 22:42:25 home kernel:  ? hrtimer_interrupt+0xfc/0x230
Jun 25 22:42:25 home kernel:  ? __sysvec_apic_timer_interrupt+0x5f/0x130
Jun 25 22:42:25 home kernel:  ? sysvec_apic_timer_interrupt+0x65/0x90
Jun 25 22:42:25 home kernel:  </IRQ>
Jun 25 22:42:25 home kernel:  <TASK>
Jun 25 22:42:25 home kernel:  ? asm_sysvec_apic_timer_interrupt+0x16/0x20
Jun 25 22:42:25 home kernel:  ? __pfx_amdgpu_cgs_read_register+0x10/0x10 [amdgpu]
Jun 25 22:42:25 home kernel:  ? amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 25 22:42:25 home kernel:  dm_read_reg_func+0x3a/0xb0 [amdgpu]
Jun 25 22:42:25 home kernel:  generic_reg_update_ex+0x8e/0x1f0 [amdgpu]
Jun 25 22:42:25 home kernel:  hubp1_cursor_set_position+0x1ba/0x320 [amdgpu]
Jun 25 22:42:25 home kernel:  dcn10_set_cursor_position+0x2b9/0x540 [amdgpu]
Jun 25 22:42:25 home kernel:  dc_stream_set_cursor_position+0xd2/0x200 [amdgpu]
Jun 25 22:42:25 home kernel:  handle_cursor_update+0x1be/0x320 [amdgpu]
Jun 25 22:42:25 home kernel:  drm_atomic_helper_async_commit+0x63/0xe0 [drm_kms_helper]
Jun 25 22:42:25 home kernel:  drm_atomic_helper_commit+0xea/0x140 [drm_kms_helper]
Jun 25 22:42:25 home kernel:  drm_atomic_commit+0x96/0xf0 [drm]
Jun 25 22:42:25 home kernel:  ? __pfx___drm_printfn_info+0x10/0x10 [drm]
Jun 25 22:42:25 home kernel:  drm_atomic_helper_update_plane+0xed/0x150 [drm_kms_helper]
Jun 25 22:42:25 home kernel:  drm_mode_cursor_universal+0x128/0x240 [drm]
Jun 25 22:42:25 home kernel:  drm_mode_cursor_common+0xed/0x220 [drm]
Jun 25 22:42:25 home kernel:  ? __pfx_drm_mode_cursor_ioctl+0x10/0x10 [drm]
Jun 25 22:42:25 home kernel:  drm_mode_cursor_ioctl+0x4b/0x70 [drm]
Jun 25 22:42:25 home kernel:  drm_ioctl_kernel+0xb4/0x140 [drm]
Jun 25 22:42:25 home kernel:  drm_ioctl+0x239/0x430 [drm]
Jun 25 22:42:25 home kernel:  ? __pfx_drm_mode_cursor_ioctl+0x10/0x10 [drm]
Jun 25 22:42:25 home kernel:  amdgpu_drm_ioctl+0x49/0x80 [amdgpu]
Jun 25 22:42:25 home kernel:  __x64_sys_ioctl+0x8b/0xc0
Jun 25 22:42:25 home kernel:  do_syscall_64+0x3b/0x90
Jun 25 22:42:25 home kernel:  entry_SYSCALL_64_after_hwframe+0x72/0xdc
Jun 25 22:42:25 home kernel: RIP: 0033:0x7fad5111d237
Jun 25 22:42:25 home kernel: Code: 00 00 00 48 8b 05 59 cc 0d 00 64 c7 00 26 00 00 00 48 c7 c0 ff ff ff ff c3 66 2e 0f 1f 84 00 00 00 00 00 b8 1>
Jun 25 22:42:25 home kernel: RSP: 002b:00007fad1d89b308 EFLAGS: 00000246 ORIG_RAX: 0000000000000010
Jun 25 22:42:25 home kernel: RAX: ffffffffffffffda RBX: 00007fad1d89b340 RCX: 00007fad5111d237
Jun 25 22:42:25 home kernel: RDX: 00007fad1d89b340 RSI: 00000000c01c64a3 RDI: 000000000000000d
Jun 25 22:42:25 home kernel: RBP: 00000000c01c64a3 R08: 000000000000004b R09: 0000000000000001
Jun 25 22:42:25 home kernel: R10: 0000000000000004 R11: 0000000000000246 R12: 00005605a40d8370
Jun 25 22:42:25 home kernel: R13: 000000000000000d R14: 0000000000000063 R15: 0000000000000063
Jun 25 22:42:25 home kernel:  </TASK>


 
Autres infos:
-Mon SSD SATA va bien.
-Avec le noyau standard Debian 11 même soucis, je peux provoquer le crash.
 
Que faire / Comment debugger ça? Soucis CPU ou amdgpu?? Je pensais déjà mettre manuellement à jour le microcode AMD et le firmware du iGPU, mais est-ce une bonne idée? Des avis?
 
Merci. :jap:


Message édité par rat de combat le 26-06-2023 à 16:33:29

---------------
matos à vendre
mood
Publicité
Posté le 25-06-2023 à 23:03:13  profilanswer
 

n°1484964
rat de com​bat
attention rongeur méchant!
Posté le 25-06-2023 à 23:59:56  profilanswer
 

J'ai tenté de rajouter "amdgpu.aspm=0 amdgpu.dpm=0 pcie.aspm=off" comme options boot suite à un truc lu sur internet, mais cela fait que Linux ne démarre plus, je ne vois plus mon login... Merci la fonction éditer de GRUB...
 
Rhaaaa! :cry:


---------------
matos à vendre
n°1484965
rat de com​bat
attention rongeur méchant!
Posté le 26-06-2023 à 00:22:00  profilanswer
 

et voilà un kernel panic (NULL-ptr dereference) directement au démarrage. Un soucis matériel? Je vais déjà laisser tourner memtest86+...


---------------
matos à vendre
n°1484977
rat de com​bat
attention rongeur méchant!
Posté le 26-06-2023 à 15:16:46  profilanswer
 

Bon:
-memtest86+ a tourné pendant 10h sans erreur.
-Si je boote depuis une clé USB (pas live mais Deb11 installé sur une clé) et que je fais les manips indiqués plus hauts (chercher amd*.bin sur tout le SSD en tant que root) PAS de plantage.
-Le SSD est entièrement crypté (LUKS), serait-ce un problème?
-EDIT: Faire la même recherche en console avec find ne pose aucun problème.

 

Sinon j'ai utilisé deux adaptateurs USB-série pour relier mon PC à un autre PC en laissant tourner journalctl -f > /dev/ttyUSB0 sur le PC principal.

 

Voila ce que ça donne:

-- Journal begins at Sun 2022-04-24 19:40:45 CEST. --
Jun 26 14:58:36 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:36 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:36 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:54 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:54 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:56 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:58:56 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:59:04 home xdg-desktop-por[1842]: Failed to get application states: GDBus.Error:org.freedesktop.portal.Error.Failed: Could not get window list
Jun 26 14:59:29 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
Jun 26 14:59:29 home rtkit-daemon[1014]: Supervising 7 threads of 4 processes of 1 users.
------------------- crash triggered here --------------------
Jun 26 15:01:19 home kernel: bdi 8:0: the stable_pages_required attribute has been removed. Use the stable_writes queue attribute instead.
Jun 26 15:01:19 home kernel: block dm-0: the capability attribute has been deprecated.
Jun 26 15:01:20 home kernel: WARNING! power/level is deprecated; use power/control instead
Jun 26 15:01:32 home rtkit-daemon[1014]: The canary thread is apparently starving. Taking action.
Jun 26 15:01:43 home kernel: INFO: NMI handler (perf_event_nmi_handler) took too long to run: 209.658 msecs
Jun 26 15:01:43 home kernel: perf: interrupt took too long (1637971 > 2500), lowering kernel.perf_event_max_sample_rate to 250
Jun 26 15:01:43 home kernel: INFO: NMI handler (perf_event_nmi_handler) took too long to run: 331.608 msecs
Jun 26 15:01:43 home kernel: perf: interrupt took too long (2590705 > 2047463), lowering kernel.perf_event_max_sample_rate to 250
Jun 26 15:01:32 home rtkit-daemon[1014]: Demoting known real-time threads.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1045 of process 1044.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1044 of process 1044.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1076 of process 1010.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1010 of process 1010.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1013 of process 1009.
Jun 26 15:01:32 home rtkit-daemon[1014]: Successfully demoted thread 1009 of process 1009.
Jun 26 15:01:32 home rtkit-daemon[1014]: Demoted 6 threads.
Jun 26 15:01:45 home kernel: rcu: INFO: rcu_preempt detected stalls on CPUs/tasks:
Jun 26 15:01:45 home kernel: rcu:         4-....: (19 ticks this GP) idle=f604/1/0x4000000000000000 softirq=7675/7675 fqs=596
Jun 26 15:01:45 home kernel: rcu:         (detected by 11, t=5343 jiffies, g=22081, q=635 ncpus=12)
Jun 26 15:01:45 home kernel: Sending NMI from CPU 11 to CPUs 4:
Jun 26 15:01:45 home kernel: NMI backtrace for cpu 4
Jun 26 15:01:45 home kernel: CPU: 4 PID: 2393 Comm: pool-pcmanfm Tainted: G S          E      6.3.9 #1
Jun 26 15:01:45 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jun 26 15:01:45 home kernel: RIP: 0010:amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 26 15:01:45 home kernel: Code: 44 8d 2c b5 00 00 00 00 41 54 41 89 f4 53 48 89 fb 4c 3b af f0 08 00 00 73 5c 83 e2 02 74 1a 4c 03 ab f8 08 00 00 45 8b 6d 00 <66> 90 44 89 e8 5b 41 5c 41 5d e9 b0 05 d9 dc f6 87 18 ac 01 00 10
Jun 26 15:01:45 home kernel: RSP: 0018:ffff9c6503ce3da0 EFLAGS: 00000286
Jun 26 15:01:45 home kernel: RAX: 00007f316a22d5c0 RBX: ffff90ce83220000 RCX: 0000000000000000
Jun 26 15:01:45 home kernel: RDX: 0000000000000000 RSI: 0000000000000100 RDI: ffff90ce83220000
Jun 26 15:01:45 home kernel: RBP: ffff90ce83220000 R08: ffff9c6503ce3f08 R09: 00007f316a22d5c0
Jun 26 15:01:45 home kernel: R10: 0000000000020000 R11: 0000000000000000 R12: 0000000000000100
Jun 26 15:01:45 home kernel: R13: 00000000ffffffff R14: 0000000000000400 R15: ffff9c6503ce3f08
Jun 26 15:01:45 home kernel: FS:  00007f316a230700(0000) GS:ffff90d58e500000(0000) knlGS:0000000000000000
Jun 26 15:01:45 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jun 26 15:01:45 home kernel: CR2: 00007f315c16cba8 CR3: 00000001146d2000 CR4: 0000000000350ee0
Jun 26 15:01:45 home kernel: Call Trace:
Jun 26 15:01:45 home kernel:  <NMI>
Jun 26 15:01:45 home kernel:  ? nmi_cpu_backtrace+0x95/0x110
Jun 26 15:01:45 home kernel:  ? nmi_cpu_backtrace_handler+0xd/0x20
Jun 26 15:01:45 home kernel:  ? nmi_handle+0x5e/0x150
Jun 26 15:01:45 home kernel:  ? default_do_nmi+0x40/0x100
Jun 26 15:01:45 home kernel:  ? exc_nmi+0x112/0x140
Jun 26 15:01:45 home kernel:  ? end_repeat_nmi+0x16/0x67
Jun 26 15:01:45 home kernel:  ? amdgpu_device_rreg.part.0+0x31/0xf0 [amdgpu]
Jun 26 15:01:45 home kernel: [0;1;38;5;1
(fin brutal du log, redémarrage auto du PC)

 

J'ai aussi remarqué que mon pointeur souris "saute" régulièrement. Je ne pense pas qu'il y ait un lien mais dans le doute je le dis. Ca ne me dérange pas vraiment, vu que je ne joue pas...

 

Je vais continuer mes recherches, mais je suis franchement perdu. N'hésitez pas à poster vos idées. :jap:


Message édité par rat de combat le 26-06-2023 à 15:36:05
n°1484979
rat de com​bat
attention rongeur méchant!
Posté le 26-06-2023 à 16:21:58  profilanswer
 

-Démarrer pcmanfm avec ionice idle ne change rien, ça freeze toujours.
-Quand ça freeze même REISUB ne fonctionne plus.
-Faire la même recherche avec catfish ne pose pas de soucis.
 
???


---------------
matos à vendre
n°1484986
rat de com​bat
attention rongeur méchant!
Posté le 26-06-2023 à 21:08:04  profilanswer
 

Encore un test: Changer le scheduler pour sda vers "none" -> toujours le même problème.

 

Je vais foutre le feu à la machine. :o

 

EDIT: et exactement la même manip' dans une VM Deb 11 ne provoque pas de crash/freeze non plus...


Message édité par rat de combat le 26-06-2023 à 21:30:05
n°1485335
rat de com​bat
attention rongeur méchant!
Posté le 17-07-2023 à 14:56:35  profilanswer
 

Bon ben ça ne s'arrange pas. :(
 
Pendant que j'utilisais Firefox (seul logiciel de démarré):

Jul 17 14:33:43 home kernel: BUG: kernel NULL pointer dereference, address: 00000000000000c6
Jul 17 14:33:43 home kernel: #PF: supervisor read access in kernel mode
Jul 17 14:33:43 home kernel: #PF: error_code(0x0000) - not-present page
Jul 17 14:33:43 home kernel: PGD 0 P4D 0  
Jul 17 14:33:43 home kernel: Oops: 0000 [#1] PREEMPT SMP NOPTI
Jul 17 14:33:43 home kernel: CPU: 3 PID: 70450 Comm: kworker/u64:74 Tainted: G S          E      6.3.13 #1
Jul 17 14:33:43 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jul 17 14:33:43 home kernel: RIP: 0010:wq_worker_running+0xa/0x50
Jul 17 14:33:43 home kernel: Code: 4c 8d 6c 24 18 e9 0e ff ff ff e8 81 bf 9b 00 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 0f 1f 44 00 00 e8 26 5d 00 00 <8b> 50 70 85 d2 74 20 65 ff 05 c0 b0 36 4a f7 40 68 c8 01 00 00 74
Jul 17 14:33:43 home kernel: RSP: 0018:ffffb37f00bd7ed8 EFLAGS: 00010202
Jul 17 14:33:43 home kernel: RAX: 0000000000000056 RBX: ffff9754c0059000 RCX: 0000000000000010
Jul 17 14:33:43 home kernel: RDX: 0000000000000011 RSI: ffff97550f172c18 RDI: ffff9754e3310000
Jul 17 14:33:43 home kernel: RBP: ffff97553676c540 R08: ffff97550f172c18 R09: 0000000000000000
Jul 17 14:33:43 home kernel: R10: 0000000000000001 R11: 0000000000000000 R12: ffff97553676c570
Jul 17 14:33:43 home kernel: R13: ffff9754c0059028 R14: ffff9754c0059098 R15: ffff9754c0059000
Jul 17 14:33:43 home kernel: FS:  0000000000000000(0000) GS:ffff975bce4c0000(0000) knlGS:0000000000000000
Jul 17 14:33:43 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul 17 14:33:43 home kernel: CR2: 00000000000000c6 CR3: 00000004e341a000 CR4: 0000000000350ee0
Jul 17 14:33:43 home kernel: Call Trace:
Jul 17 14:33:43 home kernel:  <TASK>
Jul 17 14:33:43 home kernel:  ? __die+0x20/0x70
Jul 17 14:33:43 home kernel:  ? page_fault_oops+0x15d/0x440
Jul 17 14:33:43 home kernel:  ? psi_group_change+0x169/0x3b0
Jul 17 14:33:43 home kernel:  ? dequeue_entity+0xff/0x420
Jul 17 14:33:43 home kernel:  ? exc_page_fault+0x71/0x170
Jul 17 14:33:43 home kernel:  ? asm_exc_page_fault+0x22/0x30
Jul 17 14:33:43 home kernel:  ? wq_worker_running+0xa/0x50
Jul 17 14:33:43 home kernel:  ? wq_worker_running+0xa/0x50
Jul 17 14:33:43 home kernel:  worker_thread+0xb9/0x3a0
Jul 17 14:33:43 home kernel:  ? __pfx_worker_thread+0x10/0x10
Jul 17 14:33:43 home kernel:  kthread+0xd8/0x100
Jul 17 14:33:43 home kernel:  ? __pfx_kthread+0x10/0x10
Jul 17 14:33:43 home kernel:  ret_from_fork+0x2c/0x50
Jul 17 14:33:43 home kernel:  </TASK>

suivi de mal pas mal d'autres NULL-ptr deref et d'autres erreurs puis freeze total.
La dernière ligne du log est

Jul 17 14:34:37 home kernel: NMI watchdog: Watchdog detected hard LOCKUP on cpu 1


Et quand j'ai redémarré c'était pas mieux, avant login, juste après avoir chargé amdgpu, les stacktrace défilaient à l'écran, mais ils n'ont visiblement pas été sauvegardés dans le log, du coup j'ai pas les détails.
 
Mais c'est quoi tout ça???
 
Pour rappel, memtest -> ok, SMART du SSD -> ok, processeur tout neuf.
 
:(


---------------
matos à vendre
n°1485336
burn2
ça rox du poney
Posté le 17-07-2023 à 16:40:16  profilanswer
 

Bonjour,
 
Pourquoi ne pas essayer de mettre à jour à debian 12 pour voir si jamais le problème n'est pas résolu avec les pilotes récents?  
 
Sinon parfois c'est le mode d'idle qui pose problème.
Il faut voir si tu ne peux pas basculer en typical current.


---------------
"C'est vrai qu'un type aussi pénible de jour on serait en droit d'espérer qu'il fasse un break de nuit mais bon …"
n°1485337
rat de com​bat
attention rongeur méchant!
Posté le 17-07-2023 à 17:00:56  profilanswer
 

Oui, j'envisage une màj vers Debian 12, mais je voulais attendre la 12.1 car il semble encore y avoir quelque soucis. Je refléchis aussi à installer Debian 12 en repartant de zéro, mais pour ça j'aurais préféré un SSD neuf (pour pouvoir revenir sur l'ancien en cas de soucis) mais c'est encore des sous... A voir, il faut faire quelque chose en tout cas.
 
Malheureusement je n'ai plus l'option typical idle current ou similaire dans mon BIOS (ou alors je suis aveugle??) avec le Ryzen 5 4600G. Avec le 1600 je l'avais et j'y avais touché en effet.
 
Merci pour ta réponse. :jap:


---------------
matos à vendre
n°1485366
rat de com​bat
attention rongeur méchant!
Posté le 19-07-2023 à 21:10:56  profilanswer
 

Je viens de passer commande pour un nouveau SSD, je vais faire une install "propre" Debian 12, en espérant...


---------------
matos à vendre
mood
Publicité
Posté le 19-07-2023 à 21:10:56  profilanswer
 

n°1485367
burn2
ça rox du poney
Posté le 19-07-2023 à 22:32:34  profilanswer
 

Si ça peut te rassurer, je suis en full amd ici que ça soit de la RX6600Xt, de la R5 240, ou même de l'igp vega sur un 4800h, et je n'ai absolument aucun problème sur une autre distrib linux.
 
Il y en a pas mal qui utilise debian 12 sur un 4800h donc il n'y a pas de raison que ça ne passe pas chez toi, sauf bug de bios ou de matériel très spécifique.


---------------
"C'est vrai qu'un type aussi pénible de jour on serait en droit d'espérer qu'il fasse un break de nuit mais bon …"
n°1485368
regdub
Posté le 19-07-2023 à 22:34:41  profilanswer
 

Au niveau températures CPU et GPU, c'est à combien du max. ?
 
Est-ce que faire monter la température par exemple en lisant une vidéo lourde en vitesse accélérée (avec ou sans accélération HW) augmente la probabilité de freeze ?


---------------
Legalize it @HFR
n°1485370
rat de com​bat
attention rongeur méchant!
Posté le 19-07-2023 à 23:42:50  profilanswer
 

La je suis à même pas 30°C, en "charge lourde" (make -j12 de noyau) par contre le CPU monte rapidement assez haut, genre 80°C, mais redescend aussi rapidement une fois la compil' terminée.
 
Pour la vidéo faudrait que je teste, mais j'ai pas l'impression que les freeze soient liés à la charge (ni à la température). C'est souvent au démarrage ou à l'extinction, voir pratiquement à vide (genre que Firefox qui tourne avec un seul tab), mais le 4600G n'a plus (j'espère) les soucis du 1600?!?!
 
Je dois recevoir le SSD la semaine prochaine, j'espère que le soucis sera réglé en installant Debian 12. Sinon il ne reste plus grand chose à faire à part changer de CM et/ou d'alim, le reste étant neuf...


---------------
matos à vendre
n°1485435
Akilae_
Posté le 23-07-2023 à 12:13:31  profilanswer
 

Câble de données SATA qui déconne?
Sur les 6 derniers câbles que j'ai acheté, j'en ai renvoyé 5 (!!) qui me faisaient des erreurs de CRC visibles sous TrueNas.

n°1485515
rat de com​bat
attention rongeur méchant!
Posté le 25-07-2023 à 19:03:58  profilanswer
 

Bonne remarque, mais les erreurs CRC devraient apparaître dans dmesg non? Ou ailleurs quelque part? Je vais fouiller un peu...


---------------
matos à vendre
n°1485516
rat de com​bat
attention rongeur méchant!
Posté le 25-07-2023 à 19:19:55  profilanswer
 

Étrange, je ne trouve aucun fichier virtuel qui parle d'erreurs CRC / parité / bidule pour un disque, ça n'existe pas? Pourtant sous Linux il y a des statistiques pour un peu tout dans /sys/ et cie?
 
Quelqu'un?
 
Sinon smartctl -a me dit 0 erreurs CRC, mais je ne sais pas si il s'agit d'erreurs concernant les données stockés ou la transmission SATA pour ce paramètre?


---------------
matos à vendre
n°1485549
rat de com​bat
attention rongeur méchant!
Posté le 27-07-2023 à 23:59:53  profilanswer
 

Bon ou plutôt pas bon du tout. :o  
 
Debian 12.1 sur un MX500 tout neuf, recherche de n'importe quoi sous Pcmanfm en tant que root sur tout le disque -> FREEZE! :kaola:  :cry:  

Jul 27 21:03:28 home kernel: bdi 8:0: the stable_pages_required attribute has been removed. Use the stable_writes queue attribute instead.
Jul 27 21:03:28 home kernel: WARNING! power/level is deprecated; use power/control instead
Jul 27 21:03:50 home kernel: INFO: NMI handler (perf_event_nmi_handler) took too long to run: 209.002 msecs
Jul 27 21:03:50 home kernel: perf: interrupt took too long (1632884 > 2500), lowering kernel.perf_event_max_sample_rate to 250
Jul 27 21:03:51 home kernel: INFO: NMI handler (perf_event_nmi_handler) took too long to run: 497.469 msecs
Jul 27 21:03:51 home kernel: perf: interrupt took too long (3886582 > 2041105), lowering kernel.perf_event_max_sample_rate to 250
Jul 27 21:03:51 home systemd-logind[903]: Power key pressed short. [Oui c'était moi qui tentait de faire un shutdown propre, sans résultat/réaction]
Jul 27 21:03:57 home kernel: NMI watchdog: Watchdog detected hard LOCKUP on cpu 6
Jul 27 21:03:57 home kernel: Modules linked in: binfmt_misc nls_ascii nls_cp437 vfat fat intel_rapl_msr snd_hda_codec_realtek intel_rapl_common snd_hda_codec_generic edac_mce_amd snd_hda_codec_hdmi snd_hda_intel kvm_amd snd_intel_dspcfg snd_intel_sdw_acpi eeepc_wmi snd_hda_codec asus_wmi kvm snd_hda_core platform_profile battery snd_hwdep sparse_keymap irqbypass ledtrig_audio snd_pcm rfkill rapl wmi_bmof pcspkr snd_timer sp5100_tco snd k10temp ccp watchdog soundcore rng_core joydev acpi_cpufreq sg evdev parport_pc ppdev lp parport loop fuse efi_pstore configfs efivarfs ip_tables x_tables autofs4 ext4 crc16 mbcache jbd2 crc32c_generic dm_crypt dm_mod amdgpu hid_generic sd_mod gpu_sched uas t10_pi drm_buddy crc32_pclmul i2c_algo_bit usbhid crc32c_intel crc64_rocksoft_generic usb_storage hid drm_display_helper crc64_rocksoft sr_mod crc_t10dif crct10dif_generic cdrom crct10dif_pclmul crc64 crct10dif_common cec ghash_clmulni_intel rc_core sha512_ssse3 drm_ttm_helper sha512_generic ttm ahci drm_kms_helper
Jul 27 21:04:09 home kernel:  libahci xhci_pci libata aesni_intel xhci_hcd crypto_simd drm cryptd r8169 scsi_mod usbcore realtek mdio_devres i2c_piix4 libphy video usb_common scsi_common wmi gpio_amdpt gpio_generic button
Jul 27 21:04:09 home kernel: CPU: 6 PID: 0 Comm: swapper/6 Not tainted 6.1.0-10-amd64 #1  Debian 6.1.38-1
Jul 27 21:04:09 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jul 27 21:04:09 home kernel: RIP: 0010:amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel: Code: 41 54 44 8d 24 b5 00 00 00 00 55 89 f5 53 48 89 fb 4c 3b a7 b8 08 00 00 73 62 83 e2 02 74 21 4c 03 a3 c0 08 00 00 45 8b 24 24 <48> 8b 43 08 0f b7 70 3e 66 90 44 89 e0 5b 5d 41 5c e9 0b 9c a4 f2
Jul 27 21:04:09 home kernel: RSP: 0018:ffffaa6d00368bd8 EFLAGS: 00000082
Jul 27 21:04:09 home kernel: RAX: ffffffffc0d64c80 RBX: ffff8faa0ca00000 RCX: 0000000000007fff
Jul 27 21:04:09 home kernel: RDX: 0000000000000000 RSI: 000000000000500b RDI: ffff8faa0ca00000
Jul 27 21:04:09 home kernel: RBP: 000000000000500b R08: ffffaa6d00368c54 R09: 0000000000000000
Jul 27 21:04:09 home kernel: R10: ffffaa6d00368c88 R11: ffffaa6d00368c8c R12: 00000000ffffffff
Jul 27 21:04:09 home kernel: R13: ffffaa6d00368d5c R14: ffff8faa0ca00010 R15: ffffaa6d00368d68
Jul 27 21:04:09 home kernel: FS:  0000000000000000(0000) GS:ffff8fb10e580000(0000) knlGS:0000000000000000
Jul 27 21:04:09 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul 27 21:04:09 home kernel: CR2: 00007f35608ac000 CR3: 00000001203b8000 CR4: 0000000000350ee0
Jul 27 21:04:09 home kernel: Call Trace:
Jul 27 21:04:09 home kernel:  <NMI>
Jul 27 21:04:09 home kernel:  ? watchdog_overflow_callback.cold+0x20/0x7e
Jul 27 21:04:09 home kernel:  ? __perf_event_overflow+0xe5/0x2a0
Jul 27 21:04:09 home kernel:  ? x86_pmu_handle_irq+0x108/0x170
Jul 27 21:04:09 home kernel:  ? amd_pmu_handle_irq+0x3f/0xa0
Jul 27 21:04:09 home kernel:  ? perf_event_nmi_handler+0x26/0x50
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  ? nmi_handle+0x5d/0x120
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  ? default_do_nmi+0x69/0x170
Jul 27 21:04:09 home kernel:  ? exc_nmi+0x13c/0x170
Jul 27 21:04:09 home kernel:  ? end_repeat_nmi+0x16/0x67
Jul 27 21:04:09 home kernel:  ? amdgpu_cgs_write_register+0x10/0x10 [amdgpu]
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  </NMI>
Jul 27 21:04:09 home kernel:  <IRQ>
Jul 27 21:04:09 home kernel:  dm_read_reg_func+0x37/0xb0 [amdgpu]
Jul 27 21:04:09 home kernel:  generic_reg_get+0x1d/0x30 [amdgpu]
Jul 27 21:04:09 home kernel:  optc1_get_crtc_scanoutpos+0x77/0xb0 [amdgpu]
Jul 27 21:04:09 home kernel:  dc_stream_get_scanoutpos+0x63/0x70 [amdgpu]
Jul 27 21:04:09 home kernel:  dm_crtc_get_scanoutpos+0x7e/0xd0 [amdgpu]
Jul 27 21:04:09 home kernel:  amdgpu_display_get_crtc_scanoutpos+0x91/0x180 [amdgpu]
Jul 27 21:04:09 home kernel:  ? amdgpu_display_crtc_idx_to_irq_type+0x30/0x30 [amdgpu]
Jul 27 21:04:09 home kernel:  amdgpu_crtc_get_scanout_position+0x24/0x30 [amdgpu]
Jul 27 21:04:09 home kernel:  drm_crtc_vblank_helper_get_vblank_timestamp_internal+0x14e/0x360 [drm]
Jul 27 21:04:09 home kernel:  drm_get_last_vbltimestamp+0xad/0xc0 [drm]
Jul 27 21:04:09 home kernel:  drm_update_vblank_count+0x8f/0x3c0 [drm]
Jul 27 21:04:09 home kernel:  ? ttwu_do_wakeup+0x17/0x170
Jul 27 21:04:09 home kernel:  drm_vblank_disable_and_save+0x71/0xf0 [drm]
Jul 27 21:04:09 home kernel:  vblank_disable_fn+0x63/0x80 [drm]
Jul 27 21:04:09 home kernel:  ? drm_vblank_disable_and_save+0xf0/0xf0 [drm]
Jul 27 21:04:09 home kernel:  ? drm_vblank_disable_and_save+0xf0/0xf0 [drm]
Jul 27 21:04:09 home kernel:  call_timer_fn+0x27/0x130
Jul 27 21:04:09 home kernel:  __run_timers+0x21c/0x2a0
Jul 27 21:04:09 home kernel:  run_timer_softirq+0x2b/0x50
Jul 27 21:04:09 home kernel:  __do_softirq+0xf0/0x2fe
Jul 27 21:04:09 home kernel:  __irq_exit_rcu+0xc7/0x130
Jul 27 21:04:09 home kernel:  sysvec_apic_timer_interrupt+0x9e/0xc0
Jul 27 21:04:09 home kernel:  </IRQ>
Jul 27 21:04:09 home kernel:  <TASK>
Jul 27 21:04:09 home kernel:  asm_sysvec_apic_timer_interrupt+0x16/0x20
Jul 27 21:04:09 home kernel: RIP: 0010:cpuidle_enter_state+0xde/0x420
Jul 27 21:04:09 home kernel: Code: 00 00 31 ff e8 c3 89 97 ff 45 84 ff 74 16 9c 58 0f 1f 40 00 f6 c4 02 0f 85 25 03 00 00 31 ff e8 b8 48 9e ff fb 0f 1f 44 00 00 <45> 85 f6 0f 88 85 01 00 00 49 63 d6 48 8d 04 52 48 8d 04 82 49 8d
Jul 27 21:04:09 home kernel: RSP: 0018:ffffaa6d0018fe90 EFLAGS: 00000246
Jul 27 21:04:09 home kernel: RAX: ffff8fb10e580000 RBX: ffff8faa244c1800 RCX: 00000000000000a9
Jul 27 21:04:09 home kernel: RDX: 0000000000000006 RSI: ffffffffb3b4109e RDI: ffffffffb3b1a5cd
Jul 27 21:04:09 home kernel: RBP: 0000000000000002 R08: ffffffffffc2fbc8 R09: 00000000226b5f00
Jul 27 21:04:09 home kernel: R10: 0000000000000008 R11: 000000000007bfcc R12: ffffffffb43a9760
Jul 27 21:04:09 home kernel: R13: 0000005889a3221e R14: 0000000000000002 R15: 0000000000000000
Jul 27 21:04:09 home kernel:  cpuidle_enter+0x29/0x40
Jul 27 21:04:09 home kernel:  do_idle+0x20c/0x2b0
Jul 27 21:04:09 home kernel:  cpu_startup_entry+0x19/0x20
Jul 27 21:04:09 home kernel:  start_secondary+0x130/0x150
Jul 27 21:04:09 home kernel:  secondary_startup_64_no_verify+0xe5/0xeb
Jul 27 21:04:09 home kernel:  </TASK>
Jul 27 21:04:09 home kernel: watchdog: BUG: soft lockup - CPU#5 stuck for 26s! [pool-pcmanfm:2379]
Jul 27 21:04:09 home kernel: Modules linked in: binfmt_misc nls_ascii nls_cp437 vfat fat intel_rapl_msr snd_hda_codec_realtek intel_rapl_common snd_hda_codec_generic edac_mce_amd snd_hda_codec_hdmi snd_hda_intel kvm_amd snd_intel_dspcfg snd_intel_sdw_acpi eeepc_wmi snd_hda_codec asus_wmi kvm snd_hda_core platform_profile battery snd_hwdep sparse_keymap irqbypass ledtrig_audio snd_pcm rfkill rapl wmi_bmof pcspkr snd_timer sp5100_tco snd k10temp ccp watchdog soundcore rng_core joydev acpi_cpufreq sg evdev parport_pc ppdev lp parport loop fuse efi_pstore configfs efivarfs ip_tables x_tables autofs4 ext4 crc16 mbcache jbd2 crc32c_generic dm_crypt dm_mod amdgpu hid_generic sd_mod gpu_sched uas t10_pi drm_buddy crc32_pclmul i2c_algo_bit usbhid crc32c_intel crc64_rocksoft_generic usb_storage hid drm_display_helper crc64_rocksoft sr_mod crc_t10dif crct10dif_generic cdrom crct10dif_pclmul crc64 crct10dif_common cec ghash_clmulni_intel rc_core sha512_ssse3 drm_ttm_helper sha512_generic ttm ahci drm_kms_helper
Jul 27 21:04:09 home kernel:  libahci xhci_pci libata aesni_intel xhci_hcd crypto_simd drm cryptd r8169 scsi_mod usbcore realtek mdio_devres i2c_piix4 libphy video usb_common scsi_common wmi gpio_amdpt gpio_generic button
Jul 27 21:04:09 home kernel: CPU: 5 PID: 2379 Comm: pool-pcmanfm Not tainted 6.1.0-10-amd64 #1  Debian 6.1.38-1
Jul 27 21:04:09 home kernel: Hardware name: System manufacturer System Product Name/PRIME B350M-A, BIOS 6042 04/28/2022
Jul 27 21:04:09 home kernel: RIP: 0010:amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel: Code: 41 54 44 8d 24 b5 00 00 00 00 55 89 f5 53 48 89 fb 4c 3b a7 b8 08 00 00 73 62 83 e2 02 74 21 4c 03 a3 c0 08 00 00 45 8b 24 24 <48> 8b 43 08 0f b7 70 3e 66 90 44 89 e0 5b 5d 41 5c e9 0b 9c a4 f2
Jul 27 21:04:09 home kernel: RSP: 0018:ffffaa6d0893fc90 EFLAGS: 00000282
Jul 27 21:04:09 home kernel: RAX: 00000000ffffffff RBX: ffff8faa0ca00000 RCX: 00007fec0b1faa00
Jul 27 21:04:09 home kernel: RDX: 0000000000000000 RSI: 0000000000000108 RDI: ffff8faa0ca00000
Jul 27 21:04:09 home kernel: RBP: 0000000000000108 R08: ffffaa6d0893fe00 R09: ffff8faa509fe800
Jul 27 21:04:09 home kernel: R10: 0000000000000000 R11: 0000000000000000 R12: 00000000ffffffff
Jul 27 21:04:09 home kernel: R13: 00007fec0b1fa5e0 R14: ffffaa6d0893fe00 R15: 0000000000000001
Jul 27 21:04:09 home kernel: FS:  00007fec0b1fd6c0(0000) GS:ffff8fb10e540000(0000) knlGS:0000000000000000
Jul 27 21:04:09 home kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jul 27 21:04:09 home kernel: CR2: 00007f5b217f0000 CR3: 000000010bc90000 CR4: 0000000000350ee0
Jul 27 21:04:09 home kernel: Call Trace:
Jul 27 21:04:09 home kernel:  <IRQ>
Jul 27 21:04:09 home kernel:  ? watchdog_timer_fn+0x21c/0x280
Jul 27 21:04:09 home kernel:  ? softlockup_fn+0x70/0x70
Jul 27 21:04:09 home kernel:  ? __hrtimer_run_queues+0x112/0x2b0
Jul 27 21:04:09 home kernel:  ? hrtimer_interrupt+0xfe/0x220
Jul 27 21:04:09 home kernel:  ? __sysvec_apic_timer_interrupt+0x7f/0x170
Jul 27 21:04:09 home kernel:  ? sysvec_apic_timer_interrupt+0x99/0xc0
Jul 27 21:04:09 home kernel:  </IRQ>
Jul 27 21:04:09 home kernel:  <TASK>
Jul 27 21:04:09 home kernel:  ? asm_sysvec_apic_timer_interrupt+0x16/0x20
Jul 27 21:04:09 home kernel:  ? amdgpu_device_rreg.part.0+0x2f/0xe0 [amdgpu]
Jul 27 21:04:09 home kernel:  amdgpu_debugfs_process_reg_op.isra.0+0x1f2/0x4d0 [amdgpu]
Jul 27 21:04:09 home kernel:  amdgpu_debugfs_regs_read+0x1f/0x30 [amdgpu]
Jul 27 21:04:09 home kernel:  full_proxy_read+0x53/0x80
Jul 27 21:04:09 home kernel:  vfs_read+0xa5/0x310
Jul 27 21:04:09 home kernel:  ? __fget_light+0x9d/0x100
Jul 27 21:04:09 home kernel:  ksys_read+0x6b/0xf0
Jul 27 21:04:09 home kernel:  do_syscall_64+0x5b/0xc0
Jul 27 21:04:09 home kernel:  ? exit_to_user_mode_prepare+0x40/0x1d0
Jul 27 21:04:09 home kernel:  ? syscall_exit_to_user_mode+0x17/0x40
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  ? fpregs_assert_state_consistent+0x22/0x50
Jul 27 21:04:09 home kernel:  ? exit_to_user_mode_prepare+0x40/0x1d0
Jul 27 21:04:09 home kernel:  ? syscall_exit_to_user_mode+0x17/0x40
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  ? fpregs_assert_state_consistent+0x22/0x50
Jul 27 21:04:09 home kernel:  ? exit_to_user_mode_prepare+0x40/0x1d0
Jul 27 21:04:09 home kernel:  ? syscall_exit_to_user_mode+0x17/0x40
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  ? do_syscall_64+0x67/0xc0
Jul 27 21:04:09 home kernel:  entry_SYSCALL_64_after_hwframe+0x63/0xcd
Jul 27 21:04:09 home kernel: RIP: 0033:0x7fec0d5c60bc
Jul 27 21:04:09 home kernel: Code: ec 28 48 89 54 24 18 48 89 74 24 10 89 7c 24 08 e8 09 d6 f8 ff 48 8b 54 24 18 48 8b 74 24 10 41 89 c0 8b 7c 24 08 31 c0 0f 05 <48> 3d 00 f0 ff ff 77 34 44 89 c7 48 89 44 24 08 e8 5f d6 f8 ff 48
Jul 27 21:04:09 home kernel: RSP: 002b:00007fec0b1fa5a0 EFLAGS: 00000246 ORIG_RAX: 0000000000000000
Jul 27 21:04:09 home kernel: RAX: ffffffffffffffda RBX: 00007febfc20a280 RCX: 00007fec0d5c60bc
Jul 27 21:04:09 home kernel: RDX: 0000000000001000 RSI: 00007fec0b1fa5e0 RDI: 0000000000000011
Jul 27 21:04:09 home kernel: RBP: 00007febfc1c2fc0 R08: 0000000000000000 R09: 00007febfc1ff990
Jul 27 21:04:09 home kernel: R10: 0000000000000000 R11: 0000000000000246 R12: 0000000000000011
Jul 27 21:04:09 home kernel: R13: 00007febfc21abe0 R14: 0000000000001000 R15: 00007fec0b1fa5e0
Jul 27 21:04:09 home kernel:  </TASK>
Jul 27 21:04:09 home kernel: watchdog: BUG: soft lockup - CPU#1 stuck for 23s! [InputThread:1010]


 
Je vais faire plus de tests, mais en refaisant une install' "bidon" sur un vieux disque histoire de ne rien casser (même si ext4 semble solide). Aussi je ferais une install' sans cryptage du disque, car il n'est pas impossible qu'il y ait un lien. Pour l'instant je suis perdu (et franchement agacé :o ).


---------------
matos à vendre
n°1485554
burn2
ça rox du poney
Posté le 28-07-2023 à 07:49:07  profilanswer
 

Je suis en lvm chiffré, ras.
Y a forcément une panne matérielle chez toi.
Fait une install à l'arrache sur une clef usb pour voir?


---------------
"C'est vrai qu'un type aussi pénible de jour on serait en droit d'espérer qu'il fasse un break de nuit mais bon …"
n°1485556
thana54
made in concept
Posté le 28-07-2023 à 10:19:06  profilanswer
 

Qu'est-ce qui reste commun avec ton ancienne machine ?
mobale ?
alim ?
 
Le même disque fonctionne-t-il bien sur une autre machine ?

n°1485563
rat de com​bat
attention rongeur méchant!
Posté le 28-07-2023 à 16:28:04  profilanswer
 

burn2 a écrit :

Fait une install à l'arrache sur une clef usb pour voir?

Bonne idée, plus rapide qu'un vieux HDD et pas besoin de démonter. :jap:  

thana54 a écrit :

Qu'est-ce qui reste commun avec ton ancienne machine ?
mobale ?
alim ?
 
Le même disque fonctionne-t-il bien sur une autre machine ?

Oui, carte mère et alim (pas les réfs en tête mais je vérifierais si besoin). Je pourrais mettre le SSD dans un vieux ordi portable pour tester tiens, mais vu qu'il est tout neuf et que j'avais le même soucis avec l'ancien SSD (Samsung 860 de mémoire) sous Debian 11... Par contre si ça fonctionne depuis clé USB je vais changer ce câble SATA, ne sait-on jamais.
 
Je vous tiens au courant, mais pas sûr que j'aurais le temps ce soir.


---------------
matos à vendre
n°1485578
rat de com​bat
attention rongeur méchant!
Posté le 29-07-2023 à 19:32:42  profilanswer
 

J'ai trouvé!!! (enfin je crois/j'espère :o )

 

En bref: C'est pas une faute matérielle, à priori c'est amdgpu.

 

En long: J'ai testé avec une install "bidon" (EDIT: de 12.1) sur clé USB, toujours le même problème: Quand on lance une recherche avec Pcmanfm en tant que root sur "/" ça freeze au bout de quelque (dizaines de) secondes.

 

Et après plusieurs heures de débuggage j'ai trouvé pourquoi et ça va dans le sens de ma supposition initiale. En fait Pcmanfm cherche vraiment partout, y compris dans /sys/ et là-dedans bah y'a des "fichiers" de chez amdgpu qu'il ne faut pas toucher. :o Quand on y touche avec un simple cat ça peut faire des choses étranges ou pas selon le "fichier" (du genre écran noir et logout automatique) et quand on essaye de lire avec dd freeze direct. Les "fichiers" en question sont - PAS TOUCHE SINON FREEZE! - /sys/kernel/debug/dri/0/amdgpu_regs*. Autrement dit - ATTENTION FREEZE! - un simple sudo dd if=/sys/kernel/debug/dri/0/amdgpu_regs of=/dev/null et c'est mort direct.

 

Maintenant, à qui la faute? A mon avis clairement il y a un bug dans amdgpu, LIRE un "fichier" spécial ne devrait pas provoquer de freeze total (écrire possiblement oui si on écrit les mauvaises valeurs), il doit y avoir un soucis quelque part ici. Par contre je pense que Pcmanfm devrait ignorer /sys/ même si on recherche partout - ou pas? D'un côté Linux fait ce qu'on lui demande, donc si je dis "fais moi une recherche récursive sur /" ça veut vraiment dire "partout", mais en même temps Thunar p.ex. ne semble chercher que dans les fichiers "réels" (donc pas de debugfs et Cie). A votre avis?

 

Bon, après tout ça n'explique pas tout les crash, notamment les histoires de kernel NULL-ptr, mais espérons...


Message édité par rat de combat le 29-07-2023 à 19:38:30

---------------
matos à vendre
n°1485581
thana54
made in concept
Posté le 29-07-2023 à 20:31:33  profilanswer
 

Même comportement avec un find dans un terminal ?

n°1485582
rat de com​bat
attention rongeur méchant!
Posté le 29-07-2023 à 20:39:25  profilanswer
 

Très bonne question. De mémoire j'avais testé et pas de soucis, du coup je pense à un truc: Peut-être Pcmanfm essaye de LIRE chaque fichier en ouvrant / cherchant dans un dossier, alors que find par défaut va juste regarder les noms des fichiers? Faudra que je regarde ça de près mais plus ce soir.


---------------
matos à vendre
mood
Publicité
Posté le   profilanswer
 


Aller à :
Ajouter une réponse
  FORUM HardWare.fr
  Linux et OS Alternatifs
  Hardware

  encore des crash/freeze Ryzen 5 4600G + Debian 11 - Pcmanfm/amdgpu?

 

Sujets relatifs
Cours Linux/Debian en Françaisproblème clavier sur HP pavilion et Debian 11
Désinstallation Agent de sauvegarde Netvault Bakboneinstall postfix sur debian
Debian 11 - apt-get update impossibleacceleration video hardware avec chrome sous ubuntu ou debian
Debian 10: Créer un certificat SSL autosigné avec Apache2[TNZ Tools] Gestion kernel pour Debian, Redhat & ARCH Linux (KRN)
Pb de connexion, après installation de gnome (Proxmox base debian)Alpine Linux : Utiliser des drivers videos Debian
Plus de sujets relatifs à : encore des crash/freeze Ryzen 5 4600G + Debian 11 - Pcmanfm/amdgpu?


Copyright © 1997-2022 Hardware.fr SARL (Signaler un contenu illicite / Données personnelles) / Groupe LDLC / Shop HFR