unarr/internal/agent
Deivid Soto f0c51c5d90 feat(daemon): telemetría de salud continua + heartbeat de sesiones copy
El watcher F3 posteaba UN snapshot de speed= al arrancar y moría: un encoder
sano en el minuto 1 que se ahoga en el minuto 20 (escena compleja, GPU robada
por otro proceso) era invisible para el triage de stalls del player, que
decidía con el dato de arranque.

- monitorSessionHealth: ticker 5s el resto de la sesión; re-postea al cambiar
  el bucket ok/marginal/struggling (con histéresis de 2 ticks — una EWMA
  bailando sobre 0.95 no puede webhookear cada 5s) o al derivar el ratio
  ≥0.15. Un POST fallido NO avanza el baseline: el tick siguiente reintenta
  (perder el único webhook de la transición a struggling cegaba al player
  justo en el caso que esto existe para cubrir).
- resetTranscodeStats() en restartFromSegment: el ffmpeg nuevo de un seek
  re-arma el warmup y resiembra la EWMA — sus frames fríos (speed=0.0x)
  hundían la media curada a <0.75 y el monitor habría posteado un
  "struggling" falso que pausaba el player en pleno seek. Verificado e2e:
  dos restarts (seek a 1200s) con health estable en ok.
- inputBound ventanado (30s) en vez de pegajoso: un blip de lectura
  transitorio ya no reclasifica como input_bound/struggling cada dip <0.95
  durante el resto de una sesión de horas.
- Heartbeat copy (F2): las sesiones -c:v copy postean una vez
  {ok, 1.0, "copy"} tras el ready — la web ya distingue "sesión copy" de
  "agente viejo sin telemetría" (ambos eran null). Segundo POST deliberado:
  un 400 de una web vieja (enum sin "copy") jamás debe bloquear el ready.
- Logs de fallo etiquetados por tipo de POST: un heartbeat fallido ya no se
  lee como "mark-ready failed" (el ready SÍ aterrizó).

Requiere web con session-ready/SSE actualizados (desplegar web primero;
contra web vieja todo degrada a best-effort con log).
2026-06-11 20:53:18 +02:00
..
active_tasks.go feat(agent): auto-resume interrupted downloads after a daemon restart 2026-05-31 22:44:05 +02:00
active_tasks_test.go feat(agent): auto-resume interrupted downloads after a daemon restart 2026-05-31 22:44:05 +02:00
client.go feat(daemon): telemetría de salud continua + heartbeat de sesiones copy 2026-06-11 20:53:18 +02:00
client_test.go feat(agent): add mirror failover, agent client refactor, status 401 detection 2026-05-15 16:26:43 +02:00
daemon.go Merge branch 'main' into feat/agent-tls-direct 2026-06-10 19:44:44 +02:00
disk.go feat(cli): add login command and refactor shared helpers 2026-04-01 12:20:51 +02:00
disk_test.go test(coverage): raise engine+agent coverage above 50% 2026-05-12 11:21:59 +02:00
disk_unix.go feat: initial commit — unarr CLI 2026-03-28 11:29:42 +01:00
disk_windows.go feat: initial commit — unarr CLI 2026-03-28 11:29:42 +01:00
docker.go feat(agent): report isDocker so the web shows a docker pull command 2026-06-03 18:09:29 +02:00
downlink_test.go feat(agent): hybrid SSE downlink with long-poll fallback 2026-06-01 17:31:42 +02:00
events_client.go feat(agent): hybrid SSE downlink with long-poll fallback 2026-06-01 17:31:42 +02:00
events_client_test.go feat(agent): hybrid SSE downlink with long-poll fallback 2026-06-01 17:31:42 +02:00
mirror_client.go feat(subtitles): subtitle-fetch jobs vía sync + auto-fetch opcional en scan 2026-06-10 14:48:35 +02:00
mirror_pool.go feat(agent): add mirror failover, agent client refactor, status 401 detection 2026-05-15 16:26:43 +02:00
mirror_transport.go feat(agent): give the public API client mirror failover 2026-06-01 15:53:00 +02:00
mirror_transport_test.go feat(agent): give the public API client mirror failover 2026-06-01 15:53:00 +02:00
process_unix.go feat: add clean command to remove temp files, logs, and cached data 2026-03-29 11:04:51 +02:00
process_unix_test.go test(coverage): raise engine+agent coverage above 50% 2026-05-12 11:21:59 +02:00
process_windows.go fix(build): unused variable in Windows process check 2026-03-30 13:11:55 +02:00
state.go refactor(sentry): decouple agent import via string-match, rename predicate 2026-05-27 17:03:26 +02:00
state_test.go fix(sentry): skip "daemon not running" stop/reload errors 2026-05-27 16:50:16 +02:00
sync.go Merge branch 'main' into feat/agent-tls-direct 2026-06-10 19:44:44 +02:00
sync_test.go test: add comprehensive test suite for engine, agent and cmd packages 2026-04-08 23:36:00 +02:00
taskstate.go feat(sync): replace WS+DO transport with unified HTTP sync 2026-04-08 18:50:59 +02:00
taskstate_test.go test(coverage): raise engine+agent coverage above 50% 2026-05-12 11:21:59 +02:00
types.go fix(stream): hallazgos de la revisión crítica del modo copy 2026-06-11 08:37:36 +02:00