HolmesGPT Not Finding Any Issues? Here's Why.¶

1. Truncation: Too Much Data¶

Data overflow causes important information to be truncated. See #437 for summarization improvements.

Solution:

HolmesGPT can't access logs, metrics, or traces from your observability stack.

Solution:

Verify toolset configuration connects to Prometheus/Grafana/logs
Test connectivity: kubectl exec -it <holmes-pod> -- curl http://prometheus:9090/api/v1/query?query=up

Service account lacks Kubernetes API permissions.

Error Example:

pods is forbidden: User "system:serviceaccount:default:holmesgpt" cannot get resource "pods"

Solution:

rbac:
  create: true
rbacRules:
  - apiGroups: [""]
    resources: ["pods", "services", "events", "nodes"]
    verbs: ["get", "list", "watch"]

Vague questions produce poor results.

Bad:

Good:

Older LLM models lack reasoning capability for complex problems.

Solution:

config:
  model: "gpt-4.1"  # or anthropic/claude-sonnet-4-20250514
  temperature: 0.1
  maxTokens: 2000

Recommended Models:

anthropic/claude-opus-4-1-20250805 - Most powerful for complex investigations (recommended)
anthropic/claude-sonnet-4-20250514 - Superior reasoning with faster performance
gpt-4.1 - Good balance of speed/capability

See benchmark results for detailed model performance comparisons.