Метрики хостов
Метрики хостов заранее настроены в StatsHouse:
- их можно просматривать на отдельных графиках (названия метрик начинаются с
host_
), - их можно посмотреть на дашборде Hardware info.
Узнайте, как использовать теги для метрик хостов.
Реализацию этих метрик можно найти на GitHub. Полный список приведён в таблице ниже.
Описания скопированы из кода на GitHub. Мы позже дополним их, в том числе описаниями тегов.
# | Metric name | Description |
---|---|---|
1 | host_cpu_usage | The number of seconds the CPU has spent performing different kinds of work |
2 | host_softirq | Total number of software interrupts in the system |
3 | host_irq | Total number of interrupts in the system |
4 | host_context_switch | Total number of context switch in the system |
5 | host_mem_usage | Amount of free and used memory in the system |
6 | host_mem_writeback | Writeback/Dirty memory |
7 | host_block_io_time | The amount of time to transfer data to and from disk. Count - number of operations, Value - wait time for handle operations |
8 | host_block_io_size | The amount of data transferred to and from disk. Count - number of operations, Value - size |
9 | host_disk_usage | Disk space utilization |
10 | host_inode_usage | The number of free and used inodes in a filesystem |
11 | host_system_uptime | The amount of time the system has been running |
12 | host_system_process_created | Number of processes and threads created |
13 | host_system_process_status | Number of processes currently blocked, waiting IO or running on CPUs |
14 | host_system_psi_cpu | PSI for CPU (some, full) |
15 | host_system_psi_mem | PSI for memory |
16 | host_system_psi_io | PSI for IO |
17 | host_net_packet | Number of transferred packets grouped by protocol |
18 | host_net_error | Number of network errors |
19 | host_net_bandwidth" // total | Total bandwidth of all physical network interfaces. Count - number of packets, Value - number of bytes |
20 | host_net_dev_bandwidth | Total bandwidth of all physical network interfaces. Count - number of packets, Value - number of bytes |
21 | host_net_dev_error | Count of receive/transmit errors |
22 | host_net_dev_drop | Count of packets dropped while receiving/transmitting |
23 | host_socket_memory | The amount of memory used by TCP sockets in all states |
24 | host_tcp_socket_status | The number of TCP socket grouped by state |
25 | host_tcp_socket_memory | The amount of memory used by sockets |
26 | host_socket_used | The number of socket in inuse state grouped by protocol |
27 | host_page_fault | The number of page fault |
28 | host_paged_memory | The amount of memory paged from/to disk |
29 | host_oom_kill | The number of OOM |
30 | host_numa_events | NUMA events |
31 | host_dmesg_events | dmesg events |
32 | host_oom_kill_detailed | The number of killed OOM processes (tagged by process) |
Как использовать теги для метрик хостов
Чтобы настроить значения тегов для метрик хостов, используйте дополнительный параметр --env-file-path
при запуске агента.
По умолчанию используется файл /etc/statshouse_env.yml
.
Вы можете указать свой YAML-файл в параметре командной строки:
--env-file-path my_env.yml
В этом файле укажите значения для стандартных тегов, используемых в метриках хостов.
Чтобы пользоваться тегами было удобнее, договоритесь с командами в вашей организации,
какие значения тегов допустимы.
Например, все должны использовать значение production
, а не prod
, Production
и т. д.