百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Loki日志全链路实战:从收集到告警的完整指南

off999 2025-04-06 20:04 78 浏览 0 评论

01为什么选择Loki ?

传统日志系统的痛点

  • 资源消耗高:ELK(Elasticsearch)需要为全文检索建立复杂索引,存储成本飙升,官方数据是通常可以将数据压缩20%~30%,实测下来在某些场景下可以达到50%,使用DEFLATE压缩算法,最低可以降低超过70%
  • 云原生适配差:Kubernetes动态环境下的日志标签管理困难

Loki的核心优势

  • 轻量级设计:仅索引元数据(标签),有近10倍的压缩比,5G数据输入存储实际增长0.5G。
  • 无缝集成:原生支持Prometheus生态,原生集成grafana,支持集群本身监控告警和日志监控告警。
  • 动态标签:完美适配Kubernetes Pod/Node等动态资源标签

02Loki架构解析

核心组件与数据流

Loki则采用了分布式架构,将日志数据存储在多个节点上,Promtail进行日志收集,可视化依赖于Grafana。

关键概念解析

03部 署

环境准备

  • 硬件建议:
  • 生产环境:至少3节点集群(每个节点4核8GB+)
  • 存储:优先选择SSD + S3兼容存储(MinIO)
  • 版本选择:
推荐使用v2.8+版本
helm repo add grafana https://grafana.github.io/helm-charts
helm repo update

Kubernetes集群部署

使用Helm部署Loki Stack(包含Promtail)
helm upgrade --install loki grafana/loki-stack \
  --set promtail.enabled=true \
  --set loki.persistence.enabled=true \
  --set loki.persistence.size=100Gi

Promtail配置示例

#promtail-config.yaml
server:
  http_listen_port: 9080

positions:
  filename: /tmp/positions.yaml

clients:
url: http://loki:3100/loki/api/v1/push

scrape_configs:
job_name: kubernetes
kubernetes_sd_configs:
role: pod
  pipeline_stages:
docker: {}
  relabel_configs:
source_labels: [__meta_kubernetes_pod_label_app]
  target_label: app

04告警集成

grafana告警规则配置

05性能优化与分析实践

存储优化技巧

loki-config.yaml 优化片段
schema_config:
  configs:
    - from: 2023-01-01
      store: boltdb-shipper
      object_store: s3
      schema: v11
      index:
        prefix: index_
        period: 24h

chunk_store_config:
  max_look_back_period: 720h # 日志保留30天

日志查询和分析

  1. 首先,指定 查询文件 filename="/usr/local/nginx/logs/loki-error.log"
  2. 然后,通过json的方式
  3. 最后,设置条件选择,比如status=500、server_name=test.com

查询加速策略

  1. 预过滤标签
#先通过精确标签缩小范围
{cluster="aws", pod=~"frontend-.+"} |= "timeout"
  1. 避免全文本扫描:优先使用|=(包含)而非|~(正则)

06真实场景案例

案例1:nginx5xx日志收集

重新编译nginx

#上传安装包
nginx-1.25.3.tar.gz、ngx_http_geoip2_module-3.4.tar.gz、libmaxminddb-1.9.1.tar.gz、GeoLite2-City.mmdb、GeoLite2-Country.mmdb

#nginx重新编译
./configure --prefix=/usr/local/nginx --with-compat --with-file-aio --with-threads --with-http_addition_module --with-http_auth_request_module --with-http_dav_module --with-http_flv_module --with-http_gunzip_module --with-http_gzip_static_module --with-http_mp4_module --with-http_random_index_module --with-http_realip_module --with-http_secure_link_module --with-http_slice_module --with-http_ssl_module --with-http_stub_status_module --with-http_sub_module --with-http_v2_module --with-mail --with-mail_ssl_module --with-stream --with-stream_realip_module --with-stream_ssl_module --with-stream_ssl_preread_module --with-cc-opt='-O2 -g -pipe -Wall -Wp,-D_FORTIFY_SOURCE=2 -fexceptions -fstack-protector-strong --param=ssp-buffer-size=4 -grecord-gcc-switches -m64 -mtune=generic -fPIC' --with-ld-opt='-Wl,-z,relro -Wl,-z,now -pie' --add-dynamic-module=/root/nginx/ngx_http_geoip2_module-3.4 

修改日志格式

load_module modules/ngx_http_geoip2_module.so;
#修改日志格式
  log_format json_analytics escape=json '{'
                    '"msec": "$msec", ' 
                    '"connection": "$connection", '
                    '"connection_requests": "$connection_requests", ' 
                    '"http_referer": "$http_referer", '
                    '"http_user_agent": "$http_user_agent", ' 
                    '"request_method": "$request_method", '
                    '"server_protocol": "$server_protocol", '
                    '"status": "$status", '
                    '"pipe": "$pipe", ' 
                    '"server_name": "$server_name", '
                    '"request_time": "$request_time", ' 
                    '"gzip_ratio": "$gzip_ratio", '
                    '"http_cf_ray": "$http_cf_ray",'
                    '"geoip_country_code": "$geoip2_data_country_code",'
                    '"geoip2_city_name_en": "$geoip2_city_name_en", '
                    '"geoip2_city_name_cn": "$geoip2_city_name_cn", '
                    '"geoip2_longitude": "$geoip2_longitude", '
                    '"geoip2_latitude": "$geoip2_latitude"'
                    '}';
    map $http_x_forwarded_for $real_ip {
        default "";
        "~^(?P\d+\.\d+\.\d+\.\d+)" $ip;
        "~^(?P\d+\.\d+\.\d+\.\d+),.*" $ip;
    }
#指定日志的位置,会放在nginx目录下
    map $status $log_path {
        ~^4       /logs/loki-error.log;
        ~^5       /logs/loki-error.log;
        default   /logs/access.log;
    }
    geoip2 /usr/local/nginx/modules/GeoLite2-Country.mmdb {
        auto_reload 5m;
        $geoip2_metadata_country_build metadata build_epoch;
        $geoip2_data_country_code source=$real_ip country iso_code;
        $geoip2_data_country_name country names zh-CN;
    }

    geoip2 /usr/local/nginx/modules/GeoLite2-City.mmdb {
         $geoip2_city_name_en source=$real_ip city names en;
         $geoip2_city_name_cn source=$real_ip city names zh-CN;
         $geoip2_longitude source=$real_ip location longitude ;
         $geoip2_latitude source=$real_ip location latitude ;
    }
    fastcgi_param COUNTRY_CODE $geoip2_data_country_code;
    fastcgi_param COUNTRY_NAME $geoip2_data_country_name;
    fastcgi_param CITY_NAME    $geoip2_city_name_cn;    check interval=3000 rise=2 fall=5 timeout=1000 type=tcp;
    check_http_send "HEAD /health/check/status HTTP/1.0\r\n\r\n";
    check_http_expect_alive http_2xx http_3xx;

配置promtail收集

cat << eof>> /data/promtail/config.yaml
server:
  http_listen_port: 9080
  grpc_listen_port: 0

positions:
  filename: /tmp/positions.yaml

clients:
url: http://192.168.119.191:3100/loki/api/v1/push

scrape_configs:
job_name: nginx
static_configs:
targets:
localhost
    labels:
    job: nginx
    host: $host
    agent: promtail
    path    : /usr/local/nginx/logs/loki-error.log
EOF

结合grafana呈现效果

案例2:数据库慢查询收集

配置promtail收集

cat config.yaml 
server:
  http_listen_port: 9080
  grpc_listen_port: 0
positions:
  filename: /tmp/positions.yaml
clients:
url: http://192.168.119.191:3100/loki/api/v1/push
scrape_configs:
    - job_name: mysql-slowlogs
      static_configs:
        - labels:
            instance: usa4-rds03-slave
            projectname: chat
            job: mysql
            __path__: /database/mysql/1266/mysql-slow.log
      pipeline_stages:
        - multiline:
              firstline: '#\sTime:.'
        - regex:
*              expression: '#\s*Time:\s*(?P.*)\n#\s*User@Host:\s*(?P[^\[]+).*@\s*(?P.*]).***Id:\s***(?P\d+)\n#\s*Query_time:\s*(?P\d+\.\d+)\s*Lock_time:\s*(?P\d+\.\d+)\s*Rows_sent:\s*(?P\d+)\s*Rows_examined:\s*(?P\d+)\n(?P(?s:.*))
- labels: timestamp: user: host: id: query_time: lock_time: rows_sent: rows_examined: query: - drop: expression: "^ *$" drop_counter_reason: "drop empty lines"

结合grafana呈现效果

07总 结


总体而言,Loki相对轻量级,具有较高的可扩展性和简化的存储架构,但需要额外的组件,Loki使用的是自己的查询语言LokiQL,有一定的学习曲线。若是数据量适中,数据属于时序类,如应用程序日志和基础设施指标,并且应用使用kubernetes Pod形式部署,则选择Loki比较合适。

Loki正在成为云原生时代日志管理的标准解决方案,其与以下技术的整合值得关注:

  • OpenTelemetry:统一日志、指标、追踪的采集标准
  • WAL(Write-Ahead Logging):提升高吞吐场景下的可靠性
  • 边缘计算:轻量级特性适合IoT设备日志收集


如有相关问题,请在文章后面给小编留言,小编安排作者第一时间和您联系,为您答疑解惑。

附录

参考文章:

https://www.ctyun.cn/developer/article/418138645577797

http://cloud.tencent.com/developer/article/2241079

相关推荐

怎么下载32位版本的qq(qq32位下载手机)

64位系统支持32位系统的软件,而32位系统不支持64位系统软件,现在大多数软件都是按32位开发环境开发的,像QQ这些,如果出64位将会增加成本。如有一天淘汰了32位系统,所有软件就是64位了除去后者...

声卡驱动在哪里打开win11(声卡驱动在那)

要更新Win11的声卡驱动,首先需要打开设备管理器,找到声音、视频和游戏控制器选项,右键点击需要更新的声卡驱动,选择“更新驱动程序”,然后选择“自动搜索更新的驱动程序”,系统会自动搜索并下载最新的驱动...

下载钉钉软件(下载钉钉软件有什么风险)

应用商店下载正版的。可以通过应用商城下载,这里面下载是自动安装的,也可以下载一个浏览器,然后在浏览器中输入钉钉,并点击搜索找到官方网站进行合适的资源下载步步高家教机可以下载安装钉钉下载钉钉要用手机号码...

windows10序列号查看(win10怎样查看序列号)

Win10快速查看序列号的方法:  1、使用电脑快捷键组合“WIN+R”,打开运行窗口。? 2、输入“regedit”,打开注册表编辑器。?  3、打开注册表,路径HKEY_LOCAL_MA...

怎么安装以前的显卡驱动(如何安装以前的显卡驱动)

首先需要找到显卡的型号,搜索该显卡的驱动历史版本,其次根据所需要的版本下载驱动程序并安装,安装后进入设备管理器查看驱动安装是否成功以及运行状态即可。在设备管理器找到显示适配器,右键选择属性;在驱动程序...

电脑在运行但是屏幕是黑的(电脑正常运行,显示屏黑屏怎么办)
电脑在运行但是屏幕是黑的(电脑正常运行,显示屏黑屏怎么办)

主机运行正常,而显示器黑屏,这很可能是三个原因:第一原因:就是显示器的电源插头脱落,没有电源输入,所以无法启动显示器,因些黑屏,建义重新拨插一下显示器的电源插头。第二个原因:有可能台式主机和显示器的连接视频线接触不良(特别是接口处没有插好或...

2026-01-07 08:51 off999

联想笔记本触摸板驱动下载官网

首先你要确保自己的电脑具备触屏的功能才可以使用,不然是没法使用的。如果是失效的话那就要改善使用系统,首先需要干净启动。然后需要关闭或者开启你电脑的“快速启动”。将系统停止或者开启“windowsfo...

win10开机有画面进系统黑屏(windows10一开机就黑屏)

步骤如下:1出现黑屏情况要区分,初次安装系统,或更新系统之后,会不能立马进入系统,属正常现象,等一段时间就好了。这里主要说的登录屏幕黑屏之后,其他应用程序都能使用的情况。2只有符合上述情况,可按Ctr...

笔记本买酷睿的还是锐龙(笔记本cpu锐龙的好还是酷睿的好)

锐龙本的第一个优点是价格便宜,而且便宜力度是会让人心动的那种,在后面推荐的锐龙本中你就能感受到;第二个优点是R5-2500U内置的Vega8显卡要比UHD630强,虽然与独显MX150有差距,但比没...

怎么看笔记本配置好不好(怎样看笔记本的配置好坏)
  • 怎么看笔记本配置好不好(怎样看笔记本的配置好坏)
  • 怎么看笔记本配置好不好(怎样看笔记本的配置好坏)
  • 怎么看笔记本配置好不好(怎样看笔记本的配置好坏)
  • 怎么看笔记本配置好不好(怎样看笔记本的配置好坏)
windows10重置密码(windows10重置密码向导怎么弄)

要使用Windows10重置密码向导来更改登录密码,首先需要在登录页面选择“忘记密码”选项。接着会出现向导页面,需要输入该用户的Microsoft账户用户名和相关信息以进行验证。然后可选择通过手机或电...

acer台式电脑(acer台式电脑主机开机步骤)

acer是宏碁旗下的一款电脑产品。宏碁成立于1976年,是一个国际化的自有品牌公司,主要从事于智能手机、平板电脑、个人电脑、显示产品与服务器的研发、设计、行销、销售及服务,也结合物联网积极发展云端技术...

电脑怎么添加字体(电脑怎么添加字体到ps)

要在电脑上增加字体,可以按照以下步骤进行操作:1.在互联网上找到并下载所需的字体文件。通常字体文件的格式为.ttf(TrueType字体)或.otf(开放字体)。2.打开下载完成的字体文件,然后点...

win7杀毒软件排行(win7最适合的杀毒软件)

360杀毒软件和安全卫士Windows7有自带的杀毒软件,叫做WindowsDefender。WindowsDefender是Microsoft开发的、提供给Windows7以上版本的Wi...

戴尔2025新款笔记本(戴尔2025年新款笔记本)

灵越16plus 定位是全能本,拥有游戏本的性能,外观重量接近轻薄本,散热好,满足主流设计软件使用,玩中小型游戏无压力,还有硬件防蓝光屏幕保护眼睛~成就5320性能颜值在线,日常办公使用...

取消回复欢迎 发表评论: