InfraPub 为您找到相关结果 2

监控告警Keep

Keep是一款功能强大的开源告警管理和AIOps平台,它专注于帮助开发和运维团队更高效地处理告警问题。该平台提供了集中式的仪表板界面,支持与Prometheus、Grafana、Datadog、Slack等主流监控工具和通信平台的双向集成。 平台的一大特色是支持通过YAML文件声明式地定义工作流,用户可以轻松配置告警的触发条件、处理步骤和响应动作,实现告警处理的自动化。同时,Keep采用API优先的设计理念,开发者可以直接通过代码管理工作流,便于与现有系统无缝集成。 值得一提的是,Keep正在积极开发AI关联和AI摘要等智能化功能,未来将进一步提升告警处理的智能化水平,帮助团队更好地降低告警噪音,提升运维效率。这些特性使Keep成为一个极具前景的开源运维工具。...阅读全文

开源项目 2024-12-09 09:31:00

得物云原生全链路追踪Trace2.0-采集篇 - OSCHINA

我们进行了基于 OpenTelemetry 体系的第三阶段的演进。功能,产品层面均取得了优异的结果。如今,我们即将进行下一阶段的演进,深度结合调用链与相关诊断工具,以第三阶段为基础,让得物全链路追踪技术正式迈入性能分析诊断时代。 六、 关于我们 得物监控团队提供一站式的可观测性平台,负责链路追踪、时序数据库、日志系统,包括自定义大盘、应用大盘、业务监控、智能告警、AIOPS等排障分析。 参考文章: Dapper, a Large-Scale Distributed Systems Tracing Infrastructure https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36356.pdf 大众点评开...阅读全文

博文 2022-12-10 06:50:41 中文开源技术交流社区