搜索 - infras.cn

得物云原生全链路追踪Trace2.0-采集篇 - OSCHINA

开源的 Pinpoint，近几年 Uber 公司开源的 Jaeger，以及我们国内吴晟开源的 SkyWalking。有人说，这些其实都归功于 Google 在 2010 年基于其内部大规模分布式链路追踪系统 Dapper 实践而发表的论文，它的设计理念是一切分布式调用链追踪系统的始祖，但其实早在二十年前（2002年），当年世界上最大的电商平台 eBay 就已拥有了调用链追踪系统 CAL(Centralized Application Logging)。2011 年，原eBay的中国研发中心的资深架构师吴其敏跳槽至大众点评，并且深入吸收消化了 CAL 的设计思想，主导研发并开源了CAT(Centralized Application Tracking）。 CAT 作为国人主导的开源系统，其本...阅读全文

博文 2022-12-10 06:50:41 中文开源技术交流社区

阅读:237次评论:0条 0人喜欢

深度解密基于 eBPF 的 Kubernetes 问题排查全景图

Label、Namespace 等概念非常适合用来构建上下文信息。3、繁多监测系统，造成监测界面不一致复杂系统带来的一个严重副作用就是监测系统繁多。数据链路不关联、不统一，监测界面体验不一致。很多运维同学或许大多都有过这样的体验：定位问题时浏览器打开几十个窗口，在 Grafana、控制台、日志等各种工具之间来回切换，不仅非常耗时巨大，且大脑能处理的信息有限，问题定位效率低下。如果有统一的可观测性界面，数据和信息得到有效地组织，减少注意力分散和页面切换，来提高问题定位效率，把宝贵时间投入到业务逻辑的构建上去。二、解决思路与技术方案为了解决上述问题，我们需要使用一种支持多语言，多通信协议的技术，并在产品层面尽可能覆盖软件栈端到端的可观测性需求，通过调研，我们提出一种立足于容器界面和底层操作系统，向上关联...阅读全文

博文 2022-03-21 09:11:51 joseph

阅读:425次评论:0条 0人喜欢

USB 4规范正式公布：基于雷电3 Type

今年3月初，USB-IF官方组织宣布了下一代 USB4 (注意不是USB 4.0)。现在，USB4标准规范正式公布了！USB绝对是科技史上应用范围最广的接口，而最新的USB4 又是这一接口历史上最大的变革。 USB4引入了Intel此前捐献给USB推广组织的Thunderbolt雷电协议规范，双链路运行(Two-lane)，传输带宽因此又翻了一番，达到40Gbps，也就是和雷电3完全相同。当然，要获得这样的传输带宽，需要经过认证的全新数据线。在引入新的底层协议的同时，USB4仍然保持了良好的兼容性，可向下兼容USB 3.2/3.1/3.0、雷电3，也就是现在的USB、雷电3设备和数据线，仍然可以在USB4接口上使用。 USB4将只有USB Type-C一种接口形态(雷电3走的也是它...阅读全文

博文 2019-09-04 06:45:39 C接口带宽达40Gbps

阅读:354次评论:0条 0人喜欢

NVDIMM-P非易失内存标准公布：断电不丢数据、兼容DDR4

。－大容量：支持扩展的内存寻址功能。－支持即插即用：在电脑开机时可以直接插入标准的双列内存插槽，并立刻与同一总线上的DDR内存交互操作。 NVDIMM-P的主要特征：－与现有DDR通道完全兼容，包括物理接口、电气性能、协议、时钟。－保证为下一代CPU插槽增加的针脚尽可能少。－协议支持数据读取时的不确定延迟。－确保数据在非易失内存中的事务性操作。－从NAND到DRAM多种延迟模式的支持(在模块级别)。－内存本身具备高可靠性、链路错误保护功能。事实上，NVDIMM是一个系列标准，除了这里说的NVDIMM-P，还有NVDIMM-F、NVDIMM-N、NVDIMM-H。 NVDIMM-F本质上就是DDR接口的SSD固态盘，只使用NAND闪存，优点是延迟低(纳秒级别)、带宽高...阅读全文

博文 2021-02-19 07:53:21 快科技

阅读:373次评论:0条 3人喜欢

个人信息保护新规将出台消费者被短信轰炸将成为历史

，App开发运营者加强前端和后端安全防护、访问控制、技术加密、安全审计等工作，主动监测发现个人信息泄露等违规行为，及时响应处置要求。App开发运营者还要履行国家规定的其他个人信息保护义务。尽管《规定》尚未正式发布实施，但是主流平台企业已经用实际行动认可了各自的信息保护义务。 7月6日，阿里巴巴开放平台发布《依法加强消费者订单中敏感信息保护的公告》，称将启动订单处理链路的消费者敏感信息保护方案，对涉及消费者个人敏感信息采取加密、去标识化等安全技术措施。 7月9日，京东发布《JD用户订单隐私安全方案》，称为保障京东用户和商家数据信息安全，京东商家开放平台将对订单中手机号和座机号进行脱敏。 7月20日，抖音电商运营团队发布公告，为防止消费者隐私信息泄露，抖店将启动消费者隐私数据...阅读全文

主题 2021-07-26 09:22:08 joseph

阅读:513次评论:0条 0人喜欢

一位资深Java架构师的晋级心得

Spring Cloud：Eureka注册中心，Ribbon集成REST实现负载均衡，OpenFeign声明式服务调用，Hystrix实现服务限流熔断降级和数据监控，Zuul实现微服网关，Config分布式统一配置中心，分布式链路跟踪，集成Spring Cloud实现统一整合方案虚拟化容器Docker：Docker环境搭建和使用，搭建Docker私有仓库，Docker分布式集群部署，Kubernetes简介 4. 分布式 Java并发编程和网络编程：Java线程状态，线程池，线程通信，线程安全，Netty高性能原理分布式开发框架：分布式系统口调用技术：RPC，Apache分布式系统Zookeeper原理与应用，阿里Dubbo设计思想与应用分布式中间件：分布式服务器治理，分布式消息通信，分布式数据缓存...阅读全文

博文 2019-01-13 22:49:22 debian.cn

阅读:389次评论:0条 0人喜欢

RabbitMQ 高可用实现镜像队列

列中某个节点宕掉的后果：当slave宕掉了，除了与slave相连的客户端连接全部断开之外，没有其他影响。当master宕掉时，会有以下连锁反应：与master相连的客户端连接全部断开；选举最老的slave节点为master。若此时所有slave处于未同步状态，则未同步部分消息丢失；新的master节点requeue所有unack消息，在此我向大家推荐一个架构学习交流圈：830478757 帮助突破瓶颈提升思维能力,因为这个新节点无法区分这些unack消息是否已经到达客户端，亦或是ack消息丢失在老的master的链路上，亦或者是丢在master组播ack消息到所有slave的链路上。所以处于消息可靠性的考虑，requeue所有unack的消息。此时客户端可能有重复消息；如果客户端连着...阅读全文

博文 2018-12-30 19:21:59 debian.cn

阅读:334次评论:0条 0人喜欢

分布式运行时 Dapr 知多少

了答案。从单机到分布式，是追求更快和更高的性能，但也带来了更多的不确定性。比如，不确定计算机何时异常，不确定磁盘何时损坏，不确定网络通信的延迟，也不确定消息是否被正常消费。这些不确定性构成了分布式应用的挑战，简而言之：异构的机器与网络：稳定性问题普遍的节点故障：可靠性问题不可靠的网络：一致性问题面对这些挑战，业界提出了诸多的分布式理论、协议，如CAP定理，BASE理论，一致性协议2PC/3PC/ZAB，来保证系统的正常运行。虽然问题貌似是有了解决方案，但是应用的复杂度升高了。应用除了需要实现业务需求，还要兼顾非业务需求，集成诸如服务发现、负载均衡、失效转移、动态扩容、数据分片、调用链路监控等分布式系统的核心功能，对应用有很强的侵入性，这就是以Spring Cloud为代表的微服务框架的...阅读全文

博文 2021-03-09 10:39:05 diablo4

阅读:442次评论:0条 0人喜欢

字节跳动开源微服务中间件 CloudWeGo - OSCHINA

传输协议有 TTHeader、HTTP2。TTHeader 可以和 Thrift、Kitex Protobuf 结合使用；HTTP2 目前主要是结合 gRPC 协议使用，后续也会支持 Thrift。多消息类型：支持 PingPong、Oneway、双向 Streaming。其中 Oneway 目前只对 Thrift 协议支持，双向 Streaming 只对 gRPC 支持，后续会考虑支持 Thrift 的双向 Streaming。服务治理：支持服务注册/发现、负载均衡、熔断、限流、重试、监控、链路跟踪、日志、诊断等服务治理模块，大部分均已提供默认扩展，使用者可选择集成。代码生成工具：Kitex 内置代码生成工具，可支持生成 Thrift、Protobuf 以及脚手架代码...阅读全文

博文 2021-09-09 13:56:42 中文开源技术交流社区

阅读:444次评论:0条 0人喜欢

案例：Redis命令不当引起数据库雪崩造成数百万损失

库提供商，将那台Redis最近一周的命令全部调用出来，最后发现，在那个时间点运行了一条keys *...*命令。公司的一个工程师执行keys模糊的匹配命令是为了清理没用的键，但是没有考虑到keys *进行模糊匹配引发Redis锁，造成Redis锁住，CPU飙升，引起了所有调用链路的超时并且卡住，等Redis锁的那几秒结束，所有的请求流量全部请求到RDS数据库中，使数据库产生了雪崩，使数据库宕机。改进方案所有线上操作，全部要经过运维通过后方可执行，运维部门逐步快速收回各项权限新增Redis实例，进行分离如果有使用类似keys正则命令需求，使用scan命令代替总结该事件中出现的两次事故，完全是由于人为操作引起的，如果那位工程师，看过Redis的开发规范，会发现是建议禁用keys命令的...阅读全文

博文 2018-10-27 10:18:18 debian.cn

阅读:424次评论:0条 0人喜欢

Kafka生产问题总结以及性能优化

定要配置重试要根据业务情况而定。也可以用同步发送的模式去发消息，当然acks不能设置为0，这样也能保证消息发送的有序。 kafka保证全链路消息顺序消费，需要从发送端开始，将所有有序消息发送到同一个分区，然后用一个消费者去消费，但是这种性能比较低，可以在消费者端接收到消息后将需要保证顺序消费的几条消费发到内存队列(可以搞多个)，一个内存队列开启一个线程顺序处理消息。如果为了性能好，不允许所有消息只在同一个分区，同时又要保证顺序消费，那么可以给每条消息加一个下标，当消费者拿到消息后先不急着消费，而是先判断下标，然后根据下标以此进行消费； 2.1.4 消息积压 1）线上有时因为发送方发送消息速度过快，或者消费方处理消息过慢，可能会导致broker积压大量未消费消息。此种情况如果积压了上百万未...阅读全文

博文 2023-01-05 23:16:48 CSDN博客

阅读:396次评论:0条 0人喜欢

深入理解Golang之context

{} } func (c *valueCtx) Value(key interface{}) interface{} { if c.key == key { return c.val } return c.Context.Value(key) } valueCtx利用一个Context类型的变量来表示父节点context，所以当前context继承了父context的所有信息；valueCtx类型还携带一组键值对，也就是说这种context可以携带额外的信息。valueCtx实现了Value方法，用以在context链路上获取key对应的值，如果当前context上不存在需要的key,会沿着context链向上寻找key对应的值，直到根节点。WithValueWithValue用以向context添加键值对...阅读全文

博文 2021-01-27 09:05:27 知乎

阅读:522次评论:0条 0人喜欢

Apache Flink 1.14 新特性预览 - OSCHINA

作为社区 RoadMap 的重要组成部分，是大数据实时化必然的趋势。但是另一方面，传统离线的计算需求其实并不会被实时任务完全取代，而是会长期存在。在实时和离线的需求同时存在的状态下，以往的流批独立技术方案存在着一些痛点，比如：需要维护两套系统，相应的就需要两组开发人员，人力的投入成本很高；另外，两套数据链路处理相似内容带来维护的风险性和冗余；最重要的一点是，如果流批使用的不是同一套数据处理系统，引擎本身差异可能会存在数据口径不一致的问题，从而导致业务数据存在一定的误差。这种误差对于大数据分析会有比较大的影响。在这样的背景下，Flink 社区认定了实时离线一体化的技术路线是比较重要的技术趋势和方向。 Flink 在过去的几个版本中，在流批一体方面做了很多的工作。可以认为 Flink...阅读全文

博文 2021-09-05 07:26:58 中文开源技术交流社区

阅读:380次评论:0条 0人喜欢

最全的 DevOps 工具集合

人员都可以使用这款敏捷项目管理工具，围绕一个共享的，带有优先级的 backlog 进行实时协作。 Trello Trello 是基于 Web 的看板风格列表制作应用程序，是 Atlassian 的子应用。许多团队在规划各个 sprint 时都会用它。 Azure Boards 可以跟踪软件项目，并使用敏捷工具（包括 Scrum boards、看板 boards 和仪表板等）改进规划工作。同时，还有工具可以帮助你可视化工作、共享计划、跟踪进度，并确保你正在向目标迈进。问题跟踪问题跟踪阶段是为了提供客户响应能力，减少知识浪费，缩短反馈链路。目前业内比较常用的问题跟踪工具包括 Atlassian Jira、JetBrains YouTrack 和 ZenDesk。 Atlassian...阅读全文

博文 2021-05-26 14:35:21 博客园

阅读:676次评论:0条 0人喜欢

最新评论