别意外,Linux运维我真的不建议你从命令行学起! 最近,由于公司业务扩展,需要招聘很多运维人员,我面试了很多人,几天面试下来,也没招到几个人,但通过这几天的面试,我发现了一些共同点。 一部分面试者,虽然都有3-5年工作经验,但技术水平跟刚毕业的学生差... 系统教程# linux# 招聘# 能力 2年前130
一言不合就重构?监控系统这样演进才稳妥! 一、业务背景 当今时代处在信息大爆发的时代,信息借助互联网的潮流在全球自由的流动,产生了各式各样的平台系统和软件系统,越来越多的业务也会导致系统的复杂性。 当核心业务出现了问题影响用户体验,开发人员没... 系统教程# 业务# 开发人员# 服务端 2年前240
超实用的 Linux 高级命令,运维同仁一定要懂! 前言 在运维的坑里摸爬滚打好几年了,我还记得我刚开始的时候,我只会使用一些简单的命令,写脚本的时候,也是要多简单有多简单,所以有时候写出来的脚本又长又臭。 像一些高级点的命令,比如说 Xargs 命令... 系统教程# linux# xargs# 命令 2年前90
SREWorks前端低代码组件生态演进:monorepo架构重构和远程组件加载实践 作者:王威(地谦) 文章结构 项目背景 演进分析 monorepo架构演进 Webpack与Rollup 如何平滑迁移 构建优化 组件的可扩展与可插拔 演进总结 版本动态 项目背景 SREWorks是... 网站建设# javascript# 低代码# 前端 2年前1100
高复用性自动化脚本设计实践 作者:京东物流 刘红妍 导读:在自动化测试实践中,为了更好的契合被测业务场景,需要不断优化框架分层结构。本文结合产品模块化思路,意在介绍通过策略模式改造原本复杂分支语句代码,通过理论讲解、思路分析、方... 网站建设# Mcube# python# yyds干货盘点 2年前680
基于CI的服务端自动化设计与实践 在传统的开发模式下,开发、运维、物理机三者之间的关系是非常紧密的。当开发完成项目后,运维会负责把项目部署到一台物理机上,由这台物理机向外提供服务。,,由于服务和物理机关系紧密,导致服务非常依赖于物理机... 网站建设# docker# 操作系统# 服务 2年前250
虚拟化技术浅析之初识Kubernetes 单体架构:可以理解为主要业务逻辑模块(我们编写的代码模块,不包括独立的中间件)运行在一个进程中的应用,最典型的是运行在一个Tomcat容器中,位于一个进程里。单体架构好处是技术门槛低、编程工作量少、开... 网站建设# 单体# 应用# 架构 3年前750
一次棘手的容器故障,我终于知道SRE有多重要了…… 关于什么是SRE,以及在业务上有哪些具体的输出,网上资料众多但都只是对基本概念做描述。那容器SRE究竟要怎么结合业务,得物容器SRE又有哪些最佳实践,本文就得物容器SRE的一些事情向大家做介绍。,稳定... 网站建设# sre# 容器# 得物 3年前630
一条推特燃炸情绪:开发者并不想做运维! ,编译 | 云昭,软件开发的工作正在难以想象的速度变得越来越复杂。,从在服务器上的单体架构中构建应用程序,到将它们分解为多个微服务、打包到容器中、与 Kubernetes 编排并托管在分布式云环境中... 网站建设# devops# 吞噬# 正在 3年前620
Zadig和ChatOps能不能擦出火花 Zadig 是目前很火的云原生持续交付平台,具备灵活易用的高并发工作流、面向开发者的云原生环境、高效协同的测试管理、强大免运维的模板库、客观精确的效能洞察以 及云原生 IDE 插件等重要特性,为工程师... 网站建设# chatops# zadig# 原生 3年前380
得物容器SRE探索与实践 关于什么是SRE,以及在业务上有哪些具体的输出,网上资料众多但都只是对基本概念做描述。那容器SRE究竟要怎么结合业务,得物容器SRE又有哪些最佳实践,本文就得物容器SRE的一些事情向大家做介绍。,稳定... 网站建设# sre# 容器# 得物 3年前520
李阳:京东零售OLAP平台建设和场景实践 导读:今天和大家分享京东零售OLAP平台的建设和场景的实践,主要包括四大部分:,管控面可以提供高可靠高效可持续运维保障、快速部署小时交付的能力,尤其是针对ClickHouse这种运维较弱但是性能很高的... 网站建设# adminserver# olap# 架构设计 3年前340
“平台”潮起,DevOps或在过时 ,我们生活在被软件吞噬的世界,而在软件构建领域,几乎每年就会出现一波浪潮。今年,平台工程仿佛成为了一个“新贵”,Gartner 10月发布的2023年十大战略技术趋势中,平台工程就位列其中,它的目的在... 网站建设# devops# 工程# 平台 4年前430
聊一聊Ansible自动化运维架构 ,想了解更多关于开源的内容,请访问:,51CTO 开源基础软件社区,https://ost.51cto.com,ansible是一个自动化运维工具,基于Python开发,集合了... 网站建设# ansible# fedora# func 4年前360
微服务真的不挑数据库吗?如何选择? ,微服务架构的应用具有很好的扩展性,因此似乎微服务并不挑数据库,在微服务中使用哪种数据库问题都不是很大。事实真的如此吗?也许对于一些研发能力很强的队伍来说,为微服务选择数据库是很容易的事情,因为选择的... 网站建设# 应用# 数据库# 服务 4年前710
Kafka消息积压,你监控Rebalance了吗? 《Bug:Zabbix对Kafka topic积压数据监控》一文我们通过监控lag来对Kafka某个分区topic的消费情况进行告警。通过告警我们发现,分区topic的消费积压情况告警非常频繁,这无疑... 网站建设# kafka# rebalance# topic 4年前450
聊聊 Aiops 的最后一公里 因为疫情管控的问题,从去年下半年开始和客户的面对面交流就少了很多,做产品软件的,如果脱离了客户,那是要走弯路的。我们也是如此,原本D-SMART的产品定位是知识自动化,最初的设想是通过专家经验的梳理和... 网站建设# aiops# 客户# 用户 4年前360
平台运维团队面临的主要挑战是什么? 随着软件开发对各种技术日益依赖,无论是软件还是硬件都需要跟上技术发展,以实现相互配合,并提供可靠和安全的服务。然而,这种需求也会导致解决方案变得越来越复杂。因此,放眼全球,保障基础设施可靠性已成为交付... 网站建设# devops# sdlc# 团队 4年前280
好险!我差点重做整个K8S集群 没有遇到故障的运维不是合格的运维,没有处理故障的运维不是好运维。,做运维这么多年,每天依然提心吊胆,担心突发故障,打破生活节奏。,可是,人算不如天算,大部分故障都来源于近乎合理的操作,这次也是一样... 网站建设# 几百# 拷贝# 故障 4年前320
Spring Boot快速接入Prometheus监控 最近跟几个粉丝聊天吹水,说最近公司裁员严重,不仅裁掉了大部分的人,也裁掉了大部分的业务;之前公司有钱赚,什么产品都愿意做,无论行不行都会试一试,一堆没有什么流量的系统都在线上跑着,但是没有上级发话,一... 网站建设# 保证# 开发人员# 系统 4年前770
效率提升10倍,网易游戏面向终态的应用交付实践 林香鑫,网易游戏团队负责人。2014年加入网易游戏,目前任网易游戏技术中心平台服务组团队负责人、技术专家,长期负责运维开发方向的工作,当前主要负责 CMDB 和配置管理、流程引擎、交付平台、基础组件和... 网站建设# 交付# 应用# 游戏 4年前1140
后端程序员对于 Docker 要掌握多少才行?阿粉的答案是... ,阿粉的答案是会部署服务就行了。,关于 Docker 阿粉相信作为后端程序员小伙伴们多多少少都听过或者用过,而且很多时候也都是因为要使用的时候才会去学习,毕竟学了用不上还不如不学。,对于后端程序员来说... 网站建设# docker# 程序员# 运维 4年前200
糟了,线上服务出现OOM了 ,前一段时间,公司同事的一个线上服务OOM的问题,我觉得挺有意思的,在这里跟大家一起分享一下。,我当时其实也参与了一部分问题的定位。,他们有个mq消费者服务,在某一天下午,出现OOM了,导致服务直接挂... 网站建设# oom# 内存# 快照 4年前320