故障管理三部曲

背景 在任何一个生产产品的行业,不管是互联网行业,还是建筑行业,或者是医疗行业,都得面对一个事物,那就是故障; 故障处理的好,那只是一个故障;故障处理的不好,就有可能升级成不同级别的事故; 出现事故,这是任何人都不想看见的; 如何避免事故,是安全生产的头等大事; 在这里,我会介绍 »

PAG在Web动画的应用实践

一、为什么要使用PAG动画 一般的Web端动画的实现都是通过transition、animation等CSS属性来实现,在大多数场景下这种方式都能满足,当随着动画复杂度的提升,就需要耗费大量的时间来编写相当多的代码来实现更加精细的动画,甚至于还要花费大量的时间来同设计师以及产品 »

linux服务端使用clash来做访问加速

一、背景 在linux服务器上访问海外http站点,可能会很慢: linux下安装软件包,用到海外源,这时下载有可能会很慢; 服务端访问第三方海外接口慢,比如苹果支付; jenkins打包时,需要下载maven海外源依赖; 本文仅做技术交流,clash服务端请使用合规加速服务。 »

生产EMR集群高可用升级

1、背景 在业务发展初期,数据量较少,统计需求也较少。基于成本考虑,EMR集群规模为1个master主节点+3个核心节点。 主节点负责管理集群,它通过运行软件组件来协调在其它节点之间分配数据和任务的过程以便进行处理。主节点跟踪任务的状态并监控集群的运行状况。 核心节点具有运行任务 »

k8s故障排查之主机资源不足-磁盘篇

前言 前面有讲过因为主机内存资源不足导致主机及pod均NotReady的状态,今天分享一个因为主机磁盘资源不足导致pod Evicted的故障。 故障现象 收到告警,有大量pod处于Evicted状态。 故障排查 查看告警后发现有问题的pod,均是调度到了同一台主机后出现的Evi »

生产HDFS进入安全模式故障处理

1、问题现象 hdfs 其中一个datanode宕机后,在此datanode上的block损坏,导致hdfs进入安全模式。 在hdfs的首页可以当前safe mode是on开启的状态。表明当前HDFS已经进入安全模式。 2、什么是安全模式 Hdfs 的安全模式,即 HDFS s »

K8S故障排查之主机NotReady

故障现象 收到告警,有主机处于NotReady状态,并且该主机的cpu使用率,内存使用率,负载都很高。 故障排查 登陆容器,查看node状态,发现主机处于NotReady状态。 查看主机内的容器状态,发现部分pod处于“删除中”状态,部分pod处于“重启”状态。 登陆华为云,查看 »

微鲤实时数仓建设方案及整体规划

一、实时数仓建设背景 1. 实时需求日趋迫切 目前公司的产品需求和内部决策对于数据实时性的要求越来越迫切,需要实时数仓的能力来赋能。传统离线数仓的数据时效性是 T+1,调度频率以天为单位,无法支撑实时场景的数据需求。即使能将调度频率设置成小时,也只能解决部分时效性要求不高 »

怎样以最小的时间成本实现iOS项目的文案国际化----支持OC和Swift项目

前景: 最近经历了TuTu和Yaame 的开发之后,发现国际化过程占用了大量的时间成本。国际化过程工作量大,没有什么技术含量。 思考 能不能通过脚本来实现iOS项目的文案国际化的流程呢?把从获取项目内的文案,到翻译,再到更新到本地的Local文件内,最后修改项目内的代码。 方案 »