云原生一体化运维助力百丽国际夯实数字化基石

EASYOPS_youwei · · 1215 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

 

 

百丽国际是一家大型时尚及运动产业集团,业务涵盖鞋类、运动和服饰三大业务,旗下拥有BELLE、STACCATO、TATA等十多个鞋履品牌,服饰业务经营initial、MOUSSY、SLY等服饰品牌,是十余个全球知名运动品牌的在华关键零售伙伴。

01 建设:数字化转型路径

2017年启动全面数字化转型以来,百丽国际基于强大的零售网络和敏捷的供应链能力,以大数据赋能产业链,融合线上线下全渠道,来开展数字化业务。伴随着百丽业务的高速发展,一方面带来业务系统和基础资源不断增加,另外一方面IT新技术/新架构等不断引入到生产环境中,如云原生、数据湖等。业务系统的复杂程度与日俱增,对业务的敏捷度要求越来越高,同时对企业的IT运维能力也提出了更高的要求。

为了保障业务系统连续性和IT系统的可用性,百丽国际为运维服务设计了自身的价值定位:质量、成本、效率和安全。立足价值定位,为了给消费者提供便捷和全时在线的数字化服务,百丽国际急需一个面向运维的能力底座,从0到1构建百丽国际云原生一体化IT运维平台。

 

百丽国际经过充分的调研,于去年12月份选择优维作为合作伙伴,携手优维启动云原生一体化运维平台建设,共同构建敏捷、高效、安全的运维底座,从而更好地为推动集团数字化转型保驾护航。

02 深化:研发创新精益之道

传统运维一般都是根据“监管控”的思路来建设,系统建设完成之后,很多场景还是依赖人工进行,比如说故障定位、变更服务切换。但今天百丽国际的IT环境越来越云原生化,IT架构复杂,迭代频繁,规模不断扩大,运维要从过去的被动响应式运维走向主动控制型运维。

 

在搭建一体化运维平台之前,百丽国际在IT运维上存在诸多痛点:

  • 运维管理:对元数据缺乏流程管控和集中化管理、缺乏IT资源全生命周期管控,对运维变更等日常运维工作缺乏统一、标准、可追溯性的管理;
  • 运维监测:缺乏对应用层和基础设施层统一的监控,对告警事件的处理未能进行平台级的跟进,并且告警对业务的关联影响分析能力不足;缺乏主动服务可观测手段;缺乏统一的监控数据看板;缺乏端到端故障定位能力;
  • 自动化:运维作业和变更依赖脚本或手工执行,费时、质量不可控;重大故障,应急能力偏弱;
  • 流程制度:缺乏对运维工作管理的条款规定,需要完善运维管理流程和管理规范,从而提升运维自动化能力。

百丽国际的数字化转型是全面的,包括业务、IT和组织。为了加快推动集团数字化转型,全面保障业务连续性和应用系统的可用性,助力百丽国际更好地服务每一个客户。优维从百丽国际的核心痛点出发,面向百丽国际各类IT角色和场景,全面支撑百丽的场景建设需要,构建统一云原生IT运维平台,涵盖了DevOps、混合云管理、数据库工单、面向应用的资源图谱、IT服务工作流管理、可观测监控、自动化及RPA、IT可视化等八个业务能力,实现了对多态IT运维工作的全面统一管理。

 

在此基础上,结合低代码平台,实现多个功能模块的场景融合,对百丽国际个性化场景深度覆盖。业务平台落地的同时,同步梳理了运维管理现状,完善运维管理流程和管理规范,让运维工作实现了标准化、规范化和自动化。

03 成就:持续赋能数字未来

通过建设云原生一体化IT运维平台,百丽国际的IT运维管理至今已累计梳理了几千台物理机及上万台虚拟机规模,有效提升资源使用效率和节约资源成本投入,完成集团数百个系统,数百多个工程的梳理和接入,实现了应用层、IaaS层、PaaS层以及组织结构等多平台间互通互联,充分发挥一体化运维管理平台强大的增效增益效果,使日常运维工作更加标准化、规范化,在IT工作管理上逐步实现了合规性、统一性的管理。

Devops

DevOps平台建立后,为百丽国际提供统一集中的制品管理、环境管理、配置管理、数据管理、发布与部署管理等能力;发布管理由脚本发布到DevOps流程自动化的升级,支持蓝绿部署、灰度发布、定时无人值守升级等;完成应用发布与部署规范的制定与落地,包括应用服务化改造规范、制品、数据库、配置管理等等;同时对百丽国际数百个系统,数百个工程发布现状进行梳理与接入,拉通研发、测试、运维、安全打破信息壁垒提升整体效能,实现研发安全运维一体化建设。

 

混合云管理

通过搭建云管平台,将本地数据中心和公有云统一管理,增强灵活性、降低成本、最大化整合现有资产、提高安全性和促进业务创新。

数据库管理

数据库管理平台是面向数据库变更工单的统一管理平台,提供数据库的监控、切换、数据备份等日常管理动作,完成对百丽国际生产环境数百个数据库实例对接,使数据库的变更更合规化、标准化及可审计。

面向应用的资源图谱

面向应用的资源图谱平台作为运维的基石,为百丽国际的智能运维体系建设做出了不可或缺的贡献,通过把应用资源、IaaS资源、PaaS资源以及组织结构人员统一梳理纳管进cmdb,统一管理资源及业务信息,使其成为IT部门的数据集权中心,为各部门各岗位在日常的工作中提供准确、统一的数据。基于cmdb的基础之上,搭建了devops、混合云管理平台、数据库工单平台、运维流程ITSM、监控、自动化的场景。给运维全流程自动化、智能监控和运营分析等平台提供全信息的支撑,是IT与服务的生命周期管理的基础。

ITSM管理流程

ITSM管理流程是面向运维工作流程的管理,使日常运维工作通过流程能更合规化、标准化、并且有迹可循。结合百丽国际IT组织、系统及人员特点,规划设计一套新的IT服务体系。同时结合行业ITf服务管理规范,梳理数十个IT服务流程,如发布、服务台、变更等,并完成现有工作流管理平台数十条流程的整合;ITSM移动化,H5页面对接到百丽钉钉轻应用,服务随时随地。

可观测监控

监控平台,是面向应用层的监控,类似一种路径染色机制,能从用户访问业务的视角,把请求在数据中心系统内的每一次访问都染色下来,最终互相关联。这大大提升了故障定位能力水平,能全景透视IT架构故障。甚至可以达到分钟级发现故障和定位故障。

通过落地可观测监控平台,完成百丽国际所有环境的IT资源监控采集(私有云、公有云、物理机、交换机、路由器、防火墙等),按实际需求设置监控指标、告警策略、监控视图,实现应用层服务全链路追踪监控,完成服务链路数千条。基于API服务链路,进一步提炼业务链路,覆盖核心业务链路数百个,确保关键业务可监控。告警通知对接百丽国际钉钉应用、短信、邮件、企业微信、电话等;结合AI算法,实现动态阈值,异常检测等应用;

发布期间支持通过脚本的方式屏蔽告警。

自动化&RPA

自动化运维及RPA平台,把日常人工重复操作的事项变成自动化执行,大大节约了人力和时间成本,并且能减少人工操作带来的失误。对于传统IT闭源应用,采用RPA的方案实现自动化作业;平台全面对接百丽国际单点登录SSO,确保自动化操作可审计可追踪。

IT能力可视化

IT架构可视化平台,从业务层架构、应用架构到底层基础设施架构全面可视化,让IT人员可以掌握IT架构的宏微观信息。依赖可视化架构呈现,再结合监控&可观测数据能力,实现事件&告警信息的可视化;依赖可视化架构信息,实现事件关联和故障根因分析等。

以上,通过对多态IT运维平台的全面统一管理,让运维能力成为百丽国际数字化转型的一个强有力底座,支撑其业务持续稳态发展。

百丽国际云原生一体化运维平台建设项目的成功落地,带来运维技术、管理流程、人员技能的转变,有效降低百丽国际IT基础设施成本和运维复杂度,提高系统可用性,保障业务连续性。同时,自动化灾备切换带来的自动化效率和安全规范提升,让开发者可以专注于业务能力建设,提高业务SLA标准,实现大规模集群管理和业务快速部署,推动科技走向终端消费场景,助力百丽国际实现业务创新。

 

 

值得一提的是,百丽国际携手优维合作的“数字化转型底座之一体化云原生运维平台建设项目”荣获“2022中国国际服务贸易交易会-企业数字化转型论坛”优秀案例,这不仅是对百丽国际在零售领域成功实现数字化落地,树立企业标杆效应的肯定,为行业和诸多企业的数字化转型提供了参考和借鉴,同时也展现了优维的创新产品成果和IT 运维全栈技术和服务能力。


有疑问加站长微信联系(非本文作者)

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

1215 次点击  
加入收藏 微博
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传