• 政企解决方案 | 携手一线城市政企,打造可观测性国产化政务平台


    政策背景
     

    国民经济的快速发展,带动创新技术的浪潮奔涌向前,大数据、人工智能等新兴技术在这个过程中间也在不断地反哺经济。由中央网络安全和信息化委员会印发《“十四五”国家信息化规划》,其中指出要推进数字政府建设,加快转变政府职能。具体包括要构建统一的国家电子政务网络体系,推动地方、部门各类政务专网向统一电子政务网络整合。

    该市积极响应国家政策,目标是逐步建成数字孪生城市,让城市能感知、会思考、可进化、有温度,赋能城市数字化加速转型,数字政府、数字经济、数字社会、和数字生态实现协同高质量发展,率先建成数字政府引领城市、率先建成数字底座标杆城市。

    到2025年,打造国际新型智慧城市标杆和“数字中国”城市典范,成为全球数字先锋城市。实现政务运行“一网协同”基本形成,各级党政机关数字化转型取得显著成效。移动协同办公系统在党政机关使用覆盖率达100%,实现各级、各部门协同管理更加顺畅高效。

    政企IT运维现状

    作为国内一线超大型城市的政务企业,承担着当地智慧城市建设的重要任务。在5G、人工智能、大数据等高新技术领域深耕布局的同时,对于智能运维的需求亦日益增加。

    与金融等行业的客户不同,该政企日常业务涉及市委、市府、市人大、市政协、市局委办等,预估日志日增量10T,数据来源多且复杂分散。作为在信息化领域建设起步的先行者,政企行业早期的IT规划中多以基础建设为主要目标,对于运维的精力投入不多,导致运维体系没有形成闭环。不同局委办规划建设自成一脉,引入了大量不同的国内外工具,包括监控、日志、数据库等,数据冗余复杂,数据资源分散,数据孤岛普遍存在。

    又由于政企系统业务的特殊性,在场景保障、自主可控等方面的要求也比较特别,亟需实现运维平台的本土化,实现国产化IT技术栈的可监、可管、可控,建立信创适配的一体化智能运维平台,是提高IT运维效率和质量的当务之急。

     

    另外,随着云原生技术的不断发展,多活数据中心、云上云下统管、多云异构环境也成为政企数字化转型必经之路。敏稳双态的共存情况下,既要保证新设备的接入正常也要统纳旧设备一起管理,使得运维难度再次增大。

    客户运维痛点

    1. 监控指标和日志覆盖不全

    监控指标覆盖不全,易出现误报、漏报。日志种类分散、且采集不全,故障排查及分析时,没有相应的数据支撑。须建设统一指标和日志采集能力,为发现问题提供运维数据资源。

    2. 业务异常时,没有有效分析工具支撑

    缺少统一监控工具及告警能力;没有对业务应用服务进程监控;没有对应用链路视图可视化监控,整个运维过程处于被动、黑盒状态。亦缺少对事前的故障预测、事中的实时异常检测、事后的故障定位和根因分析等手段。须建设事前、事中、事后等具有分析能力的工具平台。

    3. 现有业务日志、指标数据未有效利用

    缺少业务指标与基础资源指标的关联分析能力,业务运行数据、监控数据、管理数据未有效建模关联;缺失日志突增突降的异常检测分析能力;缺失基于单条工单的日志链路分析能力。基于数据采集能力的基础上,还须进行数据相关性模型的建设。故障发生时能够快速的关联出相关性异常点。

    4. 被动运维,缺少容量资源趋势预测能力

    如操作系统磁盘空间、数据库表空间等指标被动扩容,没有趋势预测能力,当出现空间不足时,运维仓促应对,会影响业务稳定性。

    5. 依赖厂商代运维,运维经验无法沉淀

    协同办公平台依赖厂商代维,业务异常时甲方客户无法界定根因,同时重复、相似故障经验依赖于运维个人能力,经验知识无法沉淀。

    解决方案

    针对政企现状,数据需进行统一纳管、集中治理。

     

    然后可以循序渐进地进行智能场景和可观测运维的构建。

    政企一体化协同办公项目 智能运维运营平台架构

    1. 数据采集

    通过采集补全监控、日志等数据、统一纳管使用中的各类信创软件和OA平台

    2. 数据治理

    将数据进行分类、规范、存储、建模,在原先分散的数据孤岛之间建立关联。

    3. 构建智能场景

    在数据治理的基础上,构建统一监控、异常检测、根因分析、集中告警等智能运维场景。

    4. 构建可观测性运维能力

    如业务全景健康度视图,运维人员可直观快速判断业务健康情况;业务应用拓扑状态视图,运维人员实时了解应用与基础架构上的指标状态及其关联性。

    5. 构建可视化决策中心

    便于业务领导能实时洞察业务运营状态,辅助领导决策;以及构建可视化业务运营安全态势感知能力,增强对业务运营的掌控力。

    6. 构建知识库,沉淀运维经验

    重复、相似问题的解决方案或运维专家经验应积累、沉淀至平台,当问题发生时可快速引用已有经验。减少对代维厂家或是运维人员的依赖。

    未来建设收益

    对比传统监控,它只“知其然”。能看到数据,却无法提供关联观察或建议,解决运维问题严重依赖运维人员的能力经验。可观测性智能运维则协助用户“知其所以然”,快速找到可能的风险点。不仅运维工作降本增效,更能从业务视角观测运维数据,为业务决策提供支撑。

    提升运维数据治理能力

    提升多样化数据采集能力,数据标签化、体系化、规范化;流批一体的实时及离线数据处理能力;自适应不同运维场景的算法能力;

    打造灵活多样化的智能运维场景,持续提升运维数据质量、降低运维成本;

    加强智能监控告警能力

    建设统一监控指标采集能力,实现操作系统、应用中间件、数据库、应用服务、工单链路等全维度指标采集,实现体系化监控。

    实现统一监控工具的集成,实现原始告警过滤、去重、智能聚类、规则压缩、相似告警关联、根因推荐等智能告警、精细化告警能力;

    深化业务异常检测能力

    通过日志数据采集、智能化解析、关键字告警,以及智能聚类分析,智能识别日志发生规律,实现对业务异常实时检测能力;

    通过指标标准化接入、分类、关系构建,按需适配检测模型,进行智能异常检测,实时反馈业务及应用健康度;

    构建可观测性运维能力

    建设政务OA运营数据可视化,实时洞察业务运行状态,为领导决策提供依据;且具备对业务运营安全态势感知能力;

    建设业务健康度可视化能力,以及业务应用拓扑状态可视化能力,实现业务指标与基础资源指标关联分析,深度挖掘与传递运维数据价值;

    该项目旨在通过智能运维的技术手段结合多年的实践经验,帮助客户打造以具备可观测性的智慧运营平台作为后盾,全面智能的一体化协同办公平台。此次,擎创科技将着重帮助客户拉通各类数据,打破数据孤岛,提升对业务数据的洞察力,以此帮助客户完成深度数字化转型,更好地助力当地进行智慧城市的建设。

  • 相关阅读:
    程序员的注释:编程艺术与沟通工具
    【新书推荐】AI时代,当程序员遇到ChatGPT,开发效率飞起来!
    C#/.NET/.NET Core优秀项目和框架2024年6月简报
    vue3.x项目图书兄弟项目上遇到的问题及解决办法的记录
    uni-app:实现picker下拉列表
    【办公类-16-05-02】“大班游戏活动室排班表——领导版8周”(python 排班表系列)
    校招中的“熟悉linux操作系统”一般是指达到什么程度?
    类的初始化与加载
    循环(while do...while for)介绍
    gd407使用dm9000通讯异常
  • 原文地址:https://blog.csdn.net/qq_37641528/article/details/126371700