戴姆勒卡车公司运用图数据库理清IT资产

作者: CBISMB

责任编辑: 邹大斌

来源: CBISMB

时间: 2026-01-05 11:24

关键字: 图数据库,CMDB,本体,流量

浏览: 4899

点赞: 255

收藏: 29

2021年,当戴姆勒卡车控股公司(Daimler Truck Holding AG)启动从梅赛德斯-奔驰集团剥离这一漫长而复杂的流程时,它面临一个令人生畏的难题。

数十年来紧密交织的信息技术系统、共享基础设施以及大量未记录的依赖关系亟需梳理。超过1500个IT系统和应用程序需要被拆分、重新设计或替换。此次变革将影响全球10万名员工、5.5万家经销商和6,000家业务合作伙伴。

简单地“一刀切断”两家公司之间的联系并不可行——任何未被预料到的依赖都可能导致双方关键应用同时瘫痪,且故障难以诊断或恢复。

“如果我们直接切断那条连接,两家公司都会宕机,”戴姆勒卡车公司的人工智能架构师康纳·奥谢亚(Conor O’Shea)表示,“由于几十年基础设施深度交织,几乎不可能恢复。”

为此,戴姆勒卡车转向图数据库技术,将整个应用生态建模为一个动态系统,实时反映各系统间的交互关系。这项最初仅为支持剥离工作的工具,最终演变为这家新独立公司实现可观测性、安全洞察和应用智能的基础平台。

看不见的依赖,最难分离

与许多大型企业一样,戴姆勒集团此前依赖配置管理数据库(CMDB)来追踪应用程序和基础设施。CMDB是一种集中式系统,用于存储组织IT资产的信息,并记录其配置方式及相互关系。

尽管CMDB在记录保存方面有一定价值,但它缺乏上下文。应用程序通常仅被记录为一组服务器,而现实世界中的依赖关系——如DNS记录、代理、数据库、邮件中继、税务服务以及与遗留系统的连接——往往缺失或已过时。

“有人绘制了一个应用的架构图,但此人离职后,新负责人根本不清楚这对他们的应用意味着什么,”奥谢亚说道。

弥合这一差距至关重要。多年来,戴姆勒卡车与梅赛德斯-奔驰的系统已深度耦合。一方的应用程序经常依赖另一方拥有的基础设施。若无法全面掌握这些关系,意外停机将不可避免。

人工分析并不现实。戴姆勒卡车估算,若雇佣承包商手动绘制依赖关系图,成本将超过100万美元,耗时数月,且仍无法保证结果完整。他们真正需要的,是一种能真实反映应用程序实际运行行为的方法。

用图技术构建IT世界的“本体”

戴姆勒卡车选择了Neo4j公司的图数据库技术,将IT环境建模为一个“本体”(ontology)——即对实体及其关系的结构化表达。目标是理解所有组件如何相互连接。

来自ExtraHop Networks公司的网络遥测数据为此奠定了基础。ExtraHop可捕获企业内部的实时流量,识别客户端与服务器之间的通信、端口、协议及行为信号。戴姆勒卡车使用Go语言(专为可扩展网络服务和分布式系统优化)构建了一套提取/转换/加载(ETL)管道,将数百万条流量记录采样并转化为图中的关系。

每条流量都转化为一组相连的节点,包含客户端与服务器IP地址、协议和服务类型。随后,这些节点通过IP地址作为主键,与公司ServiceNow数据库中的应用记录关联。最终形成一个持续更新的图,真实反映应用程序在网络中的运行状态。

与静态文档不同,该图会随环境动态演化。每当连接发生变化,ExtraHop的数据就会更新本体,使其同步变化。这一点在剥离规划阶段尤为关键。

干净利落地完成切割

有了这张图,戴姆勒卡车得以清晰识别哪些应用属于卡车业务,哪些属于梅赛德斯-奔驰,以及它们在何处重叠。

像ServiceNow和Salesforce这样的共享服务相对容易拆分——双方各自部署独立实例并迁移数据即可。但内部应用则复杂得多。借助图技术,戴姆勒卡车发现了诸多隐藏依赖,包括SMTP邮件中继、数据库连接,以及位于欧洲或亚太地区的网络服务——这些仍是公司运营所依赖的。

这使得迁移团队能够逐案制定拆分计划,与应用负责人和基础设施团队协调,安全地复制、迁移或重新配置服务。图技术大幅减少了“未知因素”——而这正是大规模IT转型中最危险的部分。

整个过渡历时3.5年。除应用程序外,公司还迁移了13万台移动设备,并将1.5万台服务器迁入戴姆勒卡车自己的数据中心。此次行动不仅将应用总数减少了40%,还对财务、备件物流和人力资源等领域的系统进行了现代化改造——其中一些系统已有30多年历史。

意外却宝贵的长期收益

一个始料未及但极具价值的收获是:戴姆勒卡车获得了前所未有的IT全景可视性。通过将防火墙日志、安全遥测数据以及思科(Cisco Systems Inc.)Splunk机器数据分析平台生成的系统事件纳入图中,公司构建了多个相互重叠的本体,分别代表网络行为、安全策略和应用意图。

这不仅让人看清“正在发生什么”,还能判断“应该发生什么”。

长期价值远超预期

“这个本体的价值远不止于两家公司的分离,”奥谢亚表示,“它已成为应用层面的可观测性仪表盘。”

迁移团队更进一步,在图之上叠加了一个大语言模型(LLM),让任何需要的人都能轻松访问这些数据。用户无需依赖网络工程师或安全专家编写复杂查询,只需用自然语言提问,例如:“为什么这个应用今天失败了,而昨天还能正常运行?”或“哪些依赖项存在风险?”

“你不需要懂‘网络术语’,”奥谢亚说,“只要用你自己的话提问,就能得到想要的答案。任何人都能做到。”

将图作为结构化上下文,显著降低了大语言模型产生“幻觉”的风险,并能发现人类可能忽略的问题。例如,图技术曾精准定位两台后端服务器上的证书过期问题,这正是导致应用间歇性故障的根本原因——奥谢亚表示,若靠人工排查,通常需要数小时甚至数天。

此外,图还揭示了大量未被充分利用或无人认领的资产。那些没有明确负责人的遗留服务器如今可以被监控并安全下线,而不必因担心破坏系统而无限期保留。安全风险也更容易识别——异常行为在预期关系的映衬下变得一目了然。

在一个案例中,该图帮助识别出一批已被攻陷、正被用作对外攻击代理的设备。这类活动虽已被防火墙阻断,但此前从未在应用层面进行过关联分析。

最初仅为管理剥离风险而开发的工具,如今已成为一项战略资产。它赋予戴姆勒卡车持久的能力:深入理解其应用程序如何运作、如何演变,以及故障如何传播——这些价值远远超越了最初“拆分公司”的目标。

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。