IT設備自動化巡檢BOX技術白皮書

1.設備自動化巡檢BOX概述

1.1背景概述

       IT高速發展的時代,勢必投入大量的IT設備。不同時段的IT設備,不同品牌,不同型號以及不同配置的IT設備等是否正常運行,成了IT發展的重要基石。
      混合的IT設備對日常運維人員提出了更高的要求。由于IT部門普遍存在人少事多,設備品牌雜,占用了大量的運維人力資源。如何減輕運維人員的工作量,提升IT設備的高可用性,同時還需要控制運維成本,提高IT設備的高可用性,是運維人員一直探討和研究的方向。
      容錯設備自動化巡檢BOX正是解決運維人員困惑利器,通過集中收集IT設備的事件信息,大數據分析收集的IT設備事件信息,挖掘出有價值的設備問題庫,集中展現設備的問題信息,并且根據設備的問題級別、服務的狀態分類統計,省去運維人員收集IT設備的問題信息,集中查看所有IT設備的問題信息,并且根據服務級別和服務響應時效安排日常運維工作。實現主動運維服務,改變被動服務的局面,提升IT設備高性能穩定運行,創建一個可知可控的IT環境。


1.2.建設目標

      設備自動化巡檢BOX的建設和部署應用,實現IT設備事件的集中收集,IT設備的事件大數據分析,挖掘并建立設備的問題信息庫,集中展現IT設備的問題信息,實現主動式運維服務管理模式。
      主動式運維服務管理不僅緩解運維人員的壓力,而且改變被動服務的局面,提升IT設備的高效持續穩定運行,創建一個可知可控的IT設備環境,從而保障基于設備基礎之上的各類IT業務應用系統持續、穩定的運行。


1.2.1.主動發現設備的問題信息

      改變現在的問題信息由業務部門提出的被動局面。收集IT設備運行的事件信息,通過對設備事件信息的大數據分析,挖掘出IT設備的問題信息,并主動提醒告知管理者。問題信息包括設備的操作異常行為信息,設備的運行狀態及隱患信息,設備的故障信息,設備過保信息及設備的資產信息。


1.2.2.集中保存設備的問題信息

      改變設備的事件信息四處存放凌亂局面,統一收集IT設備運行的事件信息,挖掘出設備的問題信息,建立統一的問題庫集中保存,滿足追溯分析使用。


1.2.3.自動督促設備問題信息的執行

      當問題庫新增問題信息,自動把問題信息轉發給對應的服務團隊,BOX自動根據服務時限對問題信息跟蹤督促,保障問題信息按照預案提供服務,保證服務時效。


1.2.4.集中展現設備的問題信息

      集中展現IT設備存在的問題信息總數,緊急程度的問題信息組成,異常服務狀態信息組成,各個問題信息產生的具體原因,各個問題信息的來源,不需要再到IT設備中去查詢,方便管理者和維護者快速掌握問題信息。


2.設備自動化巡檢BOX產品介紹

2.1.設計思路

      設備自動化巡檢BOX基于ITIL最佳服務實踐和ISO20000標準,遵循客戶實際管理規范和管理模式,降低維護人員的壓力,改變被動式救火服務模式為事前主動預警,由無序服務向有序服務轉變,逐步實現IT設備服務管理工作的自動化和智能化。




      設計思路以問題信息庫為核心,首先收集IT設備的事件信息。對收集的事件信息進行大數據分析,挖掘設備的問題信息,構建符合客戶管理者需求的問題信息庫。對問題信息庫進行問題發布和問題展現。

2.2.整體架構




      設備自動化巡檢BOX巡檢的對象有1、服務器【x86及小型機服務器】;2、SAN交換機及存儲設備;3、網絡設備;4、安全設備;5、環境動力;6、其它設備等組成。

2.2.1.采集原理
      采集的信息有被動和主動獲取兩種方法。

2.2.2.被動接收信息
      通過syslog、SNMP Trap等被動協議接收信息。


2.2.3.主動獲取信息
      通過IPMI、telnet 、ssh、CMC、AMM、ILO等協議主動獲取信息。具體需要根據各個廠家的產品決定。

2.3.BOX部署
      設備自動化巡檢BOX旁路部署在網絡中,開啟管理口,保證網絡及數據能夠交互。
部署原理:




詳情請下載技術文檔

關注我們
地址
杭州市拱墅區宜家時代大廈1幢2306室
中國        杭州

銷售部電話:0571-82089118
公司總機:0571-88384008
版權所有© 2016
杭州容錯科技有限公司
RONGCUO Co.,Ltd
聯系我們
*
*
*
*


浙ICP備16043142號

香大伊煮