效能管理開發階段上線前準備維運階段

要能有效維持資訊系統的可用率,維運的工作是萬萬不可忽略的項目。諸如備份、清檔、業務需要的批次作業、版本更新、問題排除以及功能新增等等的,這些都是資訊人員每天必須面對和解決的工作。原本這些工作就已經夠繁瑣,再加上IT環境日益複雜。資訊人員所面臨的挑戰就更加艱難了。叡揚資訊針對作業維運中,最關鍵的兩件工作:批次作業的排程管理和資料庫的備份與復原,提供了最佳的解決方案,如下:

1.批次作業排程管理-Control-M
Control-M是自動化批次作業排程管理的最佳解決方案,在2001、2002連續二年榮獲Gartner Group評選為居世界領導地位的自動化批次作業排程管理軟體。管理人員可透過圖形化介面集中管理各平台的批次作業排程、相依關連、障礙排除、以及流程異動。Control-M支援各種開放式作業平台乃至於Main Frame環境;經由單一Console的集中管理介面,以拖曳的方式,即可快速建立批次作業之間的相依性,不受作業平台的限制;圖形化的介面讓使用者可以從企業資訊系統運作的角度,隨時掌握各項批次作業執行狀況,整體性進行工作流程規劃、管理以及障礙排除。此外,Smart月曆排程的功能,讓作業精確地在特定時間執行,並可依需要調整或設定複雜的執行時間表。

2.資料庫備份與復原管理-SQL-Back Track

SQL-Back Track是專門為資料庫備份及復原的管理工具,具有自動執行備份作業、完整的Archive Log管理、以及快速備份的功能,可對資料區塊進行Incremental備份以及資料壓縮的功能,將備份的時間與媒體空間節省到最少;而Parallel backup streams的功能,可同時將資料備份至兩個以上的媒體設備上,提高備份的效率。SQL-Back Track在執行備份時,能自動偵測Table space或data file的增減,調整資料庫備份的指令來反應最新的情況,以確保資料庫備份之完整性。經由SQL-Back Track的管理,讓physical資料庫的備份,可由logical的方式回復資料庫物件,提高資料回復的彈性與簡易性。針對資料庫備份與復原過程的掌握,可透過模擬作業的功能進行確認;而實際執行中如果有因無法預期之狀況所造成的中斷,SQL-Back Track也提供restart的功能,讓作業可以由上次中斷點繼續往下執行。

效能管理(Performance Management)

效能管理的目的,在協助資訊系統管理人員完成三項主要的工作目標:
1.確保所建置的系統,在上線後能滿足使用者的效能需求
2.上線後,一旦發生問題時,能儘速解決
3.能有效防止效能問題的發生想要確保系統在上線後能滿足使用者效能的需求,必須從系統開發階段做起。
叡揚資訊的效能管理解決方案,結合了Compuware公司的Qaload、NuMega和Vantage家族的產品以及BMC公司的Performance Assurance Solution產品,提供一個自開發階段(Development)到維護階段(Operation)完整的解決方案。(如下圖所示)

開發階段-關鍵性自動化品質控管機制

在應用系統開發階段,除了系統分析外,最重要要注意的是程式設計師所開發出來程式品質;一般而言程式的品質包括兩部份,一者是程式本身寫的好不好,另一者則是測試做的夠不夠。叡揚資訊的效能管理解決方案,針對程式品質提供了兩個關鍵性自動化品質控管的機制:
A.自動化的程式碼品質檢核機制,即所謂的自動化Code Review機制,其目的是希望運用工具自動化地評估程式寫的好不好的狀況。透過Compuware公司所提供的軟體工具NuMega,可以自動地根據事先設定的程式碼品質規範(Code Rule)檢核每一個程式設計師所撰寫的程式碼,並將不合規範的程式碼顯示於螢幕上,程式設計師可以根據NuMega顯示之資料修改不合格之程式碼,直到所有程式碼都合乎規定之規範為止。透過自動化程式碼品質檢核機制與規定,可以在所選定的程式碼品質規範下,以不增加任何額外人力的方式,確保開發出來的程式碼都具有一定水準以上的品質。

B.自動化的測試涵蓋率檢核機制,即所謂的Code Coverage機制。其目的是希望運用工具,自動化地評估測試做的夠不夠的狀況。透過Compuware公司所提供的軟體工具NuMega,可以在程式設計師或測試者,執行程式單元測試時,自動檢核程式設計師或測試者所執行之測試的涵蓋度(以白箱測試Code Coverage之方式計算之),以作為測試是否足夠的參考。透過自動化測試涵蓋度檢核機制與規定,可以在所規定的測試涵蓋度下,以不增加任何額外人力的方式,確保所開發出來的程式都能通過一定水準以上之考驗。

上線前準備階段-微感式的上線最佳準備

在系統正式上線前,除了功能測試仍舊如火如塗地進行外,大家最關心的主題應該是上線後系統是否拖的動,效能是否能達到預期。為了確保系統上線成功,有幾項關鍵的工作,建議一定要做:
A.壓力測試
為了確保系統上線後,能夠在預定的工作負荷下持續且正常的運作。壓力測試的工作是絕對不可少的。但是要執行壓力測試有二個很大的困難點,第一個是如何產生或者模擬成千成百位使用者同時使用系統的工作負荷?第二個是如何挪出有能力做這件事的人力出來?為了解決這二個問題,叡揚資訊的效能管理方案,提供了一個微感式的解決辦法,這個辦法包括兩部份:第一部份是使用Compuware公司的工作負荷測試工具QAload來解決模擬成千成百同時使用者的問題。第二部份則是提供壓力測試人力服務方案,透過購買專業訓練之壓力測試服務人力,可解決挪不出有能力之人力的問題。
B.效能分析與調校
一旦測試執行完畢後,如果測試的結果不能滿足未來系統上線後的要求,接下來要面對的問題就是如何改善。一般而言,壓力測試後都一定會有系統效能的問題,必須改善。因此效能分析與調校的工作是一定少不了的。在叡揚資訊的效能管理方案中,規劃了一個效能分析與調校的機制,可以協助系統開發者,快速地找到問題的所在。這個機制分為兩部份,一部份為使用Compuware公司的Application Expert工具用來從網路的角度收集並分析系統執行的狀況。透過資料的收集與分析可以告訴使用者系統執行的執行回應時間分佈。如果系統執行太慢,則可以從其中清楚的找出慢是慢在那個Tier。另外透過其特有的執行緒分析能力(Thread Analysis)可以告訴使用者,各程式片斷執行的回應時間狀況。如果某個交易執行太慢,可以從其中清楚地找出慢是慢在那一個程式片斷。這個機制的另一部份為安裝於目標系統上,用來收集各伺服器運作時其效能反應及資源運用之狀況的;BMC Performance Assurance Solution(Perform);透過Perform之資料分析可以從伺服器資源運用與效能表現之角度提供圖形化之分析資料,以階層方式顯示某平台上每一顆Disk、Raid,CPU,Memory每一時段之使用狀況,甚至還可Drill Down到更細部資訊,如:每一顆Disk的Disk Utilization、Total Disk I/O和Quene Length、每個Process所佔用的CPU Utilization和Memory Amount,以協助系統開發者快速地找到效能問題的瓶頸所在。

C.資源預測

如果在執行壓力測試和效能調校後,發現未來production環境要用的伺服器不符使用,而且經效能調校後,仍舊無法改善,或者該未來要上線的系統是透過WAN來執行的,但壓力測試在LAN的環境上執行,以致於無法預知WAN的頻寬需求時,要做好上線的最佳準備需要有資源預測的機制。叡揚資訊的效能管理方案提供了一個資源預測的機制;這個預測機制包括二部份:一個部份為WAN的頻寬預測機制,另一個部份為伺服器的規格需求預測機制,前者是由Compware公司的Application Expert工具來運作的,其在使用時,會先在壓力測試之同時從網路的角度收集,此工作負荷下之網路資源運用與效能表現,然後根據設定,產生回應時間與網路頻寬關係預測圖,使用者可依預期之回應時間,決定所需之網路頻寬。而另一個預測機制為伺服器的規格預測機制,是由BMC公司的Performance Assurance Solution來提供的。其包含二個模組:Perform和Predict。使用時,會先由Perform在壓力測試執行之同時,從伺服器之角度收集該工作負荷下之伺服器資源運用與效能表現,然後在Predict中定義要預測之工作負荷,啟動Predict中what-if之功能,即可預測出所需之伺服器的規格。

維運階段-效能問題的快速排除與預防

前兩個階段的解決方案,只是確保系統在上線後,能滿足使用者的效能需求。系統上線後,系統的服務表現將赤裸裸地呈現在所有使用者的面前,如何讓系統永遠保持在合乎服務水平的運作狀況?如何在問題發生時儘速地解決?以及如何防止效能問題的發生?是這個階段IT人員最傷腦筋的問題。叡揚資訊的效能管理方案包括三部分:
A.服務水平的監控與管理的機制
這個機制包括三個主要功能;第一個為主動量測並記錄系統每一個時間點的效能表現和可用狀況的能力;第二個為主動預警的能力,當系統的效能表現和可用狀況不能滿足預設的服務水平時則發出警訊通知管理人員。第三個為問題診斷資訊的收集的能力。透過主動式量測與記錄系統服務表現的功能,提供給管理者一個數據性的報表,經由這個報表,管理者和使用者可以清清楚楚地了解到系統上線後每一個時間點的效能表現和可用狀況。透過主動式的預警能力,可以讓管理者在系統表現低於服務水平要求前,提早發現問題並解決之。另外透過問題診斷資訊的收集,可以協助管理人員快速找到問題的癥結並排除之。這個機制主要是由Compuware公司所提供的Client Vantage和Application Vantage聯合提供。
B.效能問題的診斷與排除的機制
這個機制包括二部份:一者為Compuware公司的Application Vantage產品;另一者為BMC公司的Performance Assurance Solution。前者是從網路角度,透過封包之收集與分析來協助管理者,快速找到問題所在的應用系統效能問題的除錯專家。而後者則為從伺服器內部的角度,透過安裝於伺服器上的Agent之資料收集,來協助管理者快速找到伺服器上效能瓶頸的診斷工具。透過這兩項工具之結合運用可幫助管理者在最短時間,以最有效率的方式,找到問題並排除之。
C.資源分配與容量規劃的補助機制
這個機制包括二部份:Compuware公司的Application Expert產品及BMC公司的Performance Assurance Solution,前者為網路資源分配與容量規劃的補助工具,可協助管理者預測WAN的頻寬,而後者為伺服器資源分配與容量規劃之補助工具,可協助管理者預測與模擬伺服器之需求規格。叡揚資訊所提供之效能管理方案,除了可購買工具,建立機制之方式導入外,還可以用服務的方式取得。服務項目如下:

階段 服務項目
開發階段 1.程式碼品管檢核
2.白箱測試涵蓋率檢核
3.程式效能分析與調校
上線準備階段 1.壓力測試
2.系統效能分析與調校
3.資源應用分析與預測(Server/網路資源)
維運階段 1.系統服務水平量測與管理
2.系統監控與管理 (網路/作業平台/資料庫/AP/End User View)
3.系統健康檢查
4.系統效能診斷與調校
5.系統資源運用分析與管理
6.容量規劃