系統工程師該知道的31件事(8_需要想像力)

需要想像力要幹嘛? 有用嗎? 「需要想像力」的重點是做事的過程,而不是結果。有些事情要的只是結果,但也有許多事,需要的是過程。這不是繞口令,這是在這個產業中,讓我們在工作時,能順利的要素之一。

兩年前,我到我家附近的麥當勞做打烊班,對一個30沒有好幾的人來說,做打烊班是一件很不容的易的事情。第一個不容易是「節奏」。如果一個大型的系統建置 專案,從開始到結束預估是三年,那麼三個小時的打烊班,就是一個非常小型的專案。在大型系統專案中,只要MileStone還沒到,就會常常聽到「今天做 不完,明天做啊!」

但在麥當勞可就不行了。如果跟客戶說「我的地板今天還沒拖乾淨,明天再拖,或是我煎肉餅的爐子還沒清好,明天再清。」到了明天,來的可能就是新聞SNG車、消保官和衛生稽查員。

所以光是「節奏」要跟的上,在剛開始的時候,就非常不容易。

第二個不容易是,沒有太多的「學習」時間和機會。第一天,別人做,我看。第二天,我做別人看。第三天…我自己一個人做。因為有和當時的主管反應,我學 的速度有點慢,可能需要有人多看著我幾天。一直到上班後的第二個星期,才開始獨立作業。這中間,有件事,幫了我很大的忙,就是「想像力」。

打烊班開始的第四天下班後,約零晨兩點,我告訴值班經理,我想做筆記,希望能讓我回到後場,值班經理同意了。接著我走到旁邊的7-11買了筆記本,再回到店裡。

大概花了一個半小時,請教大夜班的人,他們在說的那些「專有名詞」是什麼,接著畫出了這張紙。

DSC03009

隔天早上,我又用了一個半小時,努力的回想,打烊班所有的工作項目,並寫在這張紙上。

DSC03010

DSC03009

然後,幾張紙一起對著看,想像自己站在後場,從開始上班的那個當下,我要做什麼事、要怎麼做、要和誰確認…等等的工作細節。接著,等到上班時,把我做 的小抄帶在身上,做到某個點遇到問題了,就偷看一下小抄。從有空的情境模疑、看小抄、到不用小抄,就能夠講出所有工作項目和順序,我大概花了兩個星期。大 概三個月之後,已經非常上手,並且快速和正確。

這些跟系統整合或工作有什麼關係? 當然有關係。

「情境模擬演練」這件事,是非常多產業都在做的。『寶傑…我跟你說…系統工程師到客戶那邊,就只有兩件事,一、處理系統有關的事情。二、處理客戶的事情。』

舉兩個系統方面的例子(非系統原生bug):

案例一:
辦公室裡有PC_A和PC_B,這兩台PC在兩個不同IP網段,中間會經過兩個防火牆,兩台PC都有防毒軟體。

同樣傳送十G的資料時,PC_A 到 PC_B 很慢、PC_B 到 PC_A 很快,原因不確定…
請問:安裝這兩台PC的工程師,遇到了這樣的狀況,該檢查什麼地方或提出什麼問題。

案例二:
機房裡有300台主機,某一天早上,其中的100台主機,無法將需要的檔案,備份到File Server上面。檔案傳輸是透過TCP/IP V4的網路環境。

請問:現在有這樣的狀況,該檢查什麼地方或提出什麼問題。

這兩個實際案例,都是在只知道這些資訊的情況下,只能慢慢的將原因找出來。But, If, 到了現場,看到狀況,就直接說出是什麼什麼…那就只是亂槍打鳥。

沒有錯,老闆和主管都只想知道我們有沒有把「問題」解決掉,如果答案是「沒有」可能會說「能力不夠、經驗不足或只問一句_何時能處理好」。的確,這些都是在現場的壓力來源之一。就算有壓力,也還是要「先想一下」和「再做下一步」。

最近這一年,工作時,別人問我最多的一句話就是「為什麼失敗…」
我回答別人最多的話,則是『讓我查一下,確認原因,再回答您。』

過去遇到很多狀況,包括自己…都是用亂槍打鳥,在處理問題。但那不是機器設備上,有放乖乖就沒事的。沒有先想過的處理方式,讓後果更嚴重的案例,每天都在發生。

現在機房內的設備,已經不太像以前一樣,設備單純。以前可能就只有Server、防火牆、Switch和Router。「個資法」讓機房裡面多了一些「設備」,這些「設備」在「資安的考量下」,讓系統環境和問題變的更複雜。

另外一個會需要面對的,就是「客戶的問題」。

客戶的問題,需要好好回應的。就算我們讓機器設備運作都正常,客戶也不一定會對我們滿意。特別是在,我們比客戶,還不了解他們的環境或是我們要處理的系統\設備時,對於他們提出的問題,又回答不出來,或是自己也不知道在說什麼的情況下,這只會讓我們的陷入更大的困境裡。

之前舉個幾個例子,給我同事聽。

我申請了ADSL,來安裝小烏龜的先生,到了我們家裡之後,告訴我「小烏龜要裝在廁所…」
我一定請他離開。

我去裝汽車雨刷,師父告訴我,雨刷要裝在汽車裡面,我應該也是馬上將車開走。『寶傑,我告訴你,這…太…扯…了。』

聽起來很好笑,我同事聽了後,也哈哈大笑。可是,我們的確也會因為對自己公司的產品或對客戶環境不熟,而對客戶說出類似的話…只是…客戶一定笑不出來。

這些例子,都只是在說,要花時間「想」,客戶可能會問什麼問題、對方關心的是什麼、對方的環境是什麼、如果出了狀況,要怎麼尋著「資料流」做檢查。「資料流」就是「網路封包」,只是習慣稱為「資料流」。

OSI有七層、TCP/IP有四層,如果遇到的問題跟網路有關,是斷在那裡? 有什麼能讓網路中斷?

一個服務無法起動,如果不是服務的檔案本身有問題或bug,那為什麼昨天可以起動或剛剛可以起動?

這些,都需要在平時,了解環境、產品和相關的設定,才能有東西可以想像,不然就會變成空無一物的華麗。

(待)

2012/10/04 SunAllen

您可能也會喜歡…