登錄
微信登錄
打開手機微信,掃描二維碼
掃描成功
請勿刷新本頁面,按手機提示操作
中科曙光不會以任何理由要求您轉(zhuǎn)賬匯款,謹防詐騙
您的微信還未注冊
中科曙光不會以任何理由要求您轉(zhuǎn)賬匯款,謹防詐騙
您可以同時關(guān)注中科曙光微信公眾號
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經(jīng)注冊賬號和
關(guān)注微信公眾號
2025年1月
服務(wù)熱線:400-810-0466
成功案例
項目背景
電科院協(xié)同計算系統(tǒng)提供方式計算數(shù)據(jù)集中管理和分散維護、多人異地協(xié)同計算以及快速的大規(guī)模電網(wǎng)并行分布式仿真計算功能。協(xié)同計算系統(tǒng)主要面向各級調(diào)度運行方式工作,包括年度/夏滾/冬滾、2~3年、月度方式計算等。按照工作需求,每次計算有幾套數(shù)據(jù),每套數(shù)據(jù)中有許多計算分析內(nèi)容,總?cè)萘吭?00T~300T之間。
協(xié)同計算功能包括工程管理,潮流計算,暫穩(wěn)計算等。
以潮流計算為例,潮流作業(yè)表包括:LF_CASE_ACLINE、LF_CASE_COMPENSATOR_P、LF_CASE_COMPENSATOR_S、LF_CASE_DCLINE、LF_CASE_LOAD、LF_CASE_NODE、LF_CASE_UNIT等。在每個工程中,有很多個潮流作業(yè),每個潮流作業(yè)數(shù)據(jù)量大概10w條,所有潮流作業(yè)數(shù)據(jù)都存在相同的表中,作業(yè)間以case_no區(qū)分。潮流作業(yè)數(shù)據(jù)是批量插入的,并且經(jīng)常性刪除和插入,并發(fā)50個作業(yè)同時插入作業(yè)時,有較大的IO性能要求。
本系統(tǒng)存儲的設(shè)計需要考慮存儲的IO吞吐能力、IO帶寬等。本系統(tǒng)核心計算程序是fortran開發(fā)的,和系統(tǒng)接口的方法是采用輸入輸出文件。系統(tǒng)后臺使用計算機群進行計算,計算機群上的計算程序是一樣的。計算文件采用NFS方法共享給所有計算節(jié)點使用,減少了數(shù)據(jù)文件在計算節(jié)點間的傳輸,簡化了程序。但是,產(chǎn)生了io瓶頸,國調(diào)計算服務(wù)器21個,每個服務(wù)器上同時可以啟動10~20個計算任務(wù),即計算任務(wù)并發(fā)數(shù)在210~420。
現(xiàn)有業(yè)務(wù)系統(tǒng)計算節(jié)點、存儲節(jié)點均采用千兆互聯(lián)的方式,在使用中存在嚴重帶寬不足等情況,影響業(yè)務(wù)運行,本期項目建設(shè)需要同步考慮將系統(tǒng)升級擴容至萬兆互聯(lián)。
方案設(shè)計
本次項目實為電科院內(nèi)部IT系統(tǒng)業(yè)務(wù)系統(tǒng)內(nèi)配套存儲及其它IT基礎(chǔ)解決方案的綜合性方案,要求滿足標準化、高密度、高并發(fā)、高擴展,滿足數(shù)據(jù)并發(fā)訪問處理需求。
ParaStor是曙光自主開發(fā)的分布式并行存儲系統(tǒng),采用多副本、N+M糾刪碼等數(shù)據(jù)保護技術(shù)、全冗余設(shè)計,支持單一存儲命名空間、支持容量海量擴展,性能線性擴展,能夠滿足高性能計算中心海量文件并發(fā)讀寫需求。
優(yōu)勢說明
1)架構(gòu)優(yōu)勢
ParaStor300采用元數(shù)據(jù)和數(shù)據(jù)分離的非對稱式結(jié)構(gòu),這也是國際主流的并行存儲系統(tǒng)架構(gòu),元數(shù)據(jù)和數(shù)據(jù)分離有助于提升存儲系統(tǒng)的性能和擴展性。
ParaStor300的多臺索引控制(默認配置2臺)采用多活冗余集群結(jié)構(gòu)元數(shù)據(jù)存儲采用RAID6保護的SSD高速磁盤以提高元數(shù)據(jù)訪問性能。曙光ParaStor300采用更高級的元數(shù)據(jù)冗余策略。ParaStor300的元數(shù)據(jù)控制器默認配置2臺,同時支持更多的元數(shù)據(jù)控制器組成元數(shù)據(jù)集群,每臺元數(shù)據(jù)控制器均為Active在線狀態(tài),正常工作時負載均衡并行文件系統(tǒng)客戶端的元數(shù)據(jù)訪問請求,一臺元數(shù)據(jù)控制器出現(xiàn)故障時,其它元數(shù)據(jù)控制器分擔其工作負載,接管時間非常短,且為在線切換,不中斷正在進行的IO請求,不影響并行文件系統(tǒng)的業(yè)務(wù)運行。
2)數(shù)據(jù)保護
與傳統(tǒng)磁盤陣列RAID保護技術(shù)相比,曙光ParaStor300的N+M糾刪碼技術(shù)具有明顯優(yōu)勢。ParaStor300可以實現(xiàn)數(shù)據(jù)重建無人值守,比如深夜磁盤出現(xiàn)故障,傳統(tǒng)RAID要立即人工更換磁盤,而ParaStor300只要有剩余空間就可以自動進行數(shù)據(jù)重建;ParaStor300的數(shù)據(jù)重建并發(fā)進行,1TB數(shù)據(jù)半小時內(nèi)重建完成,而傳統(tǒng)RAID的重建時間可能長達10小時到1天以上,而且RAID在數(shù)據(jù)重建期間磁盤負載很重,很容易出現(xiàn)雪崩效應(yīng),即繼續(xù)出現(xiàn)磁盤損耗,導(dǎo)致RAID降級甚至數(shù)據(jù)丟失。
本方案采用的N+M保護策略,存儲系統(tǒng)可以容忍M塊硬盤同時失效。實際上M塊硬盤“同時”失效的概率非常低,因為當ParaStor300的1塊硬盤失效后,系統(tǒng)會在很短時間內(nèi)在其它硬盤上自動完成數(shù)據(jù)重建,重建完成后,ParaStor300又可以容忍M塊硬盤同時失效。數(shù)據(jù)修復(fù)過程完全無人值守。用戶只用定期更換故障硬盤即可,更換新硬盤后,ParaStor會自動進行底層數(shù)據(jù)遷移,平衡容量。
3)分級存儲
ParaStor300存儲系統(tǒng)支持自動透明的分級存儲功能,采用SSD和SATA磁盤相結(jié)合,既能保障存儲系統(tǒng)容量,又能提高存儲系統(tǒng)訪問性能,具有極高性價比。
用戶的熱點數(shù)據(jù)優(yōu)先存放在SSD分區(qū),冷數(shù)據(jù)自動遷移到SATA分區(qū),回熱數(shù)據(jù)可以回遷,數(shù)據(jù)遷移策略綜合數(shù)據(jù)訪問頻率、文件大小等因素,遷移策略用戶可干預(yù)和定制。數(shù)據(jù)遷移過程在SSD和SATA磁盤之間以數(shù)據(jù)塊級別并發(fā)進行,速度快且對存儲性能影響較小,整個數(shù)據(jù)遷移過程自動透明,用戶看到的是一個統(tǒng)一完整的數(shù)據(jù)訪問空間。
4)擴展能力
ParaStor300分布式存儲系統(tǒng)具有極佳的擴展性,最大支持4096個存儲服務(wù)器節(jié)點,真正做到EB級存儲。支持在線擴容,且不影響業(yè)務(wù)系統(tǒng)使用。增加數(shù)據(jù)控制器后,數(shù)據(jù)對象自動實現(xiàn)負載均衡的遷移分布,使得整個存儲系統(tǒng)實現(xiàn)容量和性能的線性增長。
方案優(yōu)勢說明
解決了傳統(tǒng)存儲的帶寬瓶頸問題;
曙光自帶的私有客戶端及對NFS的深度優(yōu)化,解決了標準NFS協(xié)議訪問的中斷問題;
提升了系統(tǒng)的并發(fā)訪問能力,可以同時為多個省級節(jié)點提供計算訪問服務(wù);
投資成本優(yōu)于傳統(tǒng)FC SAN架構(gòu),性價比更高;
交鑰匙工程,從前期設(shè)計,到方案POC驗證,到招投標,到最后項目交付,曙光原廠工程師全程參與支持,客戶省心放心;
原廠7*24*365超白金級服務(wù),本地化服務(wù);

津公網(wǎng)安備 12011602000521號

津公網(wǎng)安備 12011602000521號



注冊 /