大數據遷移方案范文
時間:2023-06-05 17:59:05
導語:如何才能寫好一篇大數據遷移方案,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
作為大賽獨家贊助商的領導,IBM大中華區副總裁兼大中華區軟件集團總經理胡世忠表示:“在大數據的時代,DB2引領著下一代數據庫技術的發展方向,已經成為客戶的首要選擇。越來越多的全球知名企業正在將他們的數據庫遷移到IBM的DB2平臺上來。IBM還在去年5月在中國成立了數據庫遷移中心,幫助客戶實現無縫遷移,實現從業務價值評估到后續技術的全方位支持。此外,IBM一如既往地密切關注廣大技術開發者的需求,2011年IBM和全球200多所大學合作開展了業務分析方面的課程,同時舉辦了1200場現場和在線的大數據技能訓練營?!贝舜蜠B2遷移之星大賽正是IBM對中國市場和廣大軟件技術開發者的承諾。未來,IBM將與中國廣大的客戶、合作伙伴、技術開發者繼續攜手合作,共創未來。
應對需求
呼喚杰出技術人才
IDC預計,2012年全球存儲的信息數據總量將增長到2.7ZB,比2011年增長了48%,值得關注的是,這些數據中90%是非結構化數據。中國電子信息產業發展研究院副院長、中國計算機行業協會常務副會長、中國計算機報社社長盧山表示:“未來,大數據將會成為產業發展變化的關鍵點?!彼Y合大賽將DB2三個字母做了全新的解釋:“D代表Data,在未來十年甚至在可以預見的未來,無論非結構化數據還是結構化數據,通過挖掘和再生產都將會變成信息社會一個重要的組成部分;B代表Business,只有完整的商業模式才能把數據變成價值,為整個信息社會反復利用;2代表中國軟件和信息服務業人才在‘十一五’末期到‘十二五’末期的翻倍變化,預計從300萬增長到超過600萬?!?/p>
大數據時代,企業的數據量不僅在以前所未有的速度增長,數據的復雜度也突破了原有的關系數據范疇,給企業的信息管理增加了難度。中國計算機用戶協會名譽理事長陳正清表示:“我們非常高興地看到IBM已經看到企業在數據管理方面的困境,并提出了解決方案。IBM的系列產品很好地融合了數據庫管理系統、中間件平臺以及最新的云計算技術,幫助企業在海量信息中抓取商業價值。而本次大賽也涌現出了很多數據庫領域的技術精英,他們能夠針對眾多企業面臨的困難提供很好的解決方案,并在實踐中得到驗證?!?/p>
大數據變革呼喚著越來越多的軟件工程師脫穎而出,也正是在這樣的一個大的背景下,主辦方在IBM的支持下組織了IBM DB2遷移之星大賽。中國軟件行業協會數據庫與應用軟件分會理事長唐世渭表示:“讓數據獲得更大價值的關鍵在于人才,而這也正是此次大賽的目的之一――促進包括像DB2數據庫工程師在內的高端信息人才的成長和發展,推動我國信息管理技術的持續創新。這次大賽對促進我國數據庫應用事業的發展和相關人才的成長具有積極的意義和重要的作用?!?/p>
王者勝出
十強獎項各有歸屬
2011 IBM DB2遷移之星大賽為中國企業程序員和數據庫管理員們一個展現自己、表現自我的舞臺。通過舉辦本次賽事,能夠推動數據庫工程師和數據庫管理員甚至數據庫產業重新理解新的計算理念,推廣新技術,推動各方共同進步。而本次大賽選拔出的一批大優秀的數據庫工程師也將在未來逐步發展成為這個產業的技術帶頭人和產業帶頭人。
據悉,本次大賽歷時半年,參賽選手達到2163名,覆蓋金融、電信、政府、制造、醫療、零售等行業的數據庫工程師和管理員以及獨立軟件開發商、系統集成商中的技術精英。經過嚴格的初賽、復賽,最終有十支隊伍闖入決賽。這十支隊伍分別來自有實際數據庫遷移經驗的行業用戶,以及系統集成商、獨立軟件開發商。進入決賽的團隊都將獲得豐厚的獎金,冠亞季軍團隊還將獲得去美國參觀考察的機會。
經過3月14日一整天決賽的激烈角逐,在2011 IBM DB2遷移之星大賽頒獎典禮現場,各項獎項最終揭曉。大賽評委會主席、原中國軟件行業協會理事長陳沖為冠軍團隊開獎,最終,冠軍團隊由來自北京普遠天成、北京速通和杭州新世紀的四名技術精英共同組成的飛天隊獲得。亞軍由招商銀行五名技術精英組成的金葵花隊獲得,季軍則由中信銀行兩名技術精英組成的中信數據庫隊獲得。其余七支隊伍獲得了優秀團隊獎。
迎接挑戰
實現數據庫平臺遷移
據悉,DB2數據庫工程師大賽已經舉辦三屆,從第一屆大賽以尋找杰出數據庫工程師為主題,到本屆大賽以數據庫遷移為主題,體現了DB2在大數據時代的進取心:用DB2可以平滑地取代其他數據庫引擎。
然而,遷移是一項系統工程,遷移風險的評估、遷移割接、遷移前的模擬演練、對不同數據庫特性的熟悉程度,都影響到遷移實施的成功與否。這就需要遷移后的平臺能夠具有豐富的遷移支持功能和獨特的商業價值。IBM副總裁兼DB2數據庫和數據倉庫開發總經理Judy Huber表示:“IBM的DB2產品有許多獨特的價值優勢,包括低運營成本、卓越的系統性能、無限延展性以及高可用性等。特別值得一提的是,選擇DB2能夠使用戶非常便捷地從其他的數據庫技術遷移到DB2平臺,同時可以大大簡化應用開發。DB2能夠幫助全球的客戶在遷移策略中以最小的風險利用DB2各種價值優勢,有效支持客戶的多元化戰略,充分利用IBM全信息生命周期系列產品的優勢,以及數據倉庫和大數據的優勢?!睘榱藨獙Υ髷祿奶魬?,IBM推出針對大數據的全面解決方案,突破了傳統數據倉庫和單一的數據管理體系,實現更為經濟高效的大數據管理,并為企業提供重要的業務分析和洞察。
IBM軟件集團大中華區數據庫和數據倉庫銷售總監陳文玉則分享了DB2應用的成功案例,她表示:“DB2的特性讓用戶可以輕松地從其他系統快速地遷移過來,而不需要改變太多系統的設置。這也是這次比賽的精神,它向大家證明從其他數據庫到DB2的遷移工作是非常容易的。越來越多的全球知名客戶已經從其他數據庫遷移到DB2的平臺上來?!北热缈煽诳蓸菲垦b公司通過將數據庫遷移到DB2,由于采用DB2深度壓縮技術存儲需求降低了30%,整體供應鏈效率提升65%。
可以說,IBM的大數據解決方案提供了大數據領域最全面的技術和產品組合,實現了針對大數據管理的企業級的可靠性和適應性實施分析。在大數據的時代DB2引領著下一代數據庫技術的發展方向,在大容量數據、非結構化數據、數據壓縮、兼容性、數據分析,在這些領域DB2已經成為擁有著明顯的優勢。
冠軍團隊:飛天隊
賽后,來自北京普遠天成的隊長徐明偉認為這次決賽的題目非常具有實戰性。“我們的團隊在運營商方面的經驗比較多,對數據庫的維護、性能調優、擴容以及培訓參與方面都有所涉及?!彼硎荆皥F隊成員分工密切,優勢互補?;诓煌腄B2版本,我們參與過很多數據庫遷移項目,這是很有幫助的?!?/p>
徐明偉認為DB2目前的版本在功能方面實現了極大的擴展,大部分功能已經能夠實現與Oracle的兼容,有一些功能實際上已經完全相同,只是在名稱上有所區別。在關鍵業務方面,結合power的一體化策略使得DB2能夠更好地發揮整體性能,針對全天候的業務環境和需求,DB2在穩定性方面確實做得很好。
在談到希望DB2改進的方面時,來自杭州新世紀的隊員麥志斌表示:“希望DB2在開發工具上能做的更好,注意到實際應用中包括鎖、排序、參數優化等在內的一些細節性的問題。如果能加以改進,DB2的適用性會進一步擴展,基于DB2的開發應用也會更加方便、高效?!彪S著DB2版本的不斷更新,功能越來越多,會有更多成功的應用和案例出現,飛天隊看好DB2的發展前景。
最終飛天隊獲得了本次決賽的冠軍。隊長徐明偉表示,這是團隊的力量。隊員管偉來自北京速通、麥志斌、陳艷來自另外兩家不同的公司,他們在數據庫遷移方面都有豐富的經驗。希望以后還能參加這樣的比賽。
亞軍團隊:金葵花隊
在比賽過程中,每次跟金葵花隊溝通,都能感受到他們對本次大賽的認真態度和對數據庫遷移技術的激情。隊長楊盛告訴記者,他們團隊的成員各有所長,配合默契,“團隊成員楊盛、隆、林耘毅、莫淡先、王漢福分別負責開發、架構設計、數據庫等不同方面。遇到了問題,就在一起討論,展開頭腦風暴。盡管沒能獲得冠軍,有點小遺憾,但獲得亞軍也非常高興。感謝IBM和主辦方能給予我們這個展示自我的平臺?!?/p>
隊員莫淡先稱,決賽時,評委的問題都一針見血,非常到位。專家們提出,銀行數據庫業務的維護和開發,招商銀行的工作應該實現標準化,讓他們非常受啟發。因為此前,他們也在這方面進行嘗試,但是進展不明顯,原因是數據庫遷移涉及運維、開發、廠商支持等各個方面,要做一項遷移的工程,所有的部門都要參與其中,所以比較復雜。而降低遷移的復雜性,推廣遷移的方式方法和成功案例,也正是舉辦此次DB2遷移之星大賽的目的之一。
決賽期間,通過跟其他選手交流,了解到了國內頂尖水平的選手都在做些什么,“不再埋頭苦干了”。隊長楊盛建議主辦方多舉辦一些類似活動,讓更多選手參與進來,給更多DB2愛好者和數據庫工程師提供切磋的機會。
季軍團隊:中信數據庫隊
中信數據庫隊隊長唐志剛在參加決賽時自信滿滿。他表示,2011年中信銀行剛完成一個遷移案例,是從Oracle到DB2的遷移。在實際的應用中,會使用不同平臺和類型的數據庫。目前中信銀行的主流數據庫應用是DB2。在銀行的交易系統中,可能的高并發請求對于數據庫的穩定性和可用性要求非常高。IBM在軟硬件結合方面做得非常好,DB2數據庫應用與小型機的結合很緊密,在性能方面能夠提供契合銀行應用實際的強大支持。
在談到數據庫開發應用時,唐志剛認為,DB2在核心性能方面很優秀,開發工具的管理和界面只是一個形式。如果能夠提供更加友好和人性化的界面,在開發層面會有一定的好處,開發者的使用會更加方便,在開發速度方面也會有所提升。
唐志剛和隊員王清鋒表示:“DB2的設計理念是非常前端的,未來DB2 應在Purescale集群技術方面進一步完善,產品應該進一步擴展,提供更加開放的數據平臺。在文檔的共享方面希望開放一些底層的內容,也希望DB2能向更多的行業領域擴展。總體來講,IBM的技術理念是非常先進的,已經在適應云計算、大數據等潮流的數據庫發展模式方面開展了很多積極的探索,看好DB2以后的發展?!?/p>
SuperwinningTeam
SuperwinningTeam是第一支進行決賽的參賽隊伍。賽后,來自北京人大金倉的隊長華表示:“這次決賽,我們在題目的準備上還是比較充分的,遺憾的是在PPT的展示和講解的方式上控制得不太好,在時間的控制方面也沒有做好,關注的技術細節太多,一些核心的內容沒有在規定的時間內展示出來?!?/p>
在談到DB2的應用感受時,華認為,DB2目前在數據倉庫整合方面已經做得很好,在數據庫應用性方面與Oracle相比也已經差別不大,只是有一些功能在名稱上有所不同,在一些應用特性上DB2已經超過了Oracle。對于未來DB2的發展,來自AVG的隊員高睿峰表示希望在資料共享以及聯機幫助方面有所改進,目前的資料和文檔范圍太廣泛,如果能進行有針對性的整合,會更便于大家了解和使用。
信總軟件DB2遷移隊
決賽的幾天里,信總軟件DB2遷移隊的隊長柏征和來自濟南市歷城區農業局的隊員王艷一直非常謙虛。決賽結束接受采訪時,他語帶感慨地告訴本報記者,此行收獲非常大。從專家的點評中,他感受到“自己欠缺的知識還有很多”?!耙郧?,我們都是為了完成項目查閱一些資料,獲取資料的形式是‘快餐式’的,只要能解決問題即可?!卑卣鞣Q,通過此次比賽,“我們感覺到了理論的重要性,實踐必須要有理論作支撐,然后再到實踐中去驗證”。
信總軟件DB2遷移隊的遷移方案來自于單位實踐。目前,信總軟件DB2遷移隊隊長柏征所在的單位山東信總計算機軟件開發有限公司的IT系統中,小型機、數據庫和應用產品,都選擇的是IBM。因此,柏征對DB2的應用開發比較了解。但由于單位非常忙,既要做開發,又要做數據庫,甚至還得負責維護,柏征稱他沒有時間對這些產品進行深入研究。由于技術人員缺乏,平時遇到問題,很難像其他參賽團隊那樣,可以討論問題,可以溝通解決方案,只能靠自己。所以,“我們很希望能夠跟其他選手多多溝通,非常珍惜這次跟專家、選手面對面交流的機會”。
CPIC_DB隊
CPIC_DB隊的隊長段家生看起來非常內向,沉默寡言,但是當談到數據庫技術,談到比賽以及能夠和這么多專家面對面,段家生的話匣子一下子打開了,講起來滔滔不絕。他告訴記者,盡管單位數據的量并不是很大,但是DB2的每一個版本,他都應用過。決賽中,他和他的團隊對遷移方案進行了詳細的測試,并且希望IBM后續的DB2版本能幫助他們加快遷移的速度。
段家生還告訴記者,從加快數據庫用戶從Orcale到DB2的遷移速度的角度看,他們希望IBM能夠共享出來更多資料供開發者和數據庫愛好者下載,在不涉及信息泄露的情況下,希望能有針對用戶的更多、更細節的問題說明。比如,一張遷移列表,數據類型是什么,會碰到什么問題,該如何解決等,通過這種分享,幫助用戶建立一個知識庫。
能夠跟專家和其他選手進行交流,是隊員劉朝此行最高興的事情。他告訴記者:“我希望能夠聊一些一線用戶對數據庫本身的要求,例如對大容量、可用性的需求等,希望能夠聽聽專家的意見?!?/p>
SeniorVision隊
SeniorVision隊隊長王翔表示,在實際的工作中涉及到數據庫遷移的實例還是比較多的。這次比賽的感覺明顯與前兩屆不一樣,選擇一個固定行業進行常用的數據庫配置,對于選手的要求更高。“決賽案例設計得非常好。對于我們來說,可以將以前工作中的數據遷移經驗做一個總結:如何以一種可重復的、模塊化的方式進行數據遷移,不僅僅局限于表層的數據遷移,同時還能對不同類型數據庫的特性有更好的理解,在這方面收獲很大?!?基于開放式的環境,DB2的pure xml功能對于大規模的數據交換能夠提供很好的支持。
在談到對未來DB2大賽的期待時,王翔和隊員皇甫鑫霖、趙玉霞表示,希望大賽能沿用現在的思路,不要從純技術的角度考量,而是更多地與企業業務需求相結合,此外還希望在行業的領域方面能打破限制,更加擴寬一些。
啟明3隊
啟明3隊的成員都是共事多年的同事,配合非常默契。在比賽前,他們堅信這是他們獲勝最有利的籌碼,并且一定能夠沖進三甲。但是,從決賽賽場出來,隊長劉文斌很久都沒能回過神來,始終沉浸在比賽中。他告訴本報記者,因為比較緊張,所以一些問題沒有回答得很好,評委的反應不是很熱烈,感覺有點遺憾,對于回答情況的好壞,他們心里也沒底。
不過,劉文斌和隊員楊立影、鄭偉稱,這次比賽的北京之行,“主要是非常希望能有機會跟其他選手交流。在整個比賽中,通過論壇關注其他技術開發人員的關注點,真是開闊了眼界”。另外,在工作中,啟明3隊隊員都曾經應用過DB2,比賽中,更感受到了它在穩定性方面的表現非常突出,并具有資源配置的靈活性。通過這次比賽,他們重新學習了數據庫相關知識,知識面得到了擴充。劉文斌稱:“我們感受到這個行業發展的迅速,有許多先進的DB2技術將越來越多地應用到我們以后的實踐中去?!?/p>
Zolinn隊
賽后,隊員張春林表示,題目在設計上非常貼合實際。從應用層面看,DB2在數據倉庫平臺上有很大的優勢,其架構更適合于大規模的數據處理。在實際應用中,有一些用戶使用的是混合的數據庫環境,這可能是出于平衡的考慮,不希望將數據庫應用限制在一個平臺上,因此從實際操作的角度看,基于不同數據庫的遷移案例也非常多。DB2在運維管理上有一些獨到的特點,它的壓縮功能能夠減少磁盤空間的占用。在實際的測試過程中,DB2對CPU等資源的消耗相比于其他數據庫也有優勢。從管理角度看,DB2提供的工具比較多,用戶在實際使用上有一點不太適應。工具的重合度比較高。如果能整合工具,修改界面風格,用戶的體驗會更好。在事務處理性能,包括可視化的監控等方面,希望DB2提供一些基于內核的改進,這些方面有改進和提高的余地。
隊長李寧寧認為,DB2的purescale機制具有更高的可靠性,是一個比較高端的應用方向和思路,適合于大規模的數據處理。未來希望IBM能更加開放,為開源、大數據等趨勢提供更多適應性的方案。
DataBaser隊
篇2
隨著大數據在醫療與生命科學研究過程中的廣泛應用和不斷擴展,其數量之大和種類之多令人難以置信。比如,一個CT圖像含有大約150MB的數據,而一個基因組序列文件大小約為750MB, 一個標準的病理圖則大得多,接近5 GB。如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院或一個中等規模制藥企業就可以生成和累積達數個TB甚至數個PB級的結構化和非結構化數據。
在中國,2010年,國家公布的“十二五”規劃中指出要重點建設國家級、省級和地市級三級衛生信息平臺,建設電子檔案和電子病歷兩個基礎數據庫等諸項目標,也就是推進醫療信息化的“3521”工程。
過去由于缺少統一的電子病歷系統(EMR)標準,中國的電子病歷系統發展比較緩慢,醫院之間不能實現病患信息共享,醫療服務水平也因此受到影響。
為改善這一現狀,國家會逐漸加大對電子病歷的投入。適應這一趨勢,各級醫院也將加大在數據中心、IT外包等領域的投入。而隨著醫療信息數據的幾何倍數增長,醫院信息存儲將越來越受到重視,醫療信息中心的關注點也將由傳統計算領域轉移到存儲領域上來。
有弊就有利
對于許多醫療和生命科學機構而言,努力控制大數據造成的呈螺旋上漲的成本、復雜性和風險已經成為一個至關重要的問題。然而,從另一個角度來看,醫療大數據能夠帶來的收益要遠遠超出管理它們的成本,如開放新的具有醫療價值的信息源,提高診斷準確性和速度,預測疾病和健康形態,以及取得生命科學創新的不同見解。美國管理咨詢公司麥肯錫全球研究院(MGI)預測,如果美國的醫療行業能夠有效利用不斷增長的大數據來提高效率和質量,那么每年可創造超過3000億美元的額外價值。而且,在歐洲的發達國家中,僅在提高運行效率一項上,政府行政管理部門就可以利用大數據節省1000億歐元以上的費用。
任何事物都有兩面性。醫療大數據的確對數據管理、存儲、分布和保護等諸多方面形成挑戰。但是,對于大多數成功的醫療機構來說,利用大數據已經成為提高生產力、改進護理水平、增強競爭力、加快增長和創新的關鍵策略。那么,我們該如何在兩方面進行平衡,實現可觀的效果和利潤呢?
答案存在于數據經濟學中,即如何使從數據中獲取價值的成本低于數據能產生的效益。如果我們能夠有效地將數據存儲、處理和保護成本降至極低,然后利用尖端技術將數據轉化成支持臨床需要與業務增長的可執行信息,我們就能實現極高的數據經濟效益。
醫療大數據的挑戰
然而,如何有效地將大數據存儲成本降至最低,是企業和IT領導者,尤其是內容驅動的醫療和生命科學企業面臨的根本性挑戰。因為除了數據數量和形態的迅速增加,醫療數據還需要越來越長的保留期?;颊叩牟v可能需要保存70或80年,甚至更長。許多情況下,病歷還必須以原始格式永久保存,以滿足法規遵從的要求。同樣,生命科學研究機構有選擇性地選擇價值足以保留和維護數十年的數據,以期為新研究提供依據。
另外,許多醫療與生命科學研究機構在竭力應對資源緊張、持續的業務增長和新醫療技術帶來的挑戰。不斷變化的外部環境常常造成醫療機構存儲架構的無序擴張,多種系統和工具并存,使得管理變得更加復雜。
事實上,存儲消費速度加快,存儲資產未得到充分利用,對空間的持續需求以及動力和冷卻成本的增加,都推動了總體擁有成本的不斷攀升。而且,一旦存儲系統的安全性出現問題,導致醫療數據丟失,醫院會面臨更嚴重的局面。對于研究機構來說,數據存取是創新和競爭力的核心。這樣看來,文件數據不斷增長導致的管理成本提升被認為是當今全球著名公司面臨的五大難題之一,這種結論就不足為奇了。
醫療行業大數據理想基礎架構
要實現高額數據經濟效益,關鍵是能夠對包括結構性數據和非結構性數據在內的所有醫療大數據進行集成,實現集中管理和更好的資源配置。
為了整合醫院不同部門或不同生命科學系統的大數據,實現充分的信息搜索和共享,理想的存儲架構必須是一個適用于塊數據、文件和內容的集成系統,并且擁有強大的容量、性能和吞吐量,在處理、移動和訪問多個大型數據集和大量數據(數量常常達到數個TB甚至是PB)時能夠保持運行的一致性。為了盡量降低存儲成本并滿足臨床業務需要,理想的存儲架構還必須支持臨床創新的數據互操作性,必須能夠實現智能分層,根據訪問頻率、臨床價值和實際存儲成本自動完成數據分布。這種動態分層功能有助于進一步提高容量利用和資源配置水平,從而全面優化存儲資源的成本效率。
此外,醫療與生命科學研究機構要求大量的存儲空間和動態擴展能力,以便處理不斷增長但無法預測的數據和圖像,以達到高水平的合規性要求,保證遵從關于數據長期保留、完整性和數據保護的政策。最重要的是,一個適當的存儲系統必須具有內容感知能力,能夠將數據轉化為可執行信息。
內容感知是指動態地進行信息分類并為非結構化數據文件分配策略,將非結構化數據轉化為有價值的信息,從而能夠采用最佳方式,更快進行決策并保護公司敏感數據。
HDS文件和內容解決方案
HDS文件和內容解決方案由Hitachi Content Platform、Hitachi NAS Platform、Hitachi Data Discovery Suite 以及Hitachi Data Ingestor組成,可以滿足在醫療和生命科學研究領域中存儲、管理、保護和搜索各類數據嚴苛的要求,無論這些數據是PDF文件、醫學影像還是病患人口數據。另外,Hitachi Clinical Repository(HCR)為管理業務和健康數據、固定內容和圖像,應對DICOM/HL7數據讀取、數據整合、數據挖掘和數據分布這些獨特挑戰而設計的。它由Hitachi Content Platform(HCP)和DICOM/HL7網關組成,可基于HDS平臺、客戶解決方案或合作伙伴的應用平臺使用。這些解決方案所具有的獨特功能包括:
集成存儲 ——文件、內容和塊服務在單一管理界面中融合。通過跨平臺創建存儲池和利用虛擬化,客戶可以簡化管理,提高利用水平,并恢復或延長現有資產的使用壽命。
智能分層——動態分層存儲架構通過預定義存儲層、數據索引和制定自動將數據遷移到對應層的策略,管理基于文件的數據(如PDF文件或醫學影像)。通過自動將活躍數據遷移到適當的平臺,你可以優化磁盤要求(例如在低成本的SATA硬盤里存儲更多數據,同時減少在費用高昂的光纖通道、SAS或固態硬盤(SSD)上存儲數據)。這一策略根據精確的業務運行需求管理內容,不僅使文件和內容存儲更有效、更加智能化,還提高了整個存儲系統的成本效率。
存儲優化——動態分層使閑置容量可以輕松得到再利用,重新確定現有資產用途以延長使用壽命,并自動將非活躍數據遷移到具有復制功能的內容倉庫。這使容量效率和利用率達到極大化,同時可以減少備份卷,并且能夠優化存儲資產的投資回報率。
內容感知搜索———本地自動感知能力可以識別所存儲數據的相關性。對使用單一接口的多種資源還可以進行聯合查詢,以便搜索數據并提供索引。內容感知搜索實現了文件和內容服務的真正同化,以滿足法律監管和企業要求,并可以管理內容引發的遷移和其他整體數據活動。
低成本存儲———通過集中建立存儲池、跨系統智能擴展和利用動態分層自動完成數據遷移,減少管理節點,提高存儲資產的使用經濟效率,也降低了對硬件的要求。管理、備份、容量規劃、動力和冷卻成本隨之降低,這些使固定資本(CAPEX)和運營成本(OPEX)都大大降低。事實上,已經有數據證明,HDS文件和內容解決方案可以極大地降低管理成本和備份成本。
邊緣到核心存儲———中心醫院還可以選擇為偏遠的醫療中心提供無縫的邊緣到核心的數據訪問支持,增強臨床醫師間的協作,通過進行有效控制來實現免備份存儲。
HDS文件和內容解決方案——旨在幫助相關機構管控好大數據環境,利用統一、可擴展的管理平臺簡化大數據存儲的復雜性,整合資源促進利用,調動數據以滿足業務需求,改進數據保護以提高合規性水平并降低風險。
篇3
想象一下在線零售商,當購物者在自己的移動設備上瀏覽頁面時,他們可以通過限時搶購以及推薦類似的產品來替代售罄產品的方式來實現快速銷售;他們還能夠實時跟蹤正在銷售的產品,通過讓顧客看到哪些產品是真正可供購買的,從而為顧客提供了更好的客戶體驗。
這些技術的好處顯而易見,那么,為什么現實中真正能把信息實時轉化為業務優勢的企業并不多?因為大數據環境是非常復雜的,企業面臨來自多個實例、多種工具和傳統數據庫的挑戰。所有這些都將增加復雜性和成本,并難以持續獲取他們所需要的數據。
內存計算就是其中之一,內存計算正在迅速改變企業處理數據的方式。它使用直連內存來代替磁盤存儲數據,這意味著在復雜海量的數據集上查詢數據的過程中, CPU指令更少、查找速度更快,性能也大幅提高。過去,處理這些數據需要花費數小時或數天,而今只需幾分鐘甚至幾秒鐘。業務負責人可以基于實時信息更快地做出決策,IT部門能夠快速地提供分析和洞察,而不會影響其當前的日常運營。數據庫管理人員花費更少的時間來遷移和管理數據,并擁有更多的時間對其進行分析。
例如,SAP HANA利用內存計算技術的優勢來實現實時訪問數據。它還提供了一個跨越企業中整個SAP環境的通用平臺,以簡化數據存儲、管理和分析。企業可以從SAP環境中獲取更快的實時洞察并做出更好的業務決策。
雖然很多企業希望以這種方式改變IT,但要想實現更快的數據分析、一個更可擴展的數據倉庫和把所有業務應用遷移到一個底層數據庫的能力,還有很長的路要走。因為企業IT環境很可能充滿了復雜和彼此孤立的傳統數據庫。為了實現業務目標,它所需要的不僅僅是內存計算軟件。
至關重要的是,企業的IT基礎架構必須正確匹配所選擇的內存數據管理軟件。這就是為什么越來越多的IT經理和管理人員都在數據中心和數據管理平臺方面進行長期的戰略性風險投資。企業需要制定正確的戰略和交付模式,并找到適當的合作伙伴,以在部署過程中最大限度地降低風險和對數據中心的破壞,并隨著數據增長而擴大規模,同時保持高性能。
以下是企業在制定戰略遷移計劃時三個要考慮的問題。
問題1 :服務水平
該解決方案能夠提供關鍵業務的功能和端到端的服務和支持嗎 ?
當企業要遷移到更高級的工作負載時,一般是因為有更高級的關鍵業務需求,通常是要求在高端Unix系統上才能看到的性能,包括容錯架構、極高的I/O帶寬、自愈分析和自動化。要確保系統達到這樣的性能要求,以最大限度地降低停機時間并盡快進行災難恢復。例如,硬分區技術顯著地提高了系統的可靠性和靈活性。每個硬分區都有自己獨立的CPU、內存和I/O資源,它們都是構成該分區刀片的一部分。它們通過一個容錯交叉開關被綁定在一起。因此,該系統中任何一個部件的故障不會影響系統的其余部分。在靈活性方面,這些分區使您能夠在一個系統上運行CRM、ERP和數據倉庫等解決方案――這是打造 “實時”企業的關鍵一步。
即使擁有內置的關鍵業務性能,企業也最好為系統添加實現快速部署、順利遷移和業務連續性的端到端的服務。數據管理需要7×24全天候的支持,以便能夠主動預防問題、最大限度地提高系統性能,并提升解決問題的速度。
問題2:性能和規模
該解決方案能夠滿足我的需求嗎?
為了充分利用企業的內存數據管理環境,還需要能夠滿足高性能和高可用性等內存計算需求的、專為應用而優化的系統。這些系統應該具有可擴展的架構設計,輕松實現可擴展性,以保護企業目前的投資并根據未來的需求進行擴展。行業標準是可擴展到6TB。但如果您想真正發揮HANA的性能,例如在您的最大的商業應用環境中,不超過4TB或6TB的內存計算并不能滿足您的需求。通常許多大型系統是在20TB或30TB的數據庫上運行的。當企業開啟大數據之旅時,請確保您擁有足夠的可擴展性來應對數據倉庫環境。
另外,請記住,不同內存之間也是有很大區別的。有些廠商把內存硬塞到硬件之中,造成可用內存的極大消耗。請確保系統擁有能夠容納更高RAM的高級芯片。這樣一來,您將能夠高效地使用擴展的存儲空間,并維持較高的性能。
問題3:安全投資
該解決方案將會允許我的內存數據管理環境在整個公司里成長和加強嗎?
讓我們面對現實吧!把企業業務應用遷移到內存數據管理環境既不容易,也不便宜。但是,與繼續運行反應緩慢和彼此孤立的數據庫相比,它更具有成本效益。它必將更快地為企業創造價值。
但是,我們還要注意另外一方面。擁有一個值得信賴、經驗豐富的合作伙伴會增加成功率。我們需要一個在部署這類環境方面擁有豐富經驗的供應商;需要一個與SAP、微軟或其他大數據軟件廠商擁有穩固合作關系的廠商;需要一個已經通過認證的平臺和業已證明的基準性能,這個系統還要擁有企業所選擇的供應商預認證的組件。你希望能看到部署和實現內存數據管理環境的多種交付模式 (如內部部署、云服務和托管解決方案),以確定哪種模式最適合企業業務需求。
篇4
高端磁盤陣列2.6倍性能提升 11月6日,在成都首發的高端企業級磁盤陣列 DS8700,標志著DS8000家族的又一個飛躍。最新的DS8700采用了POWER6芯片,不但可實現2.6倍的性能提升,同時也是業內首款配備了LPAR 技術的存儲系統,實現存儲資源動態調配,其容量可擴展至PB級,成為用戶從容迎接海量數據時代、架構智慧信息架構的重要勢能。
“業務無中斷”、“全應用導向”災備 區別于局部災備能力,IBM系統與科技部大中華區系統存儲部總經理侯淼表示,IBM將災備作為整合價值發力點,從用戶的需求和IT基礎架構出發,整合存儲、計算、數據庫、應用、網絡等各個層次,定制“全應用導向整合災備方案”。與此同時,還為用戶提供多種業務連續性解決方案Live Demo――光纖鏈路兩地三中心方案容災、異構平臺容災、本地高可用容災、分支機構容災解決方案、數據級容災、異地 IP 容災等多種解決方案,從而讓用戶獲得“業務無中斷”、“全應用導向”整合災備理念的實景體驗。
企業存儲私有云直入“云”端”最新推出的“IBM 智慧業務存儲云”是一款企業級私有云解決方案,不但可以高性能支持 PB 級數據存儲,還全面支持標準文件協議,開拓了真正意義上的橫向擴展集群模型,幫用戶實現“無論信息存儲何處,均可滿足對云內信息的無縫訪問?!?/p>
“智能分級存儲”與“混合工作負載自動化” 通過配置固態硬盤與業界領先的邏輯子卷的自動化管理,IBM將信息根據策略自動分置在不同的存儲介質,自動化分級存儲、遷移熱點數據,自動化分配不同性質的存取壓力,讓業務響應時間提高 3倍,從而實現“智能分級存儲”與“混合工作負載自動化”創新性解決方案,讓用戶大規模降低存儲成本。
篇5
關鍵詞:大數據平臺;電網統一數據中心;全業務;數據分析域
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)34-0015-03
稻莘治鲇蚴僑業務、全類型、全時間維度電網數據的匯集中心,是為電網公司各類分析決策類應用提供完備的數據資源、高效的分析計算能力及統一的運行環境,改變過去分析型應用數據反復提取、冗余存儲的局面,實現“搬數據”向“搬計算”的轉變,支撐企業級數據分析應用的全面開展。
1 電網全業務數據分析域平臺的作用
基于大數據平臺的電網全業務數據分析域主要完成ERP、生產、營銷、調度等核心業務系統數據的提取清洗、實時采集類、分析決策類相關應用遷移遷移改造;完成統一數據模型及主數據標準驗證;完成統一分析服務建設等工作,建成全業務統一數據分析域。
2 電網全業務數據分析域平臺接入的業務數據
2.1內部業務系統數據接入
基于電網公司總部數據字典統一梳理成果,以業務系統實際情況,結合統一數據分析服務、采集監測與分析決策等問題,遵循統一數據集成接口規范,統一數據模型(SG-CIM3.0、數據倉庫模型),梳理ERP、財務管控、營銷業務、營銷稽查監控系統、營銷檔案管理、營銷移動作業、一體化繳費接入管理、PMS2.0、OMS、電能質量在線監測、資產全壽命、省級計量中心生產調度、供電電壓自動采集、科技與信息化項目管理、項目過程管理、電力市場交易、IMS、TMS、電動汽車智能、干部管理、信息客戶服務管理、應急預案管理、車輛調度管理、經濟法律、輸變電GPMS、雙流雙控等業務系統,全量接入數據分析域,對于不符合SG-CIM3.0及主數據標準的相關業務數據進行清洗轉換,完成數據流轉至數據倉庫的接口開發,為各類分析應用的實現提供完備的數據資源。
2.2外部數據統一采集
基于大數據平臺,根據大數據分析應用業務,完成經濟、氣象、征信等外部數據采集。
3 電網全業務數據分析域平臺分析服務功能設計
3.1統一分析服務
基于統一分析服務功能,開展低電壓實時監測、負荷預測及防竊電分析、配網故障量監測分析、臨時用電超期未辦理合規性監測場景四個應用建設。
3.1.1配電網低電壓實時監測
配網低電壓監測主要針對目前電網設備發生低電壓的程度,從低電壓臺區和低電壓用戶兩個方面監測低電壓的場景研發。運用數據分析域上多源異構數據集成等數據存儲技術,實時計算技術,統計分析出低電壓的區域分布情況、涉及臺區情況、低電壓出現頻率等,及時將發現的問題通知到相關部門,由相關部門對低電壓臺區或用戶進行現場核實,查找出詳細原因,提出改造措施,消除低電壓情況。
3.1.2用戶側負荷預測及竊電行為分析場景
用戶側負荷預測及竊電行為分析功能可以提取客戶信息、用電量信息、用電負荷、事件異常等數據,從用電概況、負荷預測分析、負荷特性分析、防竊電預警分析等方面,選取相關性最高的影響因素,利用數據挖掘算法構建負荷預測模型、負荷特性分析模型、防竊電預警模型。
3.1.3配網設備狀態監測分析場景
通過提取設備臺賬、用電負荷、用戶檔案等數據,從配變設備基本概況、配變故障量預測分析及配變重過載的深化研究等方面,選取相關性最高的影響因素,利用數據挖掘算法構建故障量預測模型、農網配變重過載預測模型、迎峰度冬重過載預測模型實現配網設備狀態監測分析場景。
3.1.4臨時用電超期未辦理合規性監測
通過提取臨時用電數據,從“退費條件后是否按時退費給用戶”和“轉收入條件后是否按時進行轉收入”兩個維度,按單位、按月、按異動項目類型,總體展示臨時接電用戶目前總體情況及明細數據,并通過提醒、告警等方式監測各單位未及時退費項目、未及時轉收入項目的情況,提醒相關人員及時處理,避免造成的合同糾紛或企業損失,有效提升公司臨時用電業務合法性、合規性。
3.2采集監測與分析決策類應用遷移改造
3.2.1用電信息采集系統遷移改造
采用分布式消息隊列+分布式流計算方式,完成用電信息采集數據訪問接口的設計開發,實時同步用電信息采集數據,并基于大數據平臺,實現實時采集數據的統一對外共享,為用電信息采集系統前端應用及營銷業務、生產管理等系統,提供統一、高效的采集數據訪問服提升用電信息采集數據的共享服務能力。
3.2.2輸變電在線監測系統遷移改造
通過輸變電狀態監測數據在線計算、離線計算等程序設計研發,同時完成數據訪問接口的設計研發,實現輸變電狀態監測信息的采集和在線處理,為輸變電設備狀態監測提供靈活可擴展的數據存儲和分析能力,實現通過大數據平臺,統一對外提供高效的輸變電設備狀態采集數據服務。
3.2.3同期線損系統遷移改造
基于數據分析域,通過分析線損系統現有大數據計算框架與大數據平臺技術路線的差異,開展同期線損系統中電量與線損大數據計算區功能融入大數據平臺的研究及開發,將線損系統Cassandra存儲改為HBase存儲,對已實現的電量與線損分布式計算服務和提供的電量與線損結果查詢服務接口進行改造,完成同期線損遷移改造方案、存儲模型設計,實現線損相關存儲、計算組件的遷移改造及數據遷移。
3.2.4配電網運營分析應用遷移改造
利用大數據平臺,結合用電信息采集數據遷移,完成配電網運營分析應用優化改造,優化并提升數據提取、傳輸以及單體設備計算能力。結合配電網運營分析應用的數據模型成果,基于大數據平成數據緩沖表、接口表/中間表、計算結果表的模型設計。根據PMS、營銷、調度等數據接入需求,基于大數據平臺,完成PMS2.0、營銷業務系統檔案數據定期同步接口開發,完成調度數據采集及解析程序開發。
3.3統一數據模型與主數據標準驗證
基于統一數據模型設計成果,在數據分析域上驗證數據倉庫模型。結合數據提取清洗及統一分析服務建設需求,開展人員組織、財務、物資、項目、電網、資產、客戶等主題域的數據模型的差異性比對,對數據倉庫模型進行完善及優化。將數據倉庫模型部署至數據分析域中,并按不同業務域模型規范將ODS的數據存放至數據倉庫中,支撐分析應用場景建設。
4 電網全業務數據分析域平臺技術架構
根據統一數據中心總體架構設計,數據分析域是全業務、全類型、全時間維度數據的匯集中心,是為各類分析決策類應用提供完備的數據資源、高效的分析計算能力及統一的運行環境,改變過去分析型應用數據反復提取、冗余存儲的局面,實現“搬數據”向“搬計算”的轉變,支撐企業級數據分析應用的全面開展。
根據統一數據中心數據分析域總體架構要求,結合電力數據中心、大數據平臺的實際建設情況,設計電力數據分析域系統架構,包括數據接入、數據存儲、數據計算、統一分析服務、系統管理等5個層次。
平臺通過分布式消息隊列、ETL、Sqoop、API等各種技術手段,提取結構化非實時數據、實時數據、外部數據,對各類數據按照統一數據規范進行標準化及關聯,并按不同時效性的計算及應用需求,分類進行數據存儲、流轉及管理。
5 電網全業務數據分析域平臺采用的開發技術
數據分析域的數據抽方面取采用大數據平臺數據加載工具(基于Sqoop優化封裝)+文件導入方式。業務系統存量數據接入ODS區,涉及業務系統數據提取至緩沖區、緩沖區數據提取至統一視圖區。
大數據平臺數據加載組件,基于Sqoop工具優化封裝,支持關系型數據庫與大數據平臺中的分布式數據庫之間的數據提取。對于ODS數據加載至數據倉庫/數據集市,采用大數據平臺中的數據加載組件(基于Sqoop優化封裝)。對于ODS緩沖區、ODS視圖區、數據倉庫、數據集市之間的數據清洗轉換,采用大數據平臺數據提取組件(基于Kettle優化封裝)實現。提取工具(基于Kettle優化封裝)基礎功能包括數據獲取、數據清洗轉換、數據加載、任務管理等,支持內部所有異構系統、多數據類型、不同數據提取方式的數據采集,對多種數據庫、套裝軟件、封閉式主機、EAI軟件、文本等數據批量提取,實現對數據高效提取、傳輸和分發,滿足對數據提取和數據清洗功能。
電信息等實時類數據采集,采用大數據平臺消息隊列組件(基于Kafka優化封裝)+流計算組件(基于Storm優化封裝),實現生產實時數據的高效采集、計算和存儲。消息隊列組件(基于Kafka優化封裝)用于接收來自前端不同實時源的數據,后端則采用流計算組件(基于Storm優化封裝)技術對實時數據進行保存及分析。
外部數據采集主要有3種模式,一是線下手工采集,然后文件導入大數據平臺;二是通過外部接口采集;三是通過數據爬取程序采集。
數據倉庫存采用基于Hadoop HIVE+Impala組件優化封裝的分布式數據倉庫,存放按業務主題進行劃分、歸類的歷史數據。數據集市的數據由數據倉庫的數據經過轉換后形成,直接支撐前端的應用需求。數據集市,采用基于開源PostgreSQL優化封裝的分布式關系型數據庫。在數據集市應用中,對于實時性要求不高的結果數據查詢,將通過訪問PostgreSQL實現;對于實時性要求高的即時查詢應用,則直接通過Impala訪問HIVE的明細數據。
面向海量規模的實時采集類數據,采用基于Hadoop Hbase優化封裝,Hbase是基于Hadoop的NoSQL大數據平臺分布式列式數據庫作為存儲媒介。為大數據提供實時的讀/寫操作,能夠利用HDFS的分布式處理模式,并通過MapReduce獲取強大的離線處理或批量處理能力,同時能夠融合key/value存儲模式,以實現實時查詢能力。熱點數據存儲在基于Redis優化封裝的大數據平臺內存數據庫中,以供快速讀取、應用。
分析服務,采用大數據平臺自助式分析工具。大數據平臺自助式分析工具提供易用、快速、靈活的可視化設計器和豐富多樣化的可視化控件,結合數據建模的數據主題和數據挖掘的業務挖掘模型,業務人員可自定義配置分析界面。
數據分析域的系統管理,采用數據管理服務平臺實現,根據各類擴展需求,對數據管理服務平臺進行增強開發,以適應統一數據中心分析域的系統管理要求。
6 結束語
通過對大數據技術的研究和應用,開發部署電網統一數據中心全業務數據分析域平臺,能夠有效支撐電網配、變、過載、預警、分析等場景應用,為數據分析人員提供數據挖掘模型構建能力,滿足電網各類業務應用的大數據分析、挖掘需求。
參考文獻:
[1] 波,陳乾,眭建新.基于大數據技術的電網運營分析決策系統研究[J].電力信息與通信技術,2015,13(8):128-131.
[2] 王忻.基于大數據技術的電力公司運營系統研究[J].商,2016(4):214-214.
[3] 趙云山,劉煥煥.大數據技術在電力行業的應用研究[J].電力行業信息化年會,2013(30):57-62.
[4] 段軍紅,張乃丹,趙博,閆曉斌.電力大數據基礎體系架構與應用研究[J].電力信息與通信技術,2015,13(2):92-95.
[5] 刁柏青,步萬峰.構建集中統一的電網集團數據中心[J].電力信息與通信技術,2004,2(10):57-59.
[6] 姚強,楊志武.基于集中數據中心的統一數據平臺建設分析[J].內蒙古電力技術,2010,28(3):3-5.
篇6
今年是葉成輝提出的EMC中國第二個五年計劃的具有轉折性意義的一年,EMC不僅要鞏固第二平臺這個主戰場,而且要向第三平臺這個新市場進行平滑轉型,即從傳統數據中心市場過渡到軟件定義的數據中心市場。如何在轉型中繼續保持增長?EMC不僅需要更多勇氣,而且需要更多智慧和技巧。
增長,還是增長
2012年,IDC提出了“第三平臺”概念。第三平臺建立在移動設備、云服務、社交網絡和大數據分析的基礎之上,代表了ICT的發展方向。與以大型機為代表的第一平臺、以客戶機/服務器為核心的第二平臺相比,第三平臺帶來了顛覆性的變革,企業、數據中心、IT應用與管理都將被軟件重新定義。在這場變革的洪流之中,葉成輝表示,EMC也要重新定義(Redefine)自己。
EMC目前正處于從第二平臺向第三平臺轉型的過程之中。其實,第二平臺與第三平臺之間的界線并不是那么絕對,不是說第二平臺關注的是結構化數據,而第三平臺關注的是非結構化數據。未來,像特斯拉智能汽車、工業互聯網、可穿戴設備等這樣的新應用會越來越多,并部署在第三平臺之上,但仍然會有很多應用部署在第二平臺之上。EMC的獨特能力體現在,它可以通過軟件定義的方式,在同一個控制層面管理第二平臺和第三平臺兩種架構。
葉成輝表示,轉型需要一個過程,而且第二平臺和第三平臺將在很長一段時間內并存。在中國,這一轉型的過程可能會比美國長。2014年,EMC在中國市場上的發展思路可以概括為“鞏固和擴大傳統數據中心市場份額,引領數據中心向云計算、大數據轉型”。
2013年亮眼的業績證明,EMC在轉向第三平臺的過程中已經開了個好頭。葉成輝將EMC在中國市場上的成功經驗歸納為以下七個方面。
第一,EMC公司整體發展方向清晰,戰略正確。在提供信息基礎架構解決方案的基礎上,EMC通過與VMware、Pivotal、RSA之間形成的穩定“聯邦”,可以為客戶提供符合云計算、大數據需求的解決方案,形成了差異化的競爭優勢。
第二,U2VL,即Unix平臺向Virtual Linux平臺的遷移已經成為大勢所趨,“x86服務器+虛擬化”的云計算模式的興起讓EMC獲得了更大增長空間。
第三,數據中心架構改變,服務器的采購比重下降,而存儲的花費上升,已占到數據中心設備采購量的50%。這對于EMC最核心的存儲業務來說無疑是一個利好因素。
第四,在本地化方面,EMC提前布局,與聯想、富通、長虹佳華、神州數碼等多個本地品牌合作。目前,EMC在中國的OEM合作伙伴已經有7家,它們對于EMC中國業績的提升貢獻頗多。
第五,由于外部環境、企業自身調整等原因,EMC的主要競爭對手業績下滑,這在客觀上給EMC的逆增長提供了可能。
第六,EMC不斷加大在中國二、三線市場的拓展力度。2006年,EMC在中國還只有北京、上海、廣州、深圳四個分公司。從2007年到現在,EMC在中國的分公司又增加了15個,同時來自二、三線市場的收入比例正逐年提高。
第七,EMC總部不斷加大對中國市場的投資力度,比如EMC在中國建立的卓越中心、解決方案中心蓬勃發展,不僅為中國客戶提供了技術和解決方案方面的支持,而且很多新產品都是在中國本地研發的。
轉型要平滑
葉成輝表示:“EMC在第二平臺市場上一直保持著領先地位。在外部存儲、存儲軟件、企業級閃存、備份、融合架構等細分市場上,EMC的市場占有率都保持第一?!钡菑牡诙脚_轉戰第三平臺,EMC還有許多新的戰役要打,比如對象存儲、軟件定義的存儲、下一代文件協作、第三平臺開發工具和分析工具等,都將是EMC重要的突破點。
從第二平臺到第三平臺,這中間需要一座橋梁。對于EMC來說,這座橋梁就是由EMC、VMware、RSA和Pivotal組成的“聯邦”。EMC可以提供軟件定義的存儲,VMware專注于軟件定義的數據中心,Pivotal則關注軟件定義的企業,RSA提供了貫穿整個軟件定義架構的安全保障。這個“聯邦”的穩定、協調發展對于EMC在第三平臺上取得成功至關重要。
EMC公司CEO喬·圖斯曾幾次推遲退休時間,一個很重要的原因就是他要繼續鞏固這個“聯邦”。未來,這個獨特的“聯邦”如何制定和執行統一的戰略;如何找到一種最適合的運營模式,既保持各公司的獨立,又能相互協作;如何實現高度的共識……這些都是喬·圖斯肩負的歷史使命。
為了更好地實現向第三平臺的轉型,EMC加強了收購和自主創新,比如收購了閃存廠商XtreamIO,了軟件定義的存儲平臺ViPR,加強了融合解決方案的推廣等。從IDC公布的數據看,EMC VSPEX和VCE Vblock都占據了各自細分市場的幾乎半壁江山?!拔磥鞥MC的收購重點將集中在第三平臺領域,而軟件定義存儲、大數據、云架構咨詢服務、融合解決方案等將是推廣的重點?!比~成輝透露說,“在今年5月舉行的EMC World大會上,我們將更多第三平臺的產品?!?/p>
葉成輝認為,2014年中國IT市場將回暖,特別是云計算、大數據市場的增長將更加快速。IDC預測,中國公有云市場規模將于2017年達到26.49億美元,而中國企業級移動應用市場也將在2015年達到建設的高峰期。這讓葉成輝有信心帶領中國團隊從第二平臺向第三平臺進行平滑過渡。
從一個存儲硬件廠商慢慢轉變為信息基礎架構解決方案提供商,到今天,EMC順應第三平臺的發展趨勢,積極地向云計算、大數據廠商轉型。葉成輝表示:“EMC從第二平臺走向第三平臺不可能一蹴而就,也不意味著EMC將放棄存儲等原來的核心業務,相反會在原來的基礎之上面向云計算、大數據進行更大膽的創新,提供新的、更全面的解決方案?!?/p>
存儲市場復蘇
不僅IDC預測從2014年起存儲市場將反彈,葉成輝也十分肯定地認為,2014年存儲市場將重新回歸增長的主旋律。去年,在云計算、大數據、移動互聯等新思潮的不斷沖擊下,IT市場乃至整個社會生活都發生了巨變,而許多企業的管理者和決策者在還沒有看清楚未來云計算、大數據的發展方向時,不敢貿然行動,因此在IT投資和建設方面采取了“維穩”的策略。
篇7
美團的數據夢想
美團云(Meituan Open Services, MOS)是美團推出的公有云平臺,致力于為千萬用戶提供最穩定、可靠、高效的基礎設施云服務以及大數據解決方案。2013年5月,美團云正式對外開放計算資源。公有云推出初期就引發了行業內巨大的關注,資源很快售罄。同年7月,美團全業務實現向云平臺的完整遷移和部署。美團云目前全面支撐美團業務,網絡流量已經達到了500T/天,承載超過兩億用戶的高并發訪問量,支持Web端和App端多業務類型,美團云的穩定性、可信性,經過了大規模商業實踐的驗證。
2015年3月,美團云獲得IDC牌照,8月對外開放首個高品質的自建機房。同時,可信云服務大會上,美團云正式通過可信云服務認證,在各項云服務指標的完備性和規范性方面得到了業內的認可,并憑借各項優勢獨攬“電商云服務獎”。目前,美團云的服務范圍覆蓋O2O生活服務提供商、在線教育、知名電商、互聯網金融、智能硬件、新媒體、汽車等。隨著獲得了可信云服務認證,美團云也將繼續依靠強大的技術團隊,不斷優化產品,注重用戶體驗,為更多企業級用戶提供最優的底層架構以及穩定的網絡服務。
據悉,截止到目前,美團的年度活躍買家數達1.3億,合作商家超過160萬戶,預計2015年全年交易額將超過1000億元。
美團龐大的數據量驅動了美團云大數據分析服務的“大夢想”。美團云CTO李爽談到,美團云軟硬一體的解決方案完全基于開源Hadoop解決方案,降低上手成本,萬兆網絡互聯、支持Native Client和Rest API。此外,李爽還介紹了美團云經典BI產品:客戶洞察和在線推薦。客戶洞察通過觀察、了解客戶,將采集到的客戶數據轉化為所需的信息。在線推薦則是在線推薦篩選目標客戶,生成靜態名單、營銷信息和接觸信息。同時,他還舉例了中傳與美團攜手同闖“互聯網+”的例子。最后,李爽總結了美團在大數據方面的經驗,并展示了美團云的數據平臺、業務架構和分析平臺。 “美團云致力為千萬用戶提供穩定的公有云服務及大數據解決方案,通過打造更加穩定、高效和創新活力的新一代公有云平臺,我們很高興和華為在云數據中心網絡領域展開全面和良好的合作,并將雙方的創新成果成功商用。我們期待這些創新能提升網絡運營效率,進一步提升用戶體驗,為我們的客戶創造更多價值!”目前,美團云正在和更多的企業合作,拓展大數據解決方案。”
攜手華為 深耕云計算網絡
隨著美團網云化業務的爆發式增長,網絡規模不斷擴大,如何構建適應未來業務增長的云計算網絡?如何持續提升業務上線效率,縮短上線周期?如何簡化網絡運維,降低運維成本,同時釋放服務器能力?如何保證美團在線業務安全永續運營等幾大問題,成為美團網建設的核心訴求。
“華為與美團在云數據中心網絡領域有著深入且良好的合作,本次美團云成功部署華為敏捷數據中心SDN方案,有效地支撐其戰略及業務的發展需求,在業界也具有重要的里程碑意義?!?華為交換機與企業通信產品線總裁劉少偉表示,“作為全球領先的信息與通信解決方案供應商,華為圍繞客戶的需求持續創新,與合作伙伴開放合作,在企業網絡領域為客戶提供有競爭力的解決方案和服務,持續提升客戶體驗,為客戶創造最大價值?!?/p>
同時,華為企業BG網絡產品總工Mark Wu表示:“此次美團云部署的華為CE12800數據中心交換機以及敏捷控制器Agile Controller,旨在為客戶打造彈性、簡單、開放的云數據中心網絡,讓網絡更敏捷地為業務服務,幫助美團云連接云計算未來?!?/p>
詳細解讀SDN商用網絡
為了構建適應未來業務發展的云計算網絡,實現美團云 “穩定提升價值”的理念目標,美團與華為在SDN領域展開戰略合作,攜手共建面向云數據中心的SDN商用網絡。
■SDN實現租戶網絡自動化,加速美團云業務部署
華為敏捷控制器Agile Controller兼容ODL開放架構,通過3類接口、40個API和美團云深度對接,協同美團云平臺實現業務快速發放,實現了租戶網絡自動化,加速美團云業務部署。
■硬件VXLAN構建多租戶網絡,服務器性能提升2倍
美團云部署華為基于硬件VXLAN方案,把支持租戶的數量由4K擴充到16M,以適應業務爆發式增長;同時通過CloudEngine交換機采用硬件VXLAN構建多租戶網絡,實現租戶間的隔離,服務器性能提升2倍;另外,硬件VXLAN方式支持異構多虛擬計算平臺,相對軟件方式有很好的兼容性。
■端到端業務路徑可視,實現租戶網絡精細化運維
華為Agile Controller敏捷控制器與CloudEngine交換機配合,打破overlay網絡中虛擬網絡的運維黑盒,由Agile Controller構造下發探測報文,網絡轉發節點逐跳上送路徑信息,實現VM層面的轉發路徑可視,物理和虛擬網絡統一運維。
■業界最佳的“雙”平面擴展能力,支撐業務爆發性增長
在控制面,華為Agile Controller敏捷控制器支持業界最大的1:64彈性集群,支持業務無損升級;在轉發面,全球最高性能的CE12800數據中心核心交換機,支持160Tbps交換容量,單線卡支持3.6Tbps的交換能力,是業界水平的3倍;線卡支持100ms超大緩存,滿足大數據業務需求;整機支持平滑演進,滿足美團云數據中心5-10年業務發展需求。
■業界最強的抗攻擊防護方案,保護業務可用性
篇8
浪潮AS10000
在數字圖書館的應用
傳統圖書館作為信息擁有者與提供者的圖書文獻機構,面臨著自動化、數字化、網絡化的挑戰,需要不斷地調整收藏結構和服務方式來適應信息社會的需求。全面實現海量電子圖書資料存儲、分布式信息存取和共享的數字圖書館應運而生。
數字圖書館是用數字技術處理和存儲各種圖文并茂文獻的圖書館,實質上是一種多媒體制作的分布式信息系統。它把各種不同載體、不同地理位置的信息資源用數字技術存儲,以便于跨越區域、面向對象的網絡查詢和傳播。它涉及信息資源加工、存儲、檢索、傳輸和利用的全過程。通俗地說,數字圖書館就是虛擬的、沒有圍墻的圖書館,是基于網絡環境下共建共享的可擴展的知識網絡系統,是超大規模的、分布式的、便于使用的、沒有時空限制的、可以實現跨庫無縫鏈接與智能檢索的知識中心。
數字圖書館需要大量的磁、光、電等新型存儲媒介來存儲文本、圖像、聲音、動畫、影視作品等文獻信息資源的數字化信息。海量數據信息的存儲和管理是數字圖書館的顯著特征之一。明確存儲需求是規劃存儲方案的前提,數字圖書館數據信息資源的種類、數量、性質及用戶利用的方式、用戶的多少等,對分析存儲系統的容量、性能、傳輸速度、可靠性等方面的要求起決定性的作用。
數字圖書館具有系統用戶數量龐大,并發存取海量數據及業務類型多的特點。如何在復雜、多變的環境中提高基礎設施資源的利用率和數據庫用戶訪問效率,確保安全、高效、準確、全面地存取數據,是圖書館存儲方案設計考慮的重點因素。
多種數據信息資源對重要性、安全性、再生性、讀寫性能、更新升級特性及保存時效性等有不同的要求。大文件的連續讀寫、要求帶寬性能高。小文件隨機讀寫,要求處理器的I/O性能,如數字期刊、數字圖書等,這里資源訪問頻率很高,下載流量也比較大,對存儲系統的IOPS要求很高。而采用關系型或非關系型數據庫形式存儲的數據庫資源,是基于塊級的存儲,對這類資源的訪問頻率很高,需要頻繁地傳輸數據塊,因此,也要求存儲系統有較高的讀寫帶寬。對于多媒體資源的訪問頻率雖然不高,但讀寫數據流量非常大,也需要很好的傳輸性能。一個數字圖書館的數據信息種類繁多,形式復雜多樣,數據的重要性程度不一,數據訪問方式各異,因此數據信息的管理難度很高。數字圖書館的服務是全天候不間斷的服務,尤其對那些關鍵數據的安全穩定性有相當高的要求,因此建立一個滿足存儲需求、運行穩定可靠的存儲系統是數字圖書館建設的基本要求。
本方案基于浪潮海量存儲系統AS10000構建數字圖書館業務系統。保存關鍵數據的圖書館自動化管理服務器和數據量增長較快的應用服務器,如鏡像數據服務器、電子圖書服務器、VOD服務器、FTP服務器、資源數據庫服務器等將其接入FC-SAN體系,在保證高速I/O通信帶寬的前提下由AS10000提供海量的數據存儲空間。
浪潮AS10000產品是國內率先研制成功的多控制器和全交換體系結構的存儲系統,使我國在高端存儲領域實現從無到有的零突破,這一創新成果打破了國外廠商長期以來在高端存儲系統方面的市場和技術壟斷地位。AS10000存儲系統采用scale-out橫向擴展的存儲架構,有效保證了存儲系統對于容量、性能的橫向擴展需求,其最大容量支持64PB海量存儲空間;其海量的存儲空間、大規模部署能力,提供了超高的并發訪問能力,聚合帶寬達到60GB/s,可同時支持6000并發訪問,滿足數字圖書館的復雜應用需求。
AS10000產品作為一個款高端存儲系統,其所支持的應用系統要求具備更高的數據可靠性以及存儲設備的可用性,必須在存儲系統的內部實現更多的可靠性設計。為此研究并實現了部件和交換組件的冗余容錯技術,實現了對控制器、磁盤、風扇等物理部件在線維護的支持,采用了多層級的心跳協議、故障監測、故障判斷、故障隔離,實現了對多控制器之間服務自動切換的支持,從而在處理和存儲的控制器層面保證了系統可靠性、可用性、可擴展性,滿足了數字圖書館的可靠性需求。
浪潮AS8000實現統一管理
隨著信息技術的不斷發展,云計算、大數據、虛擬化等技術改變了傳統IT的應用模式,基于虛擬化技術的存儲系統逐漸成為前端復雜應用的支撐平臺。如何保障數據安全,并且將遷移對主機業務的影響降到最低是我們在數據遷移過程中不得不考慮的問題。
數據遷移的方案多種多樣,主要包括以下三種。
(1)基于主機的數據遷移:這種數據遷移模式不依賴于存儲設備品牌、架構,但與操作系統、應用相關,需要在系統和應用層面作大量工作,如果采用第三方軟件,一般需要購買license。除此之外,該種方案會大大占用主機資源,影響業務的正常運轉。
(2)基于存儲設備自身功能的數據遷移:要求遷移的源存儲和目的存儲為同一廠商的同構存儲,需要購買數據復制license,所以該方案局限性大。
(3)磁帶備份/恢復:備份/恢復的數據不但速率慢,需要停機時間長,而且在系統和應用層面的工作量大、可靠性低,該方案適用于小數據量的移植。
以上遷移方案雖然能夠達到最終目的,但是綜合考慮遷移過程復雜性、耗費時間、對業務影響程度等問題,顯然已經不再是我們的首選?;诖鎯μ摂M化技術來實現數據遷移將會帶來更多驚喜。
具有虛擬化功能的存儲系統,在實現后端存儲統一池化管理的基礎上,還可提供透明管理的功能,再結合卷鏡像功能,實現在不影響業務正常運行的情況下,無縫將數據遷移到虛擬化存儲設備中。
篇9
華為IT云計算產品線總裁任志鵬在云計算大會上公布了一組令人振奮的數據:截至2013年6月底,華為云計算已經服務于全球40多個國家和地區的超過250家客戶,覆蓋政府及公共事業、電信、能源、金融、媒資、制造等眾多行業。華為FusionCloud云計算解決方案成了華為“融合”戰略落地的一面旗幟。任志鵬表示:“雖然我們能夠為用戶提供端到端的云計算解決方案,但我們始終堅守一個底線:數據中心基礎架構。”
向大數據領域延展
華為FusionCloud能實現異構硬件資源池的融合,將計算、存儲、網絡融合在一起,并且針對企業IT的不同場景,提供彈性、自動化的基礎設施。華為FusionCloud主要包括三個產品:華為云操作系統FusionSphere,它可以提供完整的水平整合和云化企業異構IT基礎設施的能力,提升企業IT效率和業務敏捷度;華為FusionCube是將計算、存儲和網絡融為一體的一體機解決方案,大幅縮短業務上線時間,并成倍提升系統的性能;華為FusionAccess是一款桌面云軟件,它與FusionSphere以及華為的IT硬件組成了桌面云解決方案。
在本次云計算大會上,華為了企業級大數據分析平臺FusionInsight 1.0,將華為云計算的觸角延伸至大數據領域。FusionInsight 1.0實際上就是一個Hadoop的商業發行版。據任志鵬介紹,FusionInsight是業內首個能夠支持1000km異地容災的大數據分析平臺,通過對企業內部和外部的海量信息進行實時和非實時的分析挖掘,可幫助企業發現新的價值點和商機?;贔usionInsight 1.0,華為已經開發出針對金融和電信客戶的解決方案,針對其他行業的解決方案正在研發之中。
鍛造云操作系統
FusionSphere云操作系統是華為FusionCloud云計算解決方案的基礎與核心。據任志鵬透露,全球已有超過50萬個虛擬機(VM)運行在華為FusionSphere平臺之上。華為FusionSphere除了具有高可靠、高性能等特征以外,其最大的特色就是開放性,比如FusionSphere可以管理不同廠商的虛擬機。
在本次云計算大會上,華為宣布FusionSphere已升級至3.0版。在FusionSphere的研發上,華為與英特爾展開了深入合作,比如在性能方面,FusionSphere通過英特爾NUMA技術實現了虛擬機內存訪問效率及虛擬機性能的有效提升,在SPECvirt_sc2010測試中獲得了4687分的優異成績;在可靠性方面,華為與英特爾合作開發的COLO方案作為FusionSphere的Fault Tolerance (容錯)技術,可支持單核和多核CPU的虛擬機熱備,同時減少主備同步的開銷及性能開銷,提升了系統的可靠性及恢復能力;在兼容性方面,華為利用英特爾FlexMigrate技術可以在同廠商不同型號的CPU之間實現虛擬機的異構熱遷移。
在本次云計算大會上,華為推出了FusionCube 2.0。任志鵬表示:“FusionCube 2.0是將計算、存儲、網絡、管理深度融合的云基礎設施一體機,它大大縮短了部署時間,采用分布式存儲技術,可以有效消除I/O性能瓶頸,其處理能力超傳統小型機10倍,堪稱最佳的小型機替換平臺。”
篇10
這三家看似毫無關聯的廠商,卻被英特爾投資聯系到了一起,他們惟一的共同點是云計算。
2014年2月18日,作為英特爾公司的全球投資與收購兼并機構,英特爾投資高調宣布,注資上海一鋪信息科技有限公司,并與天津中科藍鯨信息技術有限公司及無錫華云數據技術服務有限公司簽署注資協議。
“英特爾投資希望通過這些新投資項目,進一步推動本土云計算及大數據的技術與商業創新?!庇⑻貭柾顿Y中國區董事總經理許盛淵表示,在2014年,英特爾投資的重點將圍繞云計算、大數據、物聯網、移動計算及可穿戴設備等領域――這無疑為無數初創企業帶來了福音。
深入生態鏈
近年來,無論是行業還是資本市場都非常關注云計算企業。在IDC預測的2014年9大賺錢科技趨勢中,云計算仍然榜上有名。根據IDC預計,2014年全球云計算開支將達到1000億美元,相比2013年增幅超過25%;大數據技術和服務也將在2014年實現30%的高速增長,總額超過140億美元。
高增長前景和廣闊的市場,使各種新興云計算企業成為英特爾、微軟這等大佬競相爭搶的對象,無論是英特爾云計算創新中心,還是微軟云加速器,都意在扶植各自的中國創新生態鏈。而英特爾投資便充當了英特爾公司的耳和眼。
進入中國15年,英特爾投資已經向超過110家中國公司投資了超過6.7億美金,不僅有力推動了本土市場的成長,也在完善生態系統建設、助推產業變革中扮演了推動者的角色。2013年,英特爾投資被多家機構評為的全球第一機構投資者(Corporate VC),而在國內的風險投資基金中,英特爾投資也名列前茅。
在許盛淵看來,中科藍鯨和華云數據都是云計算領域的優先代表,在云計算行業中扮演著重要的角色,而上海一鋪科技在大數據、移動互聯網以及移動互聯網銷售解決方案領域有著豐富的經驗。“除了資金的支持,我們也會找其他的方法幫助被投資公司的發展,例如技術和市場的支持?!痹S盛淵說。而英特爾中國云計算創新中心就是最好的資源。
2013年4月,英特爾全球首個云計算創新中心落戶中國北京。在這里,英特爾工程師將幫助合作伙伴驗證和優化其解決方案,與軟硬件開發商合作伙伴一起加速云計算、大數據解決方案相關的創新和實施進程?!叭绻麑⒃朴嬎闫髽I比喻成造車的,我們則打造了一條最高科技的賽道。云計算創新中心整合了基于英特爾架構的最先進IT技術和解決方案,代表了英特爾乃至整個行業的最高技術水平。”英特爾中國數據中心及云計算業務產品市場總監賀曉東介紹。
拉動市場需求
借助于云與大數據的生態系統,英特爾近幾年在數據中心領域實現了跨越式的高速增長。根據英特爾公司2013年度財報顯示,其2013全年收入達527億美元,其中凈收入96億美元。這很大一部分歸功于英特爾芯片所覆蓋的廣泛計算平臺。
IDC數據顯示,大數據技術和服務市場的規模將于2017年達到324億美元,這一增長的主要驅動力便來自于構成物聯網的聯網設備所產生的海量數據。據估計,到2020年,聯網設備的數量將會增加到300億臺。
有數據、有計算的地方就有英特爾。作為貫穿大數據裂變各個環節的廠商,無論是數據產生和采集的設備、數據分析和處理的過程,以及數據應用的場景,為了適應對計算能力越來越高的要求,英特爾也在做著轉變。
上海一鋪、中科藍鯨和華云數據這三家公司之間的聯系,不僅是云計算、大數據,他們可能會發生更深層次的化學作用。而在被英特爾投資相中的其他公司中,也不乏很多相互之間能夠產生合力的企業,他們甚至可以構成一個完整的產業鏈。
“大數據和云計算都是個很龐大的范疇,不是每一個點都需要英特爾自己來做,我們需要合作伙伴來幫我們產品化,幫我們找客戶。而英特爾投資的任務,就是拉動市場對公司的核心業務的需求?!痹谠S盛淵看來,在中國,打造生態圈是英特爾投資達到使命的最快路徑。
由于云計算與大數據的火熱,每天幾乎有大量貼著大數據標簽的公司找上門來,如何從中淘到你所需要的那一個,是許盛淵和其他投資經理的最大挑戰。