大數(shù)據(jù)平臺搭建技術底座 掘金移動互聯(lián)等行業(yè)
大數(shù)據(jù)平臺是從各種類型的、漫無邊際的數(shù)據(jù)中,快速獲得有價值信息的處理方法或框架。大數(shù)據(jù)中的“大”不是大數(shù)據(jù)的唯一指標,而是更強調數(shù)據(jù)的類型多樣、處理的速度和獲取價值的能力。分析人士表示,大數(shù)據(jù)對傳統(tǒng)行業(yè)的重構有望成為中國經濟新一輪快速發(fā)展的關鍵推動力,對于A股上市公司而言,IT業(yè)、移動互聯(lián)網、交運和電力安全設備生產商等四類板塊受益明顯。
網絡是大數(shù)據(jù)重要信源
數(shù)據(jù)是平臺運營商的重要資產,可能提供API接口允許第三方有限度地使用,但是顯然是為了增強自身的業(yè)務,與此目的抵觸的行為都會受到約束,同時,也是大數(shù)據(jù)應用的基礎和前提。
收集數(shù)據(jù)主要是通過計算機和網絡。凡是經過計算機處理的數(shù)據(jù)都很容易收集,比如瀏覽器里的搜索、點擊、網上購物、其他數(shù)據(jù)(比如氣溫、海水鹽度、地震波)可以通過傳感器轉化成數(shù)字信號輸入計算機。
收集到的數(shù)據(jù)一般要先經過整理,常用的軟件如Tableau和Impure是功能比較全面的,Refine和Wrangler是比較純粹的數(shù)據(jù)整理工具,Weka用于數(shù)據(jù)挖掘。Hadoop是一個能夠對大量數(shù)據(jù)進行分布式處理的軟件框架。用于統(tǒng)計分析的R語言有個擴展R+Hadoop,可以在Hadoop集群上運行R代碼。還有很多可以用來在網頁上實現(xiàn)可視化輸出的框架或者控件。大致基于四種技術:Flash(Flex)或者JS(HTML5)或者Java或者ASP.NET(Silverlight)。
大數(shù)據(jù)帶給四行業(yè)新機遇
進入大數(shù)據(jù)時代,都有哪些A股公司存在投資新機遇呢?分析人士認為,大數(shù)據(jù)時代主要有四類行業(yè)明顯受益。首先,受益最明顯的當屬IT業(yè)。數(shù)據(jù)顯示,2012年大數(shù)據(jù)對全球IT開支的直接或間接推動達960億美元,而到2016年,這一數(shù)字預計將達到2320億美元。據(jù)國內有關機構初步預算,未來中國大數(shù)據(jù)潛在市場規(guī)模有望近2萬億元,將給IT行業(yè)開拓了一個新的黃金時代。
其次,移動互聯(lián)網行業(yè)。以騰訊、阿里巴巴、百度、奇虎360等為代表的互聯(lián)網公司目前已經形成了與傳統(tǒng)電信運營商價值鏈重新劃分的格局,使得運營商的角色正在不知不覺中發(fā)生著變化。
第三,交通運輸業(yè)。隨著城市的迅速發(fā)展,交通擁堵、交通污染日益嚴重,交通事故頻繁發(fā)生,這些都是各大城市亟待解決的問題。智能交通成為改善城市交通的關鍵所在。為此,及時、準確獲取交通數(shù)據(jù)并構建交通數(shù)據(jù)處理模型是建設智能交通的前提,而這一難題可以通過大數(shù)據(jù)技術得到解決。無論是交通基礎設施、交通運行狀態(tài)還是交通服務對象和交通運載工具,每時每刻都在產生著大量的數(shù)據(jù),以大數(shù)據(jù)的思路和角度來看,這些都是正待挖掘的寶藏,能為交通決策和服務帶來新的解題思路。
第四、電力信息安全設備生產商。近日,電力行業(yè)信息安全類“招標競賽”正在火熱上演,全國多家電網公司相繼在信息安全設備采購招標項目上亮出大手筆投資,采購內容涉及數(shù)據(jù)丟失防護、數(shù)據(jù)恢復、數(shù)據(jù)清除等眾多軟硬件產品,部分采購項目甚至達到上億元的規(guī)模,新一輪大規(guī)模電力系統(tǒng)信息安全建設浪潮撲面而來。
風投青睞大數(shù)據(jù)創(chuàng)業(yè)公司
新興市場藍海正待發(fā)掘
“世界的本質是數(shù)據(jù)“,大數(shù)據(jù)時代的預言家維克托·邁爾-舍恩伯格此話擲地有聲。然而置身于在大數(shù)據(jù)的浩瀚海洋中,我們不得不承認這樣一個事實,人類的技術水平目前還沒有達到隨心所欲地處理一切數(shù)據(jù)的地步。
清華大學蘇州研究院大數(shù)據(jù)處理中心技術總監(jiān)趙勇,同時也是聚云浩海(蘇州)信息科技有限公司的技術總監(jiān)則直言,在信息處理技術的步伐沒有跟上之前,每日都在激增的大數(shù)據(jù)帶來的是問題,而不是能夠產生價值的資源。趙勇在他即將出版的新書《架構大數(shù)據(jù)-大數(shù)據(jù)技術解析 》中寫道:“傳統(tǒng)的信息技術架構,已無法處理大數(shù)據(jù)問題,需要以現(xiàn)代云計算的手段和技術來解決大數(shù)據(jù)問題?!睙o可辯駁,大數(shù)據(jù)要為我所用,處理分析數(shù)據(jù)的需求也催生了一批創(chuàng)業(yè)公司,風投資本的青睞助推了其雨后春筍般的成長速度。
《證券日報》:為什么說大數(shù)據(jù)的爆發(fā)是信息發(fā)展過程中遇到的棘手問題?大數(shù)據(jù)平臺的搭建又有什么意義?
趙勇:信息技術為人類步入智能社會開啟了大門,帶動了互聯(lián)網、物聯(lián)網、電子商務、現(xiàn)代物流、網絡金融等現(xiàn)代服務業(yè)發(fā)展,催生了車聯(lián)網、智能電網、新能源、智能交通、智能城市、高端裝備制造等新興產業(yè)發(fā)展。現(xiàn)代信息技術正成為各行各業(yè)運營和發(fā)展的引擎。但這個引擎正面臨著大數(shù)據(jù)這個巨大的考驗。各種業(yè)務數(shù)據(jù)正以幾何級數(shù)的形式爆發(fā),其格式、收集、儲存、檢索、分析、應用等諸多問題,不再能以傳統(tǒng)的信息處理技術加以解決,對人類實現(xiàn)數(shù)字社會、網絡社會和智能社會帶來了極大的障礙。在實踐中,一些地方政府和企事業(yè)單位一般會將采集到的數(shù)據(jù)選取一段時間內的或者異常的數(shù)據(jù)進行部分存儲,或者干脆不存儲。
大數(shù)據(jù)爆發(fā)帶來的瓶頸需要以現(xiàn)代云計算的手段和技術來解決。云計算與大數(shù)據(jù)是相輔相成、辨證統(tǒng)一的關系,云計算、物聯(lián)網技術的廣泛應用是我們的愿景,而大數(shù)據(jù)的爆發(fā)則是發(fā)展中遇到的棘手問題。大數(shù)據(jù)技術的突破不僅能解決現(xiàn)實困難,同時也會促使云計算、物聯(lián)網技術真正落地并深入推廣和應用。
由于云計算并沒有真正落地,現(xiàn)在在各個行業(yè)、各個機構之間形成了很多信息孤島。國內有不少側重于大數(shù)據(jù)應用的公司,但是從事基礎層面的數(shù)據(jù)采集、存儲、計算、分析和展示業(yè)務的公司較少,如果僅僅從應用層面來做的話,基礎數(shù)據(jù)很難實現(xiàn)互通互聯(lián),這就需要一些平臺型的架構將數(shù)據(jù)關聯(lián)起來。比如要建設智慧城市,就必須跨部門、跨行業(yè)進行數(shù)據(jù)共享交互,這就需要從大數(shù)據(jù)平臺和接口入手。 平臺搭建好之后,再選擇性地做應用。
《證券日報》:大數(shù)據(jù)時代數(shù)據(jù)的多維價值正在被逐步發(fā)現(xiàn),整個市場的規(guī)模將會無法想象。
趙勇:是的,2012年被稱為大數(shù)據(jù)元年,今年大數(shù)據(jù)市場正處在井噴式發(fā)展階段,未來五年全球大數(shù)據(jù)市場價值將高達幾百億美元。2012年初,大數(shù)據(jù)相關軟件、硬件和服務的收入總和只有約50億美元。但隨著企業(yè)對大數(shù)據(jù)價值的認識和相關產品技術及應用模式的不斷成熟,大數(shù)據(jù)相關產業(yè)和服務將獲得長足發(fā)展,大數(shù)據(jù)將逐漸落地,并在未來幾年保持驚人的增長速度。國內因為傳統(tǒng)的信息手段和技術都迫切需要轉型升級,大數(shù)據(jù)市場實際上就是云計算在各個領域和行業(yè)的應用市場,所以綜合市場規(guī)模在最近幾年將達千億元量級。
《證券日報》:國內外通過搭建數(shù)據(jù)平臺來發(fā)掘經濟價值的公司是怎樣的情況?
趙勇:國內此類的創(chuàng)業(yè)公司還正在起步,國外已經有一些運行良好的做數(shù)據(jù)服務業(yè)務的公司了。比如位于西雅圖的BlueKai,它建立了一個數(shù)據(jù)管理平臺(DMP),用來幫助用戶組織并分析數(shù)據(jù),同時也建立了數(shù)據(jù)交換中心,連通數(shù)據(jù)需求的兩端。
《證券日報》:資本的嗅覺總是十分靈敏,一切能產生價值的地方總能看到資本的身影。請簡要介紹一下國內外大數(shù)據(jù)領域的創(chuàng)業(yè)型公司及風險投資的動向?
趙勇:大數(shù)據(jù)概念的普及,也帶動了資本市場對大數(shù)據(jù)技術創(chuàng)業(yè)公司的高度關注,國外多家頂級風投和早期投資機構都對大數(shù)據(jù)行業(yè)青睞有加。
另一方面,大數(shù)據(jù)問題出來之后,國際互聯(lián)網行業(yè)巨頭得益于人財物的優(yōu)勢,可以快速提供解決方案,但由于他們所運用的還是傳統(tǒng)產品,目前還沒有殺手锏級別的新產品出來,也也給大數(shù)據(jù)創(chuàng)業(yè)公司提供了機會??梢哉f從數(shù)據(jù)的采集、存儲、分析,直到最上層的數(shù)據(jù)展示,每一個層面都有可供大數(shù)據(jù)創(chuàng)業(yè)公司發(fā)掘的機會,也為資本提供了很好的投資標的。
例如,風投機構Accel Partners針對這一行業(yè)設立了一支總額高達1億美元的基金;大數(shù)據(jù)分析公司Splunk,在Nasdaq首日IPO即上漲109%;其他大數(shù)據(jù)軟件服務商如MapR、10Gen、DataStax等近期都完成了千萬美元級的融資。
在國內,互聯(lián)網行業(yè)“去IOE”的呼聲漸高(IOE分別是IBM、Oracle、EMC,更確切地說是IBM小型機、Oracle數(shù)據(jù)庫與EMC存儲設備的組合,這三駕馬車構成了一個從軟件到硬件的完整商用數(shù)據(jù)庫系統(tǒng)),很多大數(shù)據(jù)創(chuàng)業(yè)公司躍躍欲試,涌現(xiàn)了一批大數(shù)據(jù)分析、挖掘、展示、廣告方面的創(chuàng)業(yè)公司。我們清華大數(shù)據(jù)處理中心在成立前期就是在四家感興趣的風投公司中選擇的一家,近期我們又在智慧教育、智慧旅游、車聯(lián)網等方面發(fā)力,正在吸引新一輪融資。以云計算和大數(shù)據(jù)為引領的新一代信息技術在各個領域都能帶來模式、內容、路徑方面的創(chuàng)新,會形成諸多新興市場的藍海。
百度騰訊等中概股
凸顯大數(shù)據(jù)平臺價值
大數(shù)據(jù)的快速發(fā)展與物聯(lián)網、傳統(tǒng)互聯(lián)網及移動互聯(lián)網三大平臺與日俱增的海量數(shù)據(jù)密不可分。新一波大數(shù)據(jù)革命浪潮已經來臨,然而能分享“智慧盛宴”的公司鳳毛麟角。在中國,業(yè)界普遍認為騰訊、百度和阿里巴巴三大互聯(lián)網龍頭公司已經成為大數(shù)據(jù)平臺建設和發(fā)展的領頭羊。
目前,百度、騰訊均已上市,據(jù)媒體報道,阿里巴巴正籌劃赴香港上市。
百度于2005年8月5日登錄納斯達克上市,發(fā)行價格為每股27美元。截至8月27日收盤,百度股價年內累計漲幅為34.73%,公司最新股價為每股135.12美元。
百度在大數(shù)據(jù)時代扮演的不僅是流量及資源共享的平臺角色,公司更好地利用其大數(shù)據(jù)平臺與其它電商企業(yè)進行合作創(chuàng)造了新的利潤增長點;百度云平臺提供的BAE(百度應用引擎)將提供高并發(fā)的處理能力,滿足處理速度快的要求。不僅如此,百度移動客戶端統(tǒng)計、移動搜索數(shù)據(jù)分析及移動調研報告等分析,能夠為開發(fā)者提供強大的統(tǒng)計分析服務,讓開發(fā)決策更加有據(jù)可依。
百度云技術品牌總監(jiān)陳尚義先生表示,百度作為國內領先的互聯(lián)網搜索商,在擴展搜索、突發(fā)訪問搜索、百度指數(shù)上都充分利用了大數(shù)據(jù)。例如:在百度指數(shù)中輸入當前最熱門詞匯之一手游,便可查到通過百度搜索手游關鍵詞的客戶年齡分布、性別、所在地域等多個特征,這其中的商業(yè)價值便隨之而來,作為手游開發(fā)商如果充分利用這些特征,對于手游產品開發(fā)的針對性、地域推廣的區(qū)別性便有了可參考指標。
除百度外,騰訊是在大數(shù)據(jù)時代下,公認的最具有商業(yè)價值的一家互聯(lián)網平臺上市公司。公司于2004年6月16日在中國香港上市,發(fā)行價格為每股3.7港元,截至8月27日,公司的最新收盤價為每股362.00港元,年內累計漲幅45.38%。相對于阿里巴巴、百度等互聯(lián)網公司,騰訊的產品線更豐富、廣泛,從門戶網站到微博、視頻、電子商務、開放平臺等有多個跨平臺領域。因此,騰訊更加充分、完整地記錄了人們在互聯(lián)網上的行為軌跡和社會屬性。當用戶在互聯(lián)網上留下自己的行為軌跡并生成大量數(shù)據(jù)時,可挖掘的商業(yè)價值也較高。
業(yè)內人士表示,在中國,騰訊是最具類似“Facebook+Twitter”大數(shù)據(jù)基因的互聯(lián)網公司,作為大數(shù)據(jù)平臺的龍頭公司,用戶可以在騰訊空間平臺上分享日志、照片,微博,又有不同的線索可對人群進行劃分,這些都產生了海量的有價值數(shù)據(jù),這些強關系鏈和弱關系鏈的組合,能讓廣告客戶更加精準得將廣告信息推送給目標人群。
除上述三家領頭平臺公司外,目前上市的中概股大數(shù)據(jù)平臺上市公司還有網易,新浪,搜狐。網易于2000年6月30日在納斯達克上市,截至8月27日,公司最新收盤價為每股73.36美元,年內累計漲幅72.49%;新浪于2000年4月13日在納斯達克上市,截至8月27日,公司最新收盤價為每股76.75美元,年內累計漲幅52.83%;搜狐于2000年7月12日在納斯達克上市,截至8月27日,公司最新收盤價為每股60.61美元,年內累計漲幅28.03%。
網易、新浪、搜狐有望成為大數(shù)據(jù)平臺類上市公司中的第二梯隊,在這三家公司中,新浪的大數(shù)據(jù)運用處于領先地位。去年年底,新浪微博啟動信息流廣告測試,根據(jù)興趣愛好和社交關系向網友推薦相關信息;今年4月份,新浪微博宣布與阿里進行戰(zhàn)略合作,明確表示將在大數(shù)據(jù)業(yè)務層面展開持續(xù)深入的合作探索;5月份,手機客戶端附件功能的加入以及Page頁面的發(fā)布,是新浪微博推進大數(shù)據(jù)戰(zhàn)略的又一重要舉措。
拓爾思、東方國信和同有科技成大數(shù)據(jù)平臺“三尖兵”
隨著互聯(lián)網、移動互聯(lián)網和物聯(lián)網的發(fā)展,誰也無法否認,我們已經切實地迎來了一個海量數(shù)據(jù)的時代。在此背景下,對這些海量數(shù)據(jù)的收集、存儲及分析已經成為一個非常重要且緊迫的需求。近幾年興起的分布式計算技術,如Google的Map/Reduce、GFS等給人們帶來了新的方法與思路。從國內情況看看,拓爾思、東方國信、同有科技等上市公司成為當前海量數(shù)據(jù)處理“三尖兵”。
拓爾思
通過并購向應用領域延伸
拓爾思是大數(shù)據(jù)領域海量非結構化信息自動化、智能化處理領域的佼佼者,從底層技術、平臺產品到應用產品和服務技術產品完備,基于自主平臺的企業(yè)搜索、機器挖掘、SMAS和OM等產品技術先進應用范圍廣闊,隨著市場的成熟未來前景廣闊。
今年初,拓爾思發(fā)布關于使用超募資金參股廣州科韻信息股份有限公司的公告,公司經董事會批準,使用公開發(fā)行股票募集的超募資金中的1600萬元通過受讓股份和增資的方式,取得廣州科韻信息股份有限公司30%的股權。
拓爾思并購科韻信息有利于公司大數(shù)據(jù)應用落地。廣州科韻公司在流動人口和社會管理研究、體育領域軟件研發(fā)有深厚經驗,在上述細分領域存在競爭優(yōu)勢,并且是國家體育總局羽毛球中心主要信息技術合作伙伴。科韻公司所定位的流動人口信息管理領域具有數(shù)據(jù)量大,管理分析要求高的特點,拓爾思參股并增資科韻公司可以使TRS大數(shù)據(jù)相關的新技術新產品結合具體行業(yè)得到深度應用機會,進一步創(chuàng)造新的應用價值和模式,讓大數(shù)據(jù)應用落地。
東方國信
拓展工業(yè)和金融數(shù)據(jù)領域
東方國信主要為電信運營商提供智能系統(tǒng)解決方案,包括軟件產品開發(fā)與銷售、技術服務和相應的系統(tǒng)集成等。具體產品可分為企業(yè)數(shù)據(jù)平臺、數(shù)據(jù)分析平臺和基于BI的CRM應用三類。公司擁有電信行業(yè)通用數(shù)據(jù)模型、數(shù)據(jù)清洗等多項核心技術,能夠為客戶滿足在數(shù)據(jù)倉庫建設、經營分析、決策支持、數(shù)據(jù)挖掘等眾多領域的需求。
2013年8月1日,東方國信發(fā)布公告稱,公司擬通過向特定對象非公開發(fā)行股份和支付現(xiàn)金相結合的方式購買北科億力公司和科瑞明公司100%的股權。
開拓非電信行業(yè)大數(shù)據(jù)業(yè)務。2012年度,公司非電信業(yè)務收入占比上升至9.79%;北科億力和科瑞明分別處于工業(yè)軟件開發(fā)與服務行業(yè)、金融軟件開發(fā)與服務行業(yè),通過并購,公司進一步增加非電信業(yè)務收入占比。
收購北科億力,拓展工業(yè)大數(shù)據(jù)領域。北科億力致力于鋼鐵行業(yè)高爐檢測和智能模型領域,結合東方國信的相關BI技術,進入工業(yè)軟件、工業(yè)大數(shù)據(jù)領域,拓展生產、設備、機器類大數(shù)據(jù)和商業(yè)智能領域。
收購科瑞明,拓展金融行業(yè)大數(shù)據(jù)領域??迫鹈鲗W⒎沼谵r村信用社,是國內農村信用社商業(yè)智能系統(tǒng)的核心供應商之一;農村信用聯(lián)社市場而言,商業(yè)智能處在起步階段,客戶深度挖掘潛力巨大;通過收購科瑞明,公司進一步拓展了金融BI市場。
同有科技
國內數(shù)據(jù)存儲市場龍頭
數(shù)據(jù)的爆炸式增長以及對數(shù)據(jù)的重視程度催生了對存儲的需求。從全球和中國的情況來看,存儲行業(yè)的景氣程度都比較高,全球存儲行業(yè)的增長在15%以上,中國存儲市場的增速約為16%,中國存儲市場的發(fā)展由于起步較晚,發(fā)展空間更大,EMC等存儲行業(yè)的領先公司今年在中國區(qū)的營收目標同比增長超過50%。
公司是國內領先的、擁有自有品牌和自主知識產權的、專注于企業(yè)用戶市場的民族存儲廠商,主要從事數(shù)據(jù)存儲、數(shù)據(jù)保護、容災等技術的研究、開發(fā)和應用;旨在通過提供高品質的存儲產品、一流的解決方案和專業(yè)的技術服務,為政府、軍隊軍工及大型企事業(yè)的數(shù)據(jù)中心、云計算、物聯(lián)網等構建高效、穩(wěn)定、可靠的存儲、備份和容災系統(tǒng)。經過十余年的高速發(fā)展,公司形成了以自有品牌產品為主導和核心,覆蓋數(shù)據(jù)存儲、數(shù)據(jù)保護、容災三大領域的業(yè)務體系。
分析人士認為,公司從最早的代理起家,在技術含量、門檻極高的存儲領域逐步一點點積累形成自有的完整產品線,深耕了政府、軍工兩個重要行業(yè),隨著上市后平臺的提升,現(xiàn)金流的充沛,未來有望獲得在更大數(shù)量級訂單的實力。且可通過國家扶持以及美國核心存儲產品對中國敏感領域的禁售政策來超越國外強勁競爭對手。
相關新聞
更多>>