您當前的位置:首頁 - 解決方案 - Microsoft

現代數據倉庫

來源:     發布時間:2015-09-11     點擊數:776

現代數據倉庫


Microsoft 的現代數據倉庫解決方案通過無縫整合傳統的大容量關系存儲和用于非結構化數據的全新數據存儲(如 Hadoop),來幫助您從大數據中發現新的見解。


 

任意數量、速度和種類的數據


傳統的結構化關系數據倉庫在設計上絕對無法應對爆炸式數據增長、半結構化和非結構化數據類型,以及更快的數據處理速度。Microsoft 的現代數據倉庫解決方案將傳統數據倉庫與非關系數據進行集成—從而可以處理各種規模和類型的數據,并提供實時性能。


優勢 

?并入各種數據源類型,包括移動、社交、掃描儀、照片、視頻、傳感器、設備、RFID、Web 日志、高級分析、點擊流、機器學習和第三方數據源。查詢傳統關系數據以及這些新的數據類型。

?通過在現有基礎結構中逐漸增加節點來從數十 TB 字節擴展至數 PB 字節。

?允許用戶近乎實時地獲取其查詢的結果。通過采用 in-memory 技術和流式技術可將花費數小時的查詢縮短至數分鐘至數秒。

?提供受信任的基礎結構,滿足用戶對數據可信性和一致性的需求。


整合結構化關系數據與非關系數據


當今,各個企業都會收集網絡日志、傳感器數據、社會輿論和設備等非關系數據源,以從中獲得更深入的見解并增強競爭優勢。將關系數據提取并清理到中央存儲庫的傳統策略需要適應這個嶄新的數據時代。Microsoft 的現代數據倉庫解決方案可以適應 Hadoop 等新的存儲技術,以并入非關系源并在關系倉庫和 Hadoop 群集之間實現整合。


優勢 

?通過并入新的非關系數據類型,各個公司可以獲得更深入的見解并且能夠做出更明智的決策,從而推動業務發展。

?現代數據倉庫通過在單個 T-SQL 查詢內交叉引用關系和非關系數據,能夠使客戶更輕松地分析數據。


功能 

在您的硬件上自行部署 Hadoop

通過與 Hortonworks 建立戰略合作伙伴關系,Microsoft 向希望在其服務器上部署 Hadoop 的客戶提供 Hortonworks Data Platform for Windows。

 

預先構建的 Hadoop 設備

SQL Server 并行數據倉庫是一個預先構建的設備,它在同一機架中同時具有關系數據倉庫引擎和 Hadoop 區域。與某些僅包含 Hadoop 或僅包含數據倉庫的設備不同,單臺設備即可提供完全集成的解決方案。

 

云中的 Hadoop 產品

使用 Windows Azure HDInsight 在云中縮放 Hadoop 群集。由于無需購買硬件且設置最少,因此客戶可以在 10 分鐘內在其 Hadoop 實現中啟動和運行群集。

 

集成的關系和非關系查詢引擎

PolyBase 將關系和非關系數據在查詢級別進行了統一??蛻艨梢岳盟麄円呀浾莆盏闹R (T-SQL),而無需學習新的查詢語言,例如 MapReduce。PolyBase 可與現有的 Hadoop 產品(包括 Hortonworks Cloudera)集成。


 

通過現代數據倉庫處理所有規模的數據


在使用傳統的數據倉庫技術的時代,您的數據規模受限并且當需要更多容量時,就必須購買新的硬件。Microsoft 現代數據倉庫可滿足最苛刻的企業要求。隨著數據要求的不斷提高,您可以通過在現有基礎結構中逐漸增加節點來從數十 TB 字節擴展至數 PB 字節。


 

優勢 

?使用 SQL Server 并行數據倉庫使小型 TB 字節倉庫的數據量增長至 PB 字節,從而能夠處理任意規模的結構化關系數據

?通過 Windows Azure HDInsight,可以將非關系數據(例如來自社交源、傳感器、設備和日志的信息)存儲在 Hadoop 中,并進行擴展以容納大量數據。


 

功能 

“無需共享”體系結構

并行數據倉庫中的大規模并行處理利用具有多個物理節點的“無需共享”體系結構;每個節點運行帶有專用 CPU、內存和存儲的其自己的 SQL Server 實例。這導致性能比傳統的體系結構快了許多倍。

 

Windows Azure 存儲 blob

Windows Azure HDInsight 利用在 Azure 存儲 blob 中存儲數據的靈活云基礎結構。這允許用戶在 Azure 中存儲任意數量的數據。

 

獨立于存儲擴展 Hadoop 集群

Windows Azure HDInsight 具有將 Hadoop 集群與數據存儲分離的體系結構。這允許用戶動態增加或縮減 Hadoop 集群或讓多個 Hadoop 集群處理相同的數據。

 


讓用戶實時獲取其查詢的結果


使用傳統數據倉庫技術,查詢可能需要數分鐘、數小時,有時甚至需要通宵達旦進行處理。Microsoft 現代數據倉庫可為用戶提供近乎實時的結果。通過采用強大的查詢處理和 in-memory 技術,客戶可以看到完成其運行時間最長的查詢的速度現在提高了 10 - 100 倍。


 

優勢 

?通過采用 Microsoft 現代數據倉庫中的 in-memory 技術,客戶可以看到完成其運行時間最長的查詢的速度現在提高了 10 - 100 倍??蛻暨€看到了高達 10 倍的數據壓縮率。

?通過并行化查詢處理,客戶可以看到其大規模復雜查詢的性能提升了高達 100 倍。

?通過部署使用 StreamInsight 的復雜事件處理應用程序獲得針對事件流源的實時洞察力。


功能 

列存儲

通過在列存儲(而非行存儲)中重定向數據,組織可以縮短查詢時間并提高數據的壓縮率。以列格式組織數據可實現更高的存儲和數據集返回效率,從而最終實現成本的降低。

 

In-memory 數據倉庫技術

In-memory 列存儲可將常見的數據倉庫查詢的速度最多提高 100 倍。當查詢運行時,SQL Server PDW 將自動選擇最優索引并根據需要將數據寫入或讀出內存。

 

針對流式數據的復雜事件處理

Microsoft StreamInsight 是開發和部署復雜事件處理應用程序的強大平臺。其高吞吐量流式處理體系結構和基于 Microsoft .NET Framework 的開發平臺允許您快速實施強大且高效的事件處理應用程序。

 

并行化查詢處理

通過多核硬件平臺,SQL Server 可縮短訪問大量數據的查詢的響應時間。SQL Server PDW 的并行查詢處理功能的速度隨著查詢所用邏輯處理器的數量的增加而近乎線性地增加。


信任您的數據


企業集成管理所提供的解決方案組合使組織能夠信賴其數據所提供的可信性和一致性,從而幫助他們做出重要的業務決策。

 

優勢 

?通過數據質量服務減少數據約束和錯誤,同時提高數據質量

?通過集成服務訪問所有異構數據源(包括結構化數據、應用程序數據、云數據或實時數據)中的數據。

?通過主數據服務收集并維護準確完整的主數據,以確??缢?/span> IT 資產標準化主要業務實體的數據定義。


功能 

清理、匹配、標準化和擴充您的數據

數據質量服務允許您清理、匹配、標準化和擴充您的數據,以便為商業智能、數據倉庫和事務處理工作負載提供受信任的信息。

 

與任何異構數據源集成

集成服務是一個數據集成平臺,允許您無需編碼即可提取、轉換和加載 Microsoft 數據和非 Microsoft 數據源。

 

通過標準化數據定義來創建主數據

SQL Server Master Data Services 提供一個中央數據中心,以便跨不同的應用程序確保信息的完整性和數據的一致性。

乱小说录目伦