【ZiDongHua 之品牌自定位收錄關鍵詞:微軟  Fabric  數據科學  人工智能  信息處理自動化 】

微軟Fabric正式發布,面向人工智能時代的數據分析

近日,微軟推出了微軟 Fabric 國際版——一個端到端的統一數據分析平臺,匯集了企業需要的所有數據和分析工具。Fabric 將Azure 數據工廠、AzureSynapse Analytics和Power BI等技術集成到一個統一的產品中,能夠讓數據和業務專員更好地發掘、探索企業的數據,也為人工智能時代的到來奠定了基礎。

人類正在進入由人工智能定義的新時代,數據的重要性愈發不言而喻。人工智能的應用正在融入工作中的方方面面,重新定義工作方式,這更需要純凈的數據與高度集成的分析系統進行支撐。然而,大多數企業正在使用的數據分析系統卻像迷宮一樣復雜。

這并不令人意外,因為大數據和人工智能技術市場高度分散,擁有數百個供應商和成千上萬種服務??蛻粜枰孕姓线@些來自不同供應商的、彼此獨立的服務,還要承擔讓這些服務協同運行的成本。

Fabric 是一個端到端的分析平臺,涵蓋了組織在數據分析中各個方面的需求。而下面這五個方面的特點,讓 Fabric 在市場中脫穎而出:

Fabric 是一個

完整的分析平臺

每個分析項目都有多個子系統,每個子系統需要不同的能力組合,通常需要使用來自多個供應商的產品。集成這些產品的過程可能會非常復雜、不穩定且昂貴。

有了 Fabric,客戶只需要使用這一款產品,它具有一體化的用戶體驗和架構,提供了開發人員從數據中提取有價值信息并最終呈現給用戶所需要的所有功能。通過自動集成和優化所有內容,提供獨特的用戶體驗,用戶只需用幾秒鐘注冊,就可以體驗其中蘊含的商業價值。

Fabric 為不同角色的團隊成員提供了符合其需求的特定體驗,因此無論是數據工程師、數據倉庫專員、數據科學家、數據分析師、還是業務用戶,都能得心應手地使用 Fabric。

Fabric是以數據湖為核心

的開放平臺

數據湖非?;靵y且復雜,用戶難以創建、整合、管理和操作。而且,一旦數據湖開始運行,使用不同數據格式的不同數據產品部署在同一個數據湖中,可能會導致嚴重數據重復以及企業對供應商的依賴。

OneLake

數據的 Onedrive

Fabric 內置了一款叫做OneLake的多云數據湖,所有 Fabric 都可直接使用。所有Fabric的工作都會自動與 OneLake 連接,就像所有的 Microsoft 365 應用程序與 OneDrive 連接一樣。數據會在一個直觀的數據中心進行組織,并自動建立索引,以供發現、共享、治理和進行合規性管理。

OneLake 同時為開發人員、業務分析師和業務用戶提供服務,有助于消除因為不同開發人員自行配置和管理自己的獨立存儲賬戶而造成的數據孤島現象。OneLake 為所有開發人員提供了一個單一、統一的存儲系統,在該系統中,數據的發現和共享會變得更容易,并可以通過集中執行的策略和安全設置來管理。

OneLake 的一個關鍵功能是“快捷方式(Shortcuts)”。OneLake 允許用戶和應用程序在不必要地移動和復制信息的情況下輕松共享數據??旖莘绞绞沟?OneLake 可以在ADLSg2、Amazon Simple Storage Service(Amazon S3)和Google Storage(即將推出)中虛擬化數據湖存儲,使開發人員能夠跨云平臺組合和分析數據。

采用開放的數據格式

進行分析

Fabric 在所有的工作和層面上都致力于采用開放的數據格式。Fabric 將 Delta 和 Parquet 文件視為原生數據格式,并將其作為所有工作的默認格式。這種對共同開放數據格式的堅持意味著客戶只需將數據加載到數據湖中一次,所有的工作都可以在同一份數據上操作,而不需要單獨導入數據。這也意味著 OneLake 支持任何格式的結構化數據和非結構化數據,為客戶提供了靈活的選擇。

通過將 OneLake 作為我們的存儲系統,并將 Delta 和 Parquet 作為所有工作的通用格式,我們為客戶提供了在最基本層面上統一的數據堆棧??蛻舨恍枰獮閿祿?、數據湖、數據倉庫、商業智能或實時分析維護不同的數據副本。相反,在 OneLake 中只需要維護一份數據副本,就可以直接為所有工作提供支持。

對于客戶來說,在不同數據引擎之間管理數據安全(表級、列級和行級)可能會很痛苦。Fabric 提供了一個通用的安全模型,該模型在 OneLake 中進行管理,并且所有引擎在處理查詢和作業時會統一執行這個模型。這一模型即將發布。

Fabric 是以人工智能技術

驅動的平臺

Fabric 在各個層面都融入了Azure OpenAI服務,旨在幫助客戶充分發掘其數據的潛力,使開發人員能夠利用人工智能技術對其數據進行分析,并幫助業務用戶深入了解數據。在 Fabric 的數據體驗中,通過Copilot,用戶可以使用對話式語言來創建數據流和數據管道、生成代碼和完整的函數、構建機器學習模型或可視化結果??蛻羯踔量梢詣摻ㄗ约旱膶υ捠秸Z言體驗,將 Azure OpenAI 服務模型與其數據相結合,并將其作為插件發布。

Fabric 的 Copilot 建立在我們對企業數據安全和隱私的現有承諾的基礎上。Copilot 會集成組織的安全、合規和隱私政策。微軟承諾不會使用用戶數據來訓練支持 Copilot 的基礎語言模型。

Fabric 為所有角色賦能

客戶希望在企業中建立數據文化,使每個人都能基于數據做出更好的決策。為了幫助客戶培養這種文化,Fabric 與人們每天都使用的Microsoft 365應用程序進行了深度集成。

Power BI是 Fabric 的核心組成部分,并已經在 Microsoft 365 中廣泛應用。通過 Power BI 與諸如 Excel、Microsoft Teams、PowerPoint 和 SharePoint 等流行應用程序的深度集成,用戶可以輕松地從 Microsoft 365 中發現和訪問來自 OneLake 的相關數據,幫助客戶從數據中獲得更多的價值。這樣的集成使用戶能夠在他們已經熟練使用的 Microsoft 365 工具中直接訪問和分析數據,提高了數據的可發現性和可用性,幫助客戶充分發揮數據的潛力,從而推動其業務獲得更大的價值。

Fabric 通過統一容量降低成本

目前的分析系統通常會將來自多個供應商的產品組合在一個項目中。這導致計算的資源在數據集成、數據工程、數據倉庫和商業智能等多個系統中進行分配。當其中一個系統處于空閑狀態時,其算力無法被其他系統利用,從而造成了巨大的資源浪費。

Fabric 極大地簡化了購買和管理資源??蛻艨梢再徺I一種能夠為所有 Fabric 工作供能的算力池。采用這種全包的方式,客戶可以自由地創建解決方案,整合各種工作,而不需要面臨復雜的集成或協調問題。統一的算力容量大大降低了成本,因為任何一個工作負載中未使用的算力都可以被其他工作負載利用。這種統一容量的使用方式使資源的利用更加高效,從而最大程度地降低了成本。

Fabric 目前處于海外版預覽階段。用戶可以通過注冊免費試用 Fabric 海外版來體驗 所有功能。每個注冊用戶都可以獲得固定的 Fabric 試用容量,可用于集成數據、創建機器學習模型等任何功能?,F有的 Power BI Premium 客戶可以通過 Power BI 管理門戶啟用 Fabric。2023年7月1日后,Fabric 將對所有 Power BI 租戶啟用。