杭州2017年2月14日電 /美通社/ -- 在2月12日“2017 Kubernetes Meetup 中國”開幕典禮暨“2.12上海站”活動中,才云發布了全球首個 TensorFlow as a Service (TaaS) v1.0.0 深度學習平臺。
谷歌深度學習框架 TensorFlow 自2015年11月開源以來受到了學術界和工業界的廣泛關注。然而要將 TensorFlow 真正地應用于生產環境中仍然存在很大的挑戰。為了進一步降低 TensorFlow 的使用門檻,才云(caicloud.io)早在 2016 年4月即發布國內首個基于容器集群的分布式深度學習 TensorFlow 系統 Clever,于2月12日正式發布產品 TensorFlow as a Service (TaaS) v1.0.0 商用版。
TaaS v.1.0.0 包括支持 CPU 和 GPU 的分布式 TensorFlow 模型訓練平臺和 TensorFlow 模型托管平臺。通過將 TensorFlow 與谷歌開源的容器云平臺管理工具 Kubernetes 結合, Caicloud 提供的 TaaS 服務解決了 TensorFlow 在使用中學習成本高、管理難、監控難、上線難等問題,旨在幫助企業更快、更容易地體驗和應用最新深度學習技術。 Caicloud 作為國內首家提供商用分布式 TensorFlow 解決方案的云平臺,將引領大數據市場發展的新潮流。
谷歌深度學習框架 TensorFlow
TensorFlow 在谷歌內外都已經得到了廣泛的應用。
在谷歌內,語音搜索、廣告、電商、圖片、街景圖、翻譯、 YouTube 等眾多產品之中都有基于 TensorFlow 的系統。AlphaGo 的開發團隊 DeepMind 也正式宣布其開發的系統將全部基于 TensorFlow 。
在谷歌外,優步(Uber)、Snapchat、Twitter、京東、小米等國內外科技公司也加入了使用 TensorFlow 的行列。在短短的一年時間內, TensorFlow 在開源社區 Github 上的活躍度已遠超 Caffe 、MXNet 、Torch 、Theano 等其他開源深度學習工具。
TensorFlow 生產化的難點
雖然 TensorFlow 在眾多大型 IT 公司已得到了廣泛的使用,但在廣大的中小型 IT 企業以及傳統企業中,要將其應用于生產環境卻仍然存在挑戰。
在單機環境下,即使使用目前先進的 GPU 都無法滿足訓練大型深度學習模型的計算量要求。
而在集群環境下, TensorFlow 存在高門檻、難配置、難管理等問題。分布式 TensorFlow 也不支持多用戶管理,在多用戶同時使用時存在資源和權限分配等問題。
Caicloud 解決方案
為了讓更多企業能夠享受到 TensorFlow 帶來的人工智能技術革新,Caicloud 提供了產品 TensorFlow as a Service (TaaS) v1.0.0 來搭建企業版的 TensorFlow 平臺。
TaaS 可以幫助企業更好的管理分布式 TensorFlow 的模型訓練過程,并一鍵上線訓練好的 TensorFlow 模型。下表對比了原生態分布式TensorFlow和Caicloud TaaS 平臺的差異:
目前,Caicloud 已經將 TaaS 實際應用于很多大數據項目中,并對外提供企業級大數據解決方案服務。
雖然 TaaS 可以極大程度降低企業使用 TensorFlow 的門檻,但為了進一步幫助企業節約研發投入,直接享用深度學習技術,Caicloud 提供了大數據解決方案服務。Caicloud 通過在深度學習算法和平臺上的技術積累,已為安防、電商、金融、物流等多個行業提供大數據服務。
Caicloud 基于不同應用場景,針對性地進行數據分析和模型訓練,把大數據融入到各個行業的深層次業務中。通過 TaaS 平臺,Caicloud 大數據解決方案可以更有效地利用海量數據,從而更多地挖掘數據中的價值。在一些實際問題中,通過 TaaS 平臺訓練得到的模型可以成功地將正確率提升 80%。
TaaS分布式模型訓練平臺先睹為快
提交訓練任務界面:
任務監控界面:
啟動 TensorFlow Serving:
通過界面調試API:
才云計劃將在 2017 年 3 月底發行 TaaS 的下一個演進版本 v.2.0.0。除了 TaaS 私有云產品進一步加強外,未來還將有邀請制公有云內測版本,歡迎密切關注。如有業務需求,歡迎垂詢:info@caicloud.io