体验侧深度竞品分析-Azure Synapse Analytics
Azure Synapse Analytics 深度体验分析
设计师:贝妮
注:站在体验设计的角度所以我对 Synapse Analytics 适合的业务场景以及产品使用的方式可能有些许不准确,还望大家帮忙指正
一、用户使用数据典型需求
客户在使用数据时,一般会分为两大典型需求,分别是:
BI型:对海量数据进行关联分析,为企业经营提供决策指导以及商业洞察
AI型:用数据做训练,通过机器学习等方法得到模型,用于人工智能和数据科学研究,驱动业务创新
二、Azure推出的产品
针对以上两大不同类型的需求,Azure也面对不同的场景提供了出色的产品,如:
面向数据科学场景:Azure Databriks
面向商业分析场景:Azure Synapse Analytics
Azure Synapse Analytics 是微软提供的一个基于云的数据仓库。能帮助企业更有效地从各种复杂的业务系统、应用、渠道中快速获取有效数据,对海量数据进行实时分析处理,以最快速度获取可用于指导决策或者机器学习的业务洞察,同时也是阿里云MaxCompute相关竞品
如synapse 分析平台,微软不断的将与分析相关的核心产品均整合进来,在OLAP侧堆砌了数据分析能力厚度;这次的产品更是将除数据应用以外的核心产品进行了封装,面向企业提供数据平台能力;通过平台,微软在平台侧整合了OLTP & OLAP,实现了体验上的HTAP,为复杂分析集成了ML,在数据可视化上提供了powerBI,同时作为企业级的入口,完善数据治理等;这个平台最大程度上强化了产品间的联动,通过企业能力覆盖度做到了1+1>2的解决方案牵引;同时微软在数据下游,通过Dynamic 365(企业级数据应用)+365 Power Platform (智能数据解决方案)来完成于IDP平台对接,实现了解决方案+数据平台的企业数据场景大链路闭环;
Azure Synapse Analytics 架构
三、Synapse Analytics产品功能
Azure Synapse Analytics 功能
2.1.1、统一的分析平台
通过单个统一的环境执行数据集成、数据探索、数据仓库、大数据分析和机器学习任务
2.1.2、无服务器和专用选项
同时支持数据湖和数据仓库用例,并为每个工作负载选择性价比最高的定价选项
2.1.3、企业数据仓库
在性能业界领先的 SQL 引擎久经考验的基础上构建任务关键型数据仓库
2.1.4、数据湖探索
结合关系数据和非关系数据,并使用用于构建数据仓库解决方案的服务轻松查询数据湖中的文件
2.1.5、无代码的混合数据集成
在无代码的视觉环境中生成 ETL/ELT 进程,从超过 95 个本机连接器轻松引入数据
2.1.6、深度集成的 Apache Spark 和 SQL 引擎
加强处理高级分析解决方案的数据专业人员之间的协作。在数据仓库和 Spark 引擎上轻松使用 T-SQL 查询
2.1.7、日志和遥测分析
使用业界领先的文本索引技术,通过 Azure Synapse 数据资源管理器分布式查询引擎从时序、日志和遥测数据中获取见解
2.1.8、语言选项
无论使用无服务器资源还是专用资源,都可使用你偏好的语言,包括 T-SQL、KQL、Python、Scala、Spark SQL 和 .Net
2.1.9、集成的 AI 和 BI
通过 Azure 机器学习、Azure 认知服务和 Power BI 的深入集成来完善端到端分析解决方案
2.2.0、云原生 HTAP
只需单击一下,即可从操作数据库(例如 Azure Cosmos DB)存储的实时事务数据中获取见解
四、适合的业务场景
- 数据仓库:能够与各种数据平台和服务集成
- 描述/诊断分析:对 Synapse 数据库使用 T-SQL 查询来执行数据探索和发现
- 实时分析:Azure Synapse Link 支持与不同的运营数据源集成,以实施实时分析解决方案
- 高级分析:通过利用 Azure Databricks 来支持决策制定
- 报告和可视化:与 PowerBI 集成以授权和增强业务决策
五、功能试用
4.1.1 Home
已在 Azure 订阅中设置并配置了 Azure Synapse Analytics 工作区,可以看见产品首页做了引导以及透出最近使用的资源,并且用户进入产品左侧只展示Icon,保留产品更多空间
- 引入数据
- 浏览分析(外链文档)
- 可视化(创建报表和数据集)
首页还有一些功能展示以及社区博客文章之类
4.1.2 Data
分类两种不同的数据源
一、工作区中定义的数据库的工作区选项卡(包括专用 SQL 数据库和 Data Explorer 数据库)
二、链接到工作区的数据源的链接选项卡,包括 Azure Data Lake 存储
我通过浏览模版找到需要的数据以试用Notebook以及SQL,流程如下:
- 步骤一:点击browse gallery
- 步骤二:点击Bing COVID-19 Data
- 步骤三:数据集打开新的 Spark notebook、SQL
- 步骤四:运行Notebook、SQL
步骤一:点击 Browse gallery
步骤二:点击Bing COVID-19 Data
步骤三:数据集打开新的 Spark notebook
步骤四:运行 Notebook、SQL
试用 Pipeline
从 PB 级数据仓库到 Power BI
4.1.3 Develop
用于开发数据处理解决方案的脚本和其他资产
Develop页面
4.1.4 Integrate
用于管理数据摄取和集成资产,例如在数据源之间传输和转换数据的管道,可以通过业务流程管道从多个数据源引入数据
4.1.5 Monitor
用户观察数据处理作业的运行情况并查看其历史记录
Apache Spark applications
点击进入详情页
4.1.6 Manage
用于管理、整合关联 Azure Synapse 工作区中使用的池、运行时和其他资产
六、容器框架
总结
该产品框架内容在用语、功能、操作跟微软开源的 Fluent Design 设计语言保持较好的一致性,大致的框架区域都是由:公共头+菜单栏+二级目录+主体构成;
从宏观的角度来看:帮助产品把控大方向,落实产品形态符合企业形象以及多领域业界趋势,保障企业商业思维、模式上达到一致性;
从微观角度来看:微软各线产品在操作、界面、流程内容上,给予用户相对一致的体验,帮助产品实现风格、交互统一,降低用户学习成本;
公共头
承载产品用户基本信息以及相关通知设置等,比如 Synapse 透出了产品 Logo 品牌标识、搜索功能等,以便用户能够在几秒内看到关于自己的账户信息以及通知内容
菜单栏+二级菜单
将所有功能放在左侧矩形框内,产品提供按顺序浏览、允许直接跳转到任何页面的框架;Synapse 整体内容分层结构展示,我认为页面更像是一个树状结构,每个子页面都有一个父页面,它比较适合跨多页面的复杂内容,但缺点是后续该产品如果增加功能结构层次过深的话,在页面之间切换的点击数量就越多
主体
响应式布局方便跨各种设备缩放,保证 UI 清晰可见并可在所有支持 Windows 的设备上使用,Synapse 可针对特定断点来切换用户界面,比如右下方截图在较小布局上产品省略了左侧菜单栏
原始页面尺寸
自适应页面尺寸
框架结构
4.1.1 Home
4.1.1 Data
4.1.1 Develop
4.1.1 Integrate
4.1.1 Monitor
4.1.1 Manage
七、交互逻辑
抽一个功能流程分析
7.1.1、Monitor 总结
使用链路:点击Monitor->点击Apache Spark applications->查看列表
用户在进入 Apache Spark applications 之后
- 产品提供默认值,如时间区间默认前 24 小时,状态默认选择所有,用户后续可以点击自行选择,不能删除;
- 提供增加过滤器选项,如应用程序名称、结束时间等,交互方式比较有趣,用户添加筛选器确定之后,该内容变成一个标签点击后可以重复编辑,并能够继续添加过滤内容,除了结束时间和 Livy ID 只能筛选一次之外,其他内容可以重复添加;
- 除固定时间区间、状态之外,过滤器添加的内容可以删除,正文部分也可以添加、删除列,并可以做排序;
交互优点
- 二级菜单分类清晰,可扩展性更强,另外产品内部按钮较少,界面看起来更简洁,上手成本更低,Synapse 添加过滤器是让用户自己选择,并不是把需要筛选的功能一一枚举;
- Application name 可以直接点击进入详情,确实比 MC 要方便,MC 需要点击后面的操作才能打开 logview,Synapse Spark History Server 同样也是需要跳转的内容,但给予的是按钮标签形式,后期 MC 是可以考虑把 logview basic info 主要详情前置;
- 对比产品内部“比较应用程序”永远应该使用较频繁,故前置了相关功能;
交互不足
- Synapse 添加过滤器如果超过一行则会导致页面抖动严重,影响用户体验,也影响前端的适配效果;
- Synapse 添加过滤器需要用户不停的增加选项,提高了用户的点击次数,并且没有相关提示是否已添加成功该选项,需要通过鼠标点击空白确定,该功能易见性较低;
- Synapse 每添加一次过滤器等待时间大概要一秒才显示右侧的内容,会有短暂的等待时长,并且没有筛选器重置功能
八、视觉表现
Synapse 整体视觉符合微软 Fluent 样式
颜色
Synapse 颜色主要由主题色决定,目前使用的蓝是微软的品牌色,设计师相对谨慎地使用该颜色突出显示重要元素,并使用同一种颜色来指示应用程序中处于交互状态,目前该产品只有浅色模式
图标
Synapse 图标在产品内部工具栏展示的形式为线性图标,通过线来塑造轮廓。线性图标具有辨识度高,清晰,简约易识别等优点,线性图标不会对页面造成太多的视觉干扰。缺点是:线性图标的创作空间较少,太复杂的线性图标对识别性产生较大的困扰;产品菜单展示形式为面性图标,主要是为了跟工具栏做更好的区分,并且识别度更好
字体
全部 UI 使用同一种字体,那就是 Windows 应用的默认字体 Segoe UI Variable,Segoe UI Variable 是用于英语、欧洲语言、希腊语和俄语的字体。
对于其他语言,请参阅(其他链接,站酷没有表格)
九、总结
Azure Synapse Analytics 服务能帮助企业更有效地从复杂的业务系统、应用、渠道中快速获取有效数据,对海量数据进行实时分析处理,以最快速度获取可用于 指导决策 或 机器学习 的业务洞察。
Synapse Analytics = Azure SQL Data warehouse(数仓) + Azure Data Lake(用于大数据分析的数据湖) + ADF(数据集成服务),整体产品使用 Fluent Design 设计语言,微软旗下服务如 Windows 10、Office 365,乃至 Azure 都能串接应用,同时也呼应目前推动云端化、其化现代化应用服务的市场策略。
从产品层面来说:
- 使用简单的 SQL 查询将数据湖中的关系数据和非关系数据进行汇集;
- 通过智能工作负载隔离、工作负载管理、无限并发简化所有查询性能;
- 与 Power BI 和机器学习 (ML) 深度集成,减少 BI 和 ML 项目的开发时间,并应用于所有关键数据——从 Office 365、Dynamics 365 到支持开放数据计划的 SaaS 服务;
- 提供无代码可视化环境管理数据管道;
从体验层面来说:
- 一致性:统一文字基线确保用户阅读流畅性,并引导用户阅读;相近的图标指引与配色,帮助确保用户正确判断功能含义;
- 易操作性:根据用户熟悉的微软交互元素以及使用场景搭建用户界面及链路;
- 易见性:用户容易找到需要的功能,尤其针对 Synapse 菜单栏结构清晰并分类准确;
- 易学性:使用过程中有模版库可以让用户试用并给出相关示例,帮助用户更好上手;














































































