Cloudera Data Platform (CDP) 推出全新分析服务体验
作者:数字通信世界 添加时间:2020-09-18
专为数据专家设计,提供快速、实时的业务洞察,符合IT所需的企业级安全性。
2020年9月18日,企业数据云公司 Cloudera(NYSE:CLDR)宣布将在Cloudera Data Platform(CDP)中推出全新的企业数据云服务,包括CDP Data Engineering(数据工程)、CDP Operational Database(操作型数据库)和CDP Data Visualization(数据可视化)。这些新服务是专为数据专家开发的分析功能,不同于那些需要附加功能才能实现工作流程自动化、工作优先级别划分和性能调整等关键功能的通用服务,CDP直接加入了这些功能支持数据工程师、数据分析师和数据科学家以更智能且更快捷的方式工作。CDP企业数据云服务支持数据专家能够自信应对数据的爆炸式增长,以及跨多云和私有云对孤岛数据进行分析。
在全球疫情的影响下,每家企业都面临着巨大的变革。从面对面会议到购买食品杂货,所有事物几乎一夜间都通向数字化。因此,企业机构的每个业务点产生的数据都多于以往,而且还需要追踪和监视更多数字化交易,与同事、客户和合作伙伴的每次互动也都需要在线上进行。由于每家企业都产生了大量数据,Cloudera认为此次冲击带来了加快和优化业务决策的机会。Cloudera Data Platform (CDP) 可以在数据生命周期的任何阶段,充分利用几乎无限数量和种类的数据来支持企业做出更好的决策。
凭借数据生命周期集成技术,无论数据位于何处或在何处运行分析,数据工程师、数据分析师和数据科学家都能够安全高效地处理数据。通过集成整个数据生命周期及跨公有云和私有云分析功能的独特混合数据架构,CDP不仅能够帮助提高数据专家个人的工作效率,还能帮助数据团队更好地开展协作。为了应对数据风暴,首先必须有效管理、并确保数据采集、丰富、分析、实验和分析可视化的安全性,支持数据专家可以更好地协作,并更快交付预测性维护、客户360分析等数据驱动型应用。这些应用对企业开展竞争和更好服务客户非常必要。
Cloudera首席产品官Arun Murthy表示:“我们的客户了解数据生命周期对数据驱动型业务决策的重要性,以往通常是集成NiFi、Kafka、Spark、Impala、Hive、HBase等更多数据集群。对数据专家(架构师和开发人员)来说,依然可以使用CDP Data Hub进行数据生命周期集群服务。如今,借助CDP的分析功能,工程师、分析师和科学家等无需了解或管理集群,就能各取所需来更好地完成工作。而且,由于在整个数据生命周期中都具有内置的安全性和治理功能,因此IT团队的工作也变得更容易。这是一款适用于所有人的企业数据云。”
CDP Data Engineering(数据工程)
CDP Data Engineering是运行在Kubernetes上的一项强大的Apache Spark服务,包含基本数据工程服务所不具备的关键生产力增强功能:
基于视觉GUI的监视、故障排除和性能调整,可加快调试和解决问题的速度
Native Apache Airflow和各种强大的API,可编配和自动执行作业调度,并在任何地点提供复杂的数据管道
资源隔离和基于GUI的集中式作业管理
CDP数据生命周期集成与SDX安全和治理
IDC数据集成和智能软件服务研究总监Stewart Bond表示:“数据工程在数据科学中的作用对于实现落地应用至关重要。机器学习模型无法投产已成为一个普遍问题,原因之一是企业机构在努力连接各个点时,会遇到数据工程管道自动化方面的挑战。集成式平台的价值就在于可以将所有要素整合在一起。”
为全数据生命周期分析和生产应用准备数据,对于将数据转化为业务价值至关重要。CDP Data Engineering是一种专用的数据工程服务,可大规模加速企业数据管道,从数据采集、丰富直到获取数据洞察。
CDP Operational Database(操作型数据库)
随着企业不断产生大量结构化和非结构化数据,开发人员的任务是构建应用程序,以便降低数据访问门槛,能够进行实时操作,支持业务运营和创收。不同于通用数据库服务,CDP Operational Database是一项高性能NoSQL数据库服务,可为关键业务运营应用提供卓越的规模和性能,包括:
进化的模式支持,发挥数据的作用,通过允许对基础数据模型进行更改而无需更改应用来保留应用设计的灵活性。
根据集群的工作负载利用率自动扩展,从而优化基础架构利用率和成本。
使用HBase API的NoSQL键值多模式客户端访问和带有JDBC的关系型SQL,使习惯于使用MySQL、Postgres等构建应用的开发人员可以访问CDP Operational Database。
CDP数据生命周期集成以及SDX安全和治理。
CDP Data Visualization(数据可视化)
分析师和数据科学团队需要能够以业务利益相关者可以快速理解和操作的方式来分享和解释分析结果。业务用户还需要能够通过自助式服务,从数据和预测模型中发现和管理自己的可视化文件。CDP Data Visualization简化了丰富的可视化仪表板、报告和图表的管理,以业务语言提供灵活的分析洞察,从而实现降低整个企业机构访问数据和分析功能的门槛:
技术团队可以通过拖放自定义交互式应用来快速分享分析和机器学习模型。
业务团队和决策者可以运用数据洞察,并制定可信赖且明智的业务决策。
所有团队都能受益于使用人工智能技术的自然语言搜索和视觉推荐进行的快速数据探索。
面市情况
CDP Data Engineering已在AWS上全面上市。CDP Operational Database和CDP Data Visualization目前处于技术预览阶段,预计今年晚些时候全面上市。
资源
全新在线计算器,用于比较企业数据云的价值。