机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,包括分类、协同过滤、聚类分析、统计分析等理论方法。天云大数据的机器学习引擎基于分布式平台,为数据挖掘提供了算法支撑,能够处理海量数据深度挖掘。
复杂网络引擎(Hibert)是一款对网络科学研究及应用的专业数据处理引擎。用户可以快速方便的实现对关联数据的加载、建模、存储、计算以及可视化展示。在实现数据分布式存储的同时提供了如最短路径、Ranking、随机游走、子图发现等诸多复杂网络的算法实现。
BDP(Beagledata Platform)是一款基于Hadoop生态体系的企业级大数据中间件平台。它集成了所有常用的成熟Hadoop子项目,支持多种Hadoop开源版本,可同时管理多套集群资源,是同时具有开放性、界面友好型、易用性、安全性和可维护性的基础平台产品。
目前,国内商业银行面临客户流失率面临增多趋势,部分可达20%甚至更高。而获得新客户的成本,可达维护现有客户的5倍。因此从海量客户交易记录中挖掘出对流失有影响的信息,建立高效的客户流失预警体系及量化模型,合理预测客群的潜在流失风险,成为现代商业银行在高速信息处理能力之下的理想选择。
银行核心系统普遍采用的传统IOE架构,但面对未来业务增长以及每年的巨大成本投入其短板已日益凸显,为了解决核心系统的负担,通过本方案设计将核心查询类交易迁移到分布式大数据平台,从而大幅降低了核心系统的性能压力和成本问题,同时也满足了国内金融行业去IOE政策要求。
MaximAI平台可分布式运行各类热门常用算法,加快建模速度,提升模型预测准确率。结合创新的图形用户界面交互Free Coding模式,将数据科学家从往日枯燥繁琐的编程建模方式中解放,使未熟练掌握Hadoop和Spark语言的业务人员也可轻松快捷地利用数据挖掘技术。目前MaximAI平台已支持四大类、共八种算法使用Free Coding模式;同时,为确保惯于传统编程方式建模的用户仍可顺畅使用平台,MaximAI平台也集成了Scala和Python语言中主流的数据预处理、数据可视化和算法模块,通过REST API接口处理数据,基于SparkMLlib库自主编写代码,快速建模。
工程化管理平台实现了对各数据建模整个生命周期的可视化和模块化管理,并以友好的用户界面和高级的技术特性,整合用户管理、任务管理、数据管理和模型管理等业务级管理任务。
MaximAI平台的数据存储和加载功能模块基于Hadoop/Spark集群,通过分布式文件系统HDFS的数据接口,提供数据整合和数据质量管理等技术,支持海量数据的快速存储和加载。
MaximAI平台集合了众多常用的数据处理和统计分析技术,通过交互式和可视化的工具,实现数据处理、变量分析、和数据可视化等,支持对数据快速分析和整体把握。
MaximAI平台集合众多主流的机器学习算法,结合Hadoop/Spark平台的分布式能力,支持基于海量数据集的全量数据描述性建模,并且提供菜单式参数调优界面,实现了企业级AI模型生产和分析。
MaximAI平台基于海量数据的描述性探究建模结果,通过对模型和数据的再处理,得到数据的独立化预测性模型,实现了对测试数据的一键式预测。
MaximAI平台集成了多种编程环境,支持用户的自主开发,以及特定场景的多环境编程,实现针对特定客户的系列业务开发。