INT-B302 使用Azure流处理服务及HDInsight Spark 2.0实现分布式弹性机器学习

市场投资组合模型--其快速处理海量数据、实时生成洞察和决策的能力使企业成为整个市场活动生态的中心。模型通过在渠道级别分别连接每个市场行为与整体回报间的关系来提升ROI,其生成的洞察是相互连接的,从而可以更好的反应企业的真实情况避免优化孤岛。然而,由于传统基于单机的统计软件计算力的限制,分析师不得不主观通过对拟合参数施加严格的限制条件来降低计算量,以期在合理时间内计算出往往并非正确的可用解。考虑到市场投资组合模型的拟合过程实际上在使用相同工作流和算法模块对百万级别的训练集进行计算,这一过程得以实现在常规线性回归分析算法上处理非线性回归以及各变量的延迟和衰减效应组合。
本节内容将会以一个真实案例,介绍给如何利用Azure机器学习的Retraining API实现上述模型的大规模拟合计算。