当我们真正要开始构建推荐系统的时候,我们首先要从四个方面来考虑。首先是算法。究竟该选择什么样的算法?无论是协同过滤还是其他算法,都要基于自己的业务产品。第二是数据。当确定了算法时,应该选择哪种数据?如何处理数据?用什么样方法采集数据?有句话叫做“机器学习=模型+数据”,即便拥有了一个很复杂的模型,在数据出现问题的情况下,也无法在推荐系统里面发挥很好的效果。第三,在线服务。当模型训练完毕,数据准备充分之后,就会面对接收用户请求返回推荐结果的事项,这其中包含两个问题。其一,返回响应要足够迅速。如果当一个用户请求后的一秒钟才返回推荐结果,用户很可能因丧失耐心而流失。其二,如何让推荐系统具有高可扩展性。当 DAU 从最初的十万涨到一二百万时,推荐系统还能像最初那样很好地挡住大体量的请求吗?这都是在线服务方面需要考虑和面临的问题。第四,评估效果。做好上述三点,并不代表万事大吉,一方面,我们要持续迭代推荐算法模型与结构,另一方面要去构建一套比较完整、系统的评价体系和评估方法,去分析推荐效果的现状以及后续的发展。
神策推荐系统是一个完整的学习闭环。收集基础数据,通过机器学习算法模型形成应用。结果实时验证,从而指导数据源添加,算法反馈优化形成一个全过程、实时、自动、快速迭代的推荐闭环。
收起