〆 推荐算法实战 项亮 [学习笔记四]

⚠ Had I not seen the sun, I could have borne the shade.

Step Four: enviroment – python3.7

基于图的模型 graph-based model

用户行为数据的二分图表示

一般的,图中定点的相关性取决于三个方面:

  •  两个顶点之间的路径数;
  •  两个顶点之间路径的长度;
  •  两个顶点之间的路径经过的顶点。
    而相关性高的一对顶点一般具有如下特征:
  •  两个顶点之间有很多路径相连;
  •  连接两个顶点之间的路径长度都比较短;
  •  连接两个顶点之间的路径不会经过出度比较大的顶点。

举一个简单的例子,如图2-19所示,用户A和物品c、e没有边相连,但是用户A和物品c有两条长度为3的路径相连,用户A和物品e有两条长度为3的路径相连。那么,顶点A与e之间的相关性要高于顶点A与c,因而物品e在用户A的推荐列表中应该排在物品c之前,因为顶点A与e之间有两条路径——(A, b, C, e)和(A, d, D, e)。其中,(A, b, C, e)路径经过的顶点的出度为(3, 2, 2, 2),而(A, d, D, e)路径经过的顶点的出度为(3, 2, 3, 2)。因此,(A, d, D, e)经过了一个出度比较大的顶点D,所以(A, d, D, e)对顶点A与e之间相关性的贡献要小于(A, b, C, e)。

注意

仅凭上述观点,我无法得出e优先级高于c,因为c也是(3, 2, 3, 2)和(3, 2, 2, 2)的两条线,求解?

基于随机游走的PersonalRank算法

真孒今将命


此致: 敬礼!

送赵法师还蜀因名山奠简

作者: 李隆基

摘自: 《全唐诗》

道家奠灵简, 自昔仰神仙

真孒今将命, 苍生福可传

江山寻故国, 城郭信依然

二室遥相望, 云回洞里天

座右铭: 进化是形成我们的身体形状和我们内在本能的主要力量, 他赋予我们大脑和学习机制,使我们可以根据经验实现自我更新。我们还需要终生学习,以改变我们的行为,从而适应包括进化论还不能预测的和可预测的各种环境。
Evolution is the major force that defines our bodily shape as well as our built-in instincts and reflexes. We also learn to change our behavior during our lifetime. This helps us cope with changes in the environment that cannot be predicted by evolution. Organisms that have a short life in a well-defined environment may have all their behavior built-in, but instead of hardwiring into us all sorts of behavior for any circumstance that we could encounter in our life, evolution gave us a large brain and a mechanism to learn, such that we could update ourselves with experience and adapt to different environments.