记一次模型改造后训练耗时翻一千倍的事件

将wide&deep升级为deepfm,中间对emb矩阵进行了square,导致耗时直接增加1000倍。

计算top_k的问题

某次计算召回item在top_k的概率时,发现十分耗时,经排查发现是因为item_size设置过大导致的,千万级别的相乘会很慢,但到百万级别后就好很多。