1、商品包匹配模型完成在32w全流量数据的商品级问法的预打标,将阈值卡在0.95,召回的流量大约13%(总数据量为326588条,商品级问法数据召回41349条)。
2、随机抽样1000条样本进行人工检验打标,精度值为58%。
3、对错误进行分析:
1)模型训练集是原来模型预打标的阈值以上的数据加上聚类之后合并的一些问法数据,清洗不彻底。
2)导入ES库中的问法对应的句子数量少(有些只有个位数),知识太少,ES召回损失大
1、商品包匹配模型完成在32w全流量数据的商品级问法的预打标,将阈值卡在0.95,召回的流量大约13%(总数据量为326588条,商品级问法数据召回41349条)。
2、随机抽样1000条样本进行人工检验打标,精度值为58%。
3、对错误进行分析:
1)模型训练集是原来模型预打标的阈值以上的数据加上聚类之后合并的一些问法数据,清洗不彻底。
2)导入ES库中的问法对应的句子数量少(有些只有个位数),知识太少,ES召回损失大