训练机器学习模块可能包括生成模糊查询结果以及从模糊查询结果中生成正面和负面的训练示例。
生成模糊查询结果可以包括从搜索引擎从文图提供档集返回搜索结果,每个结果均具有有效性分数,并且生成训练示例可以包括选择具有最高分数的预定数量的文档作为正训练示例并且选择具有低于阈值的分数的预定数量的文档作为负训练示例。
提供搜索结果可能包括从过去搜索的搜索记录中提取搜索结果。
生成正面和负面的训练示例可能涉
及对查询响应执行实体匹配并选择最常出现的实体作为正面训练示例。
该方法还可以包括基于至少一个加权特 电报筛查 征的权重确定第二实体的置信度值(例如上面提到的关联值)。
识别图中的第二个实体还可以包括基于置信度值选择第二个实体。确定第二实体的置信度值可以包括确定与第二实体相关联的两个或更多个特征,并使用两个或更多个特征的分数的组合作为第二实体的置信度值。
该方法包括训练机器学习模块以生成针对搜索查询的多个加权特征,并接收搜索查询,
该方法还包括从搜索查询中识别第一实体,其中第一实体存在于数据图中,并将第一实体提供给机器学习模块。
该方法还可以包括从机器学习模块接收多重加权特征的子集并生成包含使用多重加权特征的子集获得的信息的响应。
这些可能包括下列一个或多个特征
培训模块可能包括,例如:
- 从数据图中为搜索查询选 基于价值的销售 择正面和负面的例子
- 将正例、反例以及数据图交给机器学习模块进行训练。
- 从模块接收多加权特征,其中每个特征代表数据图中的一个连接
- 将至少一个多重加权特征存储在与查询关联的模型中
此过程遵循的一些特征可能包括将特图提供征的路径长度限制为预定长度。路径长图提供度是特定特征在路径中遍历的边数或连接数。此外,还可以从搜索数据集中生成正例和反例。
多重加权特征可以排除数据图中出现频率低于阈值的特征。
生成对搜索查询的响应可以包括识别数据图中具有最高权重的第二个实体,并将来自第二个实体的信息合并到响应中。
第二实体的权重可以是与第二实体 消費者數據 相关联的每个特征的总和。
此外,计算机系统可以包括由边标记数据图和元组构建的存储器。每个元组代表通过关系连接的两个实体。
这些单独的工作步骤可以包括:
- 接收搜索查询
- 提供查询的搜索结果
- 从搜索结果中生成正面和负面图提供的训练样本
- 向机器学习模块提供正例和反例
该操作还可以包括从模块接收
针对查询的多个特征,并将多个特征存储在模块中作为与查询相关联的模型。
特征的数量还可以排除数据图中出现次数少于预定次数的特征。