专利名称:用于模型训练的样本数据处理方法及装置、存储介
质、终端
专利类型:发明专利发明人:李君浩,顾少丰申请号:CN201910967125.4申请日:20191012公开号:CN110796179A公开日:20200214
摘要:一种用于模型训练的样本数据处理方法及装置、存储介质、终端,所述方法包括:获取待处理样本数据,待处理样本数据包括应用程序列表;对于应用程序列表中的每一应用程序,获取应用程序的至少一个属性信息;对于每一属性信息,根据预设映射表确定所述属性信息关联的码值,所述预设映射表记录有属性信息与码值的关联关系;对于每一应用程序,基于所述应用程序的至少一个属性信息各自关联的码值生成编码信息;统计所述应用程序列表中所有应用程序各自对应的编码信息,其中,统计结果作为处理后的样本数据输入模型进行训练。通过本发明提供的方案能够充分利用应用程序列表中的冷门应用程序,以优化模型训练效果,使训练得到的模型更能体现用户偏好。
申请人:上海上湖信息技术有限公司
地址:200120 上海市浦东新区中国(上海)自由贸易试验区丹桂路999弄20号8楼802室
国籍:CN
代理机构:北京集佳知识产权代理有限公司
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容