专利名称:一种分布式架构的特征自动生成方法和系统专利类型:发明专利发明人:杨帆,周楚杰,黄馨申请号:CN202011283601.X申请日:20201117公开号:CN112380205A公开日:20210219
摘要:本发明涉及一种分布式架构的特征自动生成方法,包括:S1,从数据库中抽取样本对应的数据,每张表存储为一张新的数据表;S2,对抽取的数据进行清洗加工;S3,将数据表进行分区,使得归属同一个样本的所有数据都存放到同一个分区中;S4,采用分布式计算引擎对数据进行特征生成;S5,将每个子节点生成的特征数据文件进行合并,合成一个完整的特征数据文件。本发明还对应提出了一种分布式架构的特征自动生成系统。本发明实现了一种针对特征自动生成算法的分布式架构,能够应用分布式计算高效率的进行特征自动生成,能够进行大数据处理,保证了特征的高效生成。
申请人:北京融七牛信息技术有限公司
地址:100043 北京市石景山区实兴大街30号院3号楼2层A-0502房间
国籍:CN
代理机构:北京山允知识产权代理事务所(特殊普通合伙)
代理人:胡冰
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容