在数据挖掘中,特征工程的思路怎么获得呢?特别是对于一些脱敏的数据,该怎么构建思路?
lightgbm只经过一次迭代就触发early-stop是什么原因?
如何判断强弱特征?
为什么在数据预处理时,要对长尾分布进行log化为正态分布?
对原始数据,需要做哪些可视化工作
在竞赛或者实际问题当中,如何处理不同类型的特征,如何构造新特征,特征选择方法?特征降维等?
比赛数据是不能做任何预处理吗?
常见的时间序列数据的特征工程方法有哪些?
能否就特征工程中的类别-类别编码和类别-数值编码举例讲解下?