对原始数据,需要做哪些可视化工作
为什么在数据预处理时,要对长尾分布进行log化为正态分布?
同时使用不同数据集的问题
关于收据分类的文本处理
请教大神们一个问题,关于bert这个模型对文本预处理的。
样本不平衡的处理手段,基本有哪些?
请问提升分数的数据预处理手段有哪些?重要性排序的话数据>模型>集成是合适的么
训练集不均衡,测试集是均衡的,标签有10个左右,最多的标签数量是最少标签的400倍左右,这种情况下怎样对数据进行预处理?
数钢筋比赛具体对于数据的处理方式