竞赛baseline开源贴,大家这些年珍藏的代码,欢迎发布于此~
《Resource Sharing》---NLP专题分享之【学习资料推荐】
《Resource Sharing》---NLP专场之【个人经验贴及案例分享】
为什么在数据预处理时,要对长尾分布进行log化为正态分布?
什么是命名实体识别(NER),以及它在自然语言处理中的应用是什么?
对原始数据,需要做哪些可视化工作
什么是机器翻译,现代机器翻译系统是如何工作的?
DF第二期算法公益直播课【自然语言处理—虚假新闻检测与文本情感识别实战】
训练集不均衡,测试集是均衡的,标签有10个左右,最多的标签数量是最少标签的400倍左右,这种情况下怎样对数据进行预处理?