赛题理解

赛题理解

4149关注者46问题数

AI极客请集合!2022 iFLYTEK A.I.开发者大赛赛题上新啦!

DF赛事上新啦!本次上线赛题来自2022 iFLYTEK. A.I.开发者大赛,三大赛题共同登陆DataFountain平台,欢迎广大AI极客们前来挑战! 大赛简介: 2022第五届科大讯飞AI开发者大赛,是由科大讯飞发起,中国信息协会联合主办的人工智能创新算法与应用竞赛。本届大赛汇聚行业前瞻场景、覆盖十大新兴产业、开...
DF运营小姐姐748  有用  评论

金融风控:怎样通过贷前尽职调查,制定风险控制方案?

一、信贷风险控制是什么? 基本概念 关于信贷风险控制的概念,从不同的角度会有不同的解答,有宏观和微观层面的,有内部和外部层面的,有内容和标准层面的……总之这是个十分复杂和宽泛的概念,在此探讨的是在微观实践的视角下信贷风险控制的内涵,它实际上以追求利润最大化为目标,在规模、风险、效...
黄丽安724  有用  评论

疫情可视化赛题网页链接是必须提交的吗

建议提交链接~
小D同学420  有用  评论
1 个回答 

每场比赛只有前50-100名有排名吗,100名以后的就没有排名了?

这个每道赛题具体排名设置不一样的吧
rise523  有用  评论
1 个回答 

想问大数据类竞赛决定最终成绩的要素是什么?

国内数据挖掘比赛往往采用决赛答辩的制度,通常会有一群评委出现在答辩现场,他们大多是主办的公司的资历深、职级高的领导;他们大多没什么数据挖掘经验,没亲自做过什么正经的数据挖掘项目;他们也许读了一些相关论文,也许了解了一些相关概念,便成为了领域内的专家。他们对选手们的方法指指点点,评...
人丑就多读书591  1  评论
1 个回答 

离散制造过程中典型工件的质量符合率预测的数据是离散值吗?

是的,可以这么认为。在产品制造过程中,工艺和质量参考值是离散的,其实在整个制造业中制造数据大多是离散值。
机械开源网635  1  评论
1 个回答 

算法组:卫星云图+地面观测云图预测辐照量999999

999999可以当做是缺省值,训练的时候去掉它即可。
红星闪闪红星756  4  评论
1 个回答 

请问在比赛中提交的代码中可以任意使用python第三方库的函数吗?比如sklearn、pandas、numpy等等

随便用,这些都是工具类包,不可能禁止使用。
乔大大657  6  2
2 个回答 

请问识别出的实体中英文大小写对结果有影响吗?

赛题并没有特殊说明,看看训练数据中实体有没有出现大小写同时出现的情况。
红星闪闪红星549  5  评论
2 个回答 
红星闪闪红星712  6  评论
2 个回答 

新实体定义的疑问-互联网金融新实体发现

会存在一些噪声。同时根据赛题要求:...和训练集中出现的实体认为是已知实体。所以训练集中出现的实体就不用考虑了。
红星闪闪红星974  4  评论
2 个回答 

能不能用无监督的方法对训练样本分类

可以呀,比如使用kmeans,它是一个无监督方法,但是对于簇中的数据,可以使用标签占多数的数据对应的标签作为簇的类标进行分配。
红星闪闪红星938  21  评论
2 个回答 

比赛数据是不能做任何预处理吗?

肯定是可以做的呀,像数据挖掘比赛,需要对数据集进行大量的数据预处理:去除异常值,归一化,标准化等等。同时,对特征的提取也是很重要的。如果不能做预处理,那么统计学相关的知识还有什么用呢?
红星闪闪红星3058  19  评论
5 个回答 

有没有大佬帮忙查看下,为什么我参赛了下载不了数据集,大哭

好几个朋友都遇到这个情况,应该是DF网站出了问题,不用着急。
阿水233788  11  1
1 个回答 

离散制造过程中典型工件的质量符合率预测 测试集问题

纯粹的顺序错误,你可以看一下测试集parameter10的特征值和训练集的特征值是没什么区别的,所以只是特征顺序的村乱,并不影响模型
乔大大910  6  评论
2 个回答 

请问OCR和识云题目都提供免费计算资源吗

学生有aws卷,不过群里有人发免费的,你懂就行,我不想帮人打广告,哈哈哈。
snail654  4  评论
1 个回答 

离散制造过程中典型工件的质量符合率预测 测试集问题

顺序错了(应该说没什么错,只是位置变了吧!)! pandas 读出来操作就行了。官方不会犯这么浅显的错误的,如果犯了,这么久了,肯定也改了。放心上分。求大佬们带飞,嘻嘻!!!
snail910  3  评论
2 个回答 

在数据挖掘中,特征工程的思路怎么获得呢?特别是对于一些脱敏的数据,该怎么构建思路?

能够通过业务理解或者客观规律去解释的特征,一般是有效的特征。 1.业务理解提取特征 1) 通过问题背景,查阅相关知识进行提取。 2) 查阅问题相关论文,进行深入理解 3) 自身体验问题;如果我是执行人,我会对问题采取什么措施,这些数据是如何产生的,当前的数据能够对问题作出什么说明...
snail868  4  评论
4 个回答 

比赛数据是不能做任何预处理吗?

您好,很荣幸能回答您的问题: 预处理是比赛的一个必要操作,很多时候原始数据里面有很多噪声数据,如果能很好地处理好这些数据,模型的表现很可能会得到巨大提升。 毕竟数据比赛里面:数据>特征>模型。因此,数据是比赛的根本。而且比赛规则是只要读入原始数据并且能稳定复现结果,中间不读入不可解...
Crawler3058  14  评论
5 个回答 

比赛数据是不能做任何预处理吗?

预处理某些时候是必要的,而且是提分的关键。 预处理甚至某些时候决定了比赛得分的上限。 包括数据清洗,白化/标准化,融合构造等等
seefun3058  10  评论
5 个回答 

比赛数据是不能做任何预处理吗?

我觉得预处理应该是有必要的,本人在做互联网情感分析赛道试题时,发现给的训练集中的文本样例中就有很多脏数据,比如:一段文本中出现了网页链接,图片链接等无价值信息。这个肯定就是要洗刷掉的,不然会影响精度。而且最后提交的只需要最终的结果即可,所以不必太在意预处理过程了,只要能训练出好的...
DF15663013132233058  15  评论
5 个回答 

 

这个人很懒,还没有评价自己!
0
发布
0
回答
0
提问
0
粉丝