参加r语言与kaggle竞赛赛是怎样一种体验

参加kaggle竞赛所需要的技能树是怎样的?_kaggle竞赛_词汇网
参加kaggle竞赛所需要的技能树是怎样的?
责任编辑:词汇网 发表时间: 14:29:23
题主非统计专业
上一集:没有了 下一集:
相关文章:&&&&&&&&
最新添加资讯
24小时热门资讯
附近好友搜索参加kaggle竞赛是怎样一种体验? - 知乎3691被浏览177880分享邀请回答1164 条评论分享收藏感谢收起休闲娱乐生活服务其他类别
一个实例告诉你:Kaggle 数据竞赛都有哪些套路将结果提交到Kaggle的网站之后,我们发现我们的准确率是79.904%,居然已经进了20%了,还是蛮顺利的嘛,那么如何继续提升我们的成绩呢?最有效的方法莫过于构建新的特征,寻找更有效的特征永远是提升正确率的王道。当然了,也有一些简单的办法有可能能帮助我们提高成绩,那就是三个臭皮匠顶个诸葛亮。我们选择几个相关性不是很大的分类器,用它们预测的结果进行投票,往往一定程度上也能提高我们的成绩,比如下面这种做法:from sklearn.ensemble import VotingClassifiermodel=VotingClassifier(estimators=[('lr',lr),('svc',svc),('rf',randomf),('GDBT',gdbt)],voting='hard',weights=[0.5,1.5,0.6,0.6])model.fit(x_tr,y_tr)print model.score(x_te,y_te)输出为:0.测试集上的表现可真棒啊!!!这一下很大的鼓舞了我的信心,所以赶紧用这个模型做个结果提交一下看看。结果,正确率变成了78.649%,正确率下降了,整段垮掉!!!前面说的那么有模有样,结果被无情的现实狠甩一记耳光啊……不过最重要的还是这个思路,比如你可以和你的小伙伴各做一个模型,你们构建模型的思路肯定不一样啊,那么模型的相关性比较低,这样组合起来提升效果应该比较明显,我就强行这样圆一下吧。其实我相信到这里大家也看出来了,做的这个模型我们还是把绝大数的时间花在了模型的构造上了,真正模型训练啥的并没有占据我们太多的时间。所以还是那句话,数据和特征决定了机器学习的上限,而模型和方法只能是逼近这个上限,好好做特征吧。TensorFlow & 神经网络算法高级应用班” 要开课啦!从初级到高级,理论 + 实战,一站式深度了解 TensorFlow!本课程面向深度学习开发者,讲授如何利用 TensorFlow 解决图像识别、文本分析等具体问题。课程跨度为 10 周,将从 TensorFlow 的原理与基础实战技巧开始,一步步教授学员如何在 TensorFlow 上搭建 CNN、自编码、RNN、GAN 等模型,并最终掌握一整套基于 TensorFlow 做深度学习开发的专业技能。两名授课老师佟达、白发川身为 ThoughtWorks 的资深技术专家,具有丰富的大数据平台搭建、深度学习系统开发项目经验。时间:每周二、四晚 20:00-21:00开课时长:总学时 20 小时,分 10 周完成,每周 2 次,每次 1 小时线上授课地址:http://www.mooc.ai/
5热门新闻更多
热门游戏相关新闻热门视频发现好货
阅读下一篇视频推荐推荐这篇日记的豆列
&&&&&&&&&&&&

我要回帖

更多关于 kaggle竞赛经典数据集 的文章

 

随机推荐