数据分析挖掘培训测验

感谢大家参与数据分析挖掘课程的考试,请认真填写。考题设置:1-7题为单选题;8-10题为多选题;11-20题为单选判断题;21题为主观题,请看清作答要求。

Q1:基础信息(与提交的主观题信息一致)

姓名
工号
一级部门
二级部门/项目组
邮箱

:分割线

Q2:1、下列哪项不属于跨行业数据挖掘标准流程;( )

商业理解
数据理解
模型构建
人工智能

Q3:2、从订购用户中随机抽取2万用户,为订购用户中随机抽取4万用户,组成数据集合。这是基于以下哪种抽样方法;( )

随机抽样
分层抽样
整群抽样 
系统抽样

Q4:3、以下哪个不属于数据标准化方法;( )

zscore
minmax
sigmoid
K-Modoids

Q5:4、以下组件不属于分类预测类算法;( )

cart算法
Logistic算法
支持向量机
线性回归

Q6:5、分类算法训练时,命中率和覆盖率如何取舍;( )

命中率越大越好
覆盖率越大越好
F值越大越好
结合业务平衡命中率覆盖率

Q7:6、下列哪项不属于模型部署前前台跟踪报告的主要内容;( )

数据稽核
客户群体稳定性报告
变量分析报告
评分分布报告

Q8:7、MapReduce采用了下面哪种思想。( )

分而治之
以终为始
冠军挑战者 
不易、变易、简易

Q9:8、数据主要从以下(多选)两个方向解决业务问题;( )

业务流程
拓展思路
业务收入
提高效率

Q10:9、在数据据挖掘过程中,数据预处理包括(多选)等;( )

缺失值处理
异常值处理
无效数据删除
衍生变量生成

Q11:10、数据探索分析常用方法(多选);( )

相关性分析
方差分析
图形分布
卡方检验

:分割线

Q12:11、one-hot是数据预处理时常用的数据标准化方法;( )

Q13:12、Pearson相关性分析组件只能选择连续型数据类型字段,即字段类型为flaot或者double类型的;( )

Q14:13、PCA主成份分析通过线性组合实现对原始数据的降维,在进行PCA降维时不用对原始数据进行数据标准化;( )

Q15:14、使用PCA算法组件时,如果输入字段为5个时,设定的降维可以大于5;( )

Q16:15、决策树是机器学习中比较常用的有监督学习的分类方法,其中常用的是C5.0;( )

Q17:16、cart算法组件,设定的树的深度值越大,预测效果命中率越高、覆盖率越低;( )

Q18:17、在做k-means聚类前必须对数据进行标准化;( )

Q19:18、Logistic算法组件的目标标签列是可多选的;( )

Q20:19、3Sigma法常用来解决分类问题;( )

Q21:20、字典Dict,是R中唯一的映射类型,是一个无序的集合,通过键来存取值;( )

:分割线

:本次考试,由两部分考试结果组成最终成绩,选择题和判断题占本次成绩的60%,主观题占本次成绩的40%。请您及时完成上面的考试题目并提交。另外,第21题为主观题,请按要求完成考试题目,将答案在11月20日(周一)12点之前发至项目组培训负责人邮箱,由负责人统一打包发送至bonc-academy@bonc.com.cn,谢谢您的配合。

:21、某省X卡情况数据如下:[图片]要求:用PPT完成你的分析及建议,材料中要提现(1)从数据中你看到了哪些主要信息反映了哪些问题?(2)如果让你提出一个运营建议,你会怎么做?答案:标准1、PPT分析思路逻辑清晰与否;2、问题发现是否准确;3、建议是否合理;4、PPT版面组织是否简洁易读美观;

问卷网
数据分析挖掘培训测验
关于
1年前
更新
7
频次
26
题目数
分享