




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
--WORD格式---可编辑--- --WORD格式--可编辑---精品资料分享-- 一、 单选题 “大数据”是指规模超过1000TB的数据集。正确答案:× 2. 概率为0的事件是不可能事件,概率为 1的事件是必然事件。 正确答案: × 3. 将总体中的各单位按某一标志排列, 再依固定间隔抽选调查单位的抽样方式为等距抽样。 正确答案: √ 统计图中的散点图主要用来观察变量之间的相关关系。正确答案:√ 抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。正确答案:× Datahoop1.2版中K-means聚类分析要求输入的数据必须是数值型数据。正确答案:√ 如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。 正确答案: × SQL中删除表的命令是“DELETETABLE”。正确答案:× 聚类分析中,各变量的取值在数量级上不能有过大的差异。正确答案:√ 如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。 正确答案: × 11.需求定价法的核心思想是力求在需求高涨时收取较低价格, 价格。 而当需求低落时则收取较高 正确答案: × 使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。正确答案:√ 13.线性回归模型的拟合优度可采用可决系数进行评判。 可决系数越小,模型拟合效果越差。 可决系数越高,模型拟合效果越好; 正确答案: × 一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。 正确答案: × 决策树中包含根结点、叶结点、内部结点和外部结点。正确答案:× 二、 单选题 1.检查异常值常用的统计图形是( ) A、柱状图 B、箱线图 C、帕累托图 D、气泡图 正确答案: B 什么是KDD?() 、数据挖掘与知识发现 B、领域知识发现 C、文档知识发现 D、动态知识发现 正确答案: A 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡 听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!" 以上对话体现了数据分析方法中的( ) 、关联 B、聚类 C、分类 D、自然语言处理 正确答案: A 4.假设检验中显著性水平 是( ) 、推断时犯取伪错误的概率 B、推断时取伪弃真的概率 C、正确推断的概率 D、是推断的可信度 正确答案: B 5.矩估计的基本原理是( ) 、用样本矩估计总体矩 B、使得似然函数达到最大 C、使得似然函数达到最小 D、小概率事件在一次试验中是不可能发生的 正确答案: A 6.SQL查询语句中 HAVING 子句的作用是( ) 、指出分组查询的范围 B、指出分组查询的值 C、指出分组查询的条件 D、指出分组查询的内容 正确答案: C 7.以下哪项关于决策树的说法是错误的( ) 、冗余属性不会对决策树的准确率造成不利的影响 B、子树可能在决策树中重复多次 C、决策树算法对于噪声的干扰非常敏感 D、寻找最佳决策树是 NP完全问题 正确答案: C 8.以下哪种方法不属于于监督学习模型( ) 、决策树 B、线性回归 C、关联分析 D、判别分析 正确答案: C 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3, 4},{2,3,5},{3,4,5}假定数据集中只有 5个项,若采用合并策略,则由候选产生过程 得到4-项集不包含( ) A、1,2,3,4 B、1,2,3,5 C、1,2,4,5 D、1,3,4,5 正确答案: C 10.下列不属于原始数据来源的是( ) 、行政记录 B、统计调查 C、统计年鉴 D、实验 正确答案: C 11.下列不属于分类算法的是( ) A、C4.5算法 B、逻辑回归 C、KNN算法 D、TF-TDF算法 正确答案: D 12.相关分析与回归分析的一个重要区别是( ) 、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示 B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度 C、两者都研究变量间的变动关系 D、两者都不研究变量间的变动关系 正确答案: A

王子****青蛙
实名认证
内容提供者


最近下载