北师18秋《数据挖掘》离线作业答案

发布时间:2024-01-06 09:01:13浏览次数:12
《数据挖掘》作业(一)答案客观题部分:一、选择题(每题 10 分,共 50 题)参考答案:1A,2D,3A,4A,5A主观题部分:一、简答题(20 分)参考答案:(1)概念分层定义了一组有低层概念集到高层概念集的映射。(2)概念分层以组织成树的节点集表示其中每个节点本身代表一个概念。(3)一个特殊的节点 all 作为树根,表示给定维的最一般值。(4)概念分层的树叶对应维的原始数据,形成一般的格和偏序。(5)概念分层是一种有用的背景知识形式,它使得原始数据可以在较高的,一般化的抽象层上进行处理。如果结果数据过于一般化,概念分层也允许转化或下转,概念值用较低层的概念代替。二、计算题(30 分)参考答案:先判定中位数区间:N=200+450+300+1500+700+44=3194;N/2=1597 200+450+300=950<1597<2450=950+1500∵ ; 20~50 ∴ 对应中位数区间。 ∴则近似中位数值为:median=L1+(N2−(∑freq)lfreqmedian)∗width带入 L1 = 20, N = 3194, (∑freq)l=950, freqmedian= 1500, width = 30 得:median=20+(1597−9501500)∗30=32.94即其近似中位数为 32.94。
文档格式: docx,价格: 5下载文档
返回顶部