-
- 素材大小:
- 12.41 MB
- 素材授权:
- 免费下载
- 素材格式:
- .ppt
- 素材上传:
- ppt
- 上传时间:
- 2018-02-11
- 素材编号:
- 117999
- 素材类别:
- 学校PPT
-
素材预览
这是一个关于统计学数据的图表展示PPT课件,主要介绍数据的预处理、品质数据的整理与显示、数值型数据的整理与显示、合理使用图表。第 3 章 数据的图表展示第 3 章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表学习目标了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法用Excel作频数分布表和图形合理使用图表 数据的预处理数据审核检查数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征数据透视按需要汇总数据审核数据审核—原始数据 (raw data) 完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等数据的审核—二手数据 (second hand data) 适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要时效性审核尽可能使用最新的数据确认是否有必要做进一步的加工整理数据筛选与排序数据筛选 (data filter) 当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除数据筛选 (data filter) ,欢迎点击下载统计学数据的图表展示PPT课件哦。
统计学数据的图表展示PPT课件是由红软PPT免费下载网推荐的一款学校PPT类型的PowerPoint.
第 3 章 数据的图表展示第 3 章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表学习目标了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法用Excel作频数分布表和图形合理使用图表 数据的预处理数据审核检查数据中的错误数据筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征数据透视按需要汇总数据审核数据审核—原始数据 (raw data) 完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等数据的审核—二手数据 (second hand data) 适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要时效性审核尽可能使用最新的数据确认是否有必要做进一步的加工整理数据筛选与排序数据筛选 (data filter) 当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除数据筛选 (data filter) 用Excel进行数据筛选 数据排序 (data rank) 按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成数据排序 (方法) 分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)>…>x(n) 数据透视表数据透视表 (pivot table ) 可以从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图形成一个符合需要的交叉表(列联表) 在利用数据透视表时,数据源表中的首行必须有列标题数据透视表 (用Excel创建数据透视表) 第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】第5步:在【向导—布局】对话框中,依次将”分类变量“拖至 左边的“行”区域,上边的“列”区域,将需要汇总的“变 量” 拖至“数据区域” 第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表 数据的整理与显示 (基本问题) 要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法对分类数据和顺序数据主要是作分类整理对数值型数据则主要是作分组整理适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据分类数据的整理与图示分类数据的整理 (基本过程) 1. 列出各类别分类数据的整理 (可计算的统计量) 频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据个数占全部数据个数的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值个数的比值分类数据整理—频数分布表 (例题分析) 分类数据的图示—条形图 (bar Chart) 用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式主要用于反映分类数据的频数分布绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(column chart) 分类数据的图示—条形图 (例题分析) 分类数据的图示—对比条形图 (side-by-side bar chart ) 分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变化趋势分类数据的图示—对比条形图 (例题分析) 分类数据的图示—帕累托图(pareto chart) 按各类别数据出现的频数多少排序后绘制的柱形图 主要用于展示分类数据的分布分类数据的图示—饼图 (pie Chart) 也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比乘以3600确定分类数据的图示—饼图 (例题分析) 顺序数据的整理与图示顺序数据的整理 (可计算的统计量) 1. 累积频数(cumulative frequencies):各类别频数的逐级累加 2. 累积频率(cumulative percentages):各类别频率(百分比)的逐级累加 顺序数据的频数分布表 (例题分析) 顺序数据的频数分布表 (例题分析) 顺序数据的图示—累计频数分布图 (例题分析) 环形图 (doughnut chart) 环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究 用于展示分类和顺序数据环形图 (例题分析) 数据分组组距分组 (要点) 将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组组距分组 (步骤) 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,组数一般为5K 15 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数统计出各组的频数并整理成频数分布表 组距分组 (几个概念) 1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值频数分布表的编制 (例题分析) 等距分组表 (上下组限重叠) 等距分组表 (上下组限间断) 等距分组表 (使用开口组) 分组数据—直方图 (histogram) 用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图分组数据的图示 (直方图的绘制) 分组数据—直方图 (直方图与条形图的区别) 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据 未分组数据—茎叶图 (stem-and-leaf display) 用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据未分组数据—茎叶图 (例题分析) 未分组数据—箱线图 (box plot) 用于显示未分组的原始数据的分布由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接该箱线图也称为Median/Quart./Range箱线图 未分组数据—单批数据箱线图 (箱线图的构成) 未分组数据—单批数据箱线图 (例题分析) 分布的形状与箱线图未分组数据—多批数据箱线图 (例题分析) 未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range) 未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range) 时间序列数据—线图 (line plot) 表示时间序列数据趋势的图形时间一般绘在横轴,数据绘在纵轴图形的长宽比例大致为10 : 7 一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断时间序列数据—线图 (例题分析) 时间序列数据—线图 (例题分析) 两个变量间的关系—二维散点图 (2D Scatterplots) 展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图两个变量间的关系—二维散点图 (2D Scatterplots) 三个变量间的关系—气泡图 (bubble chart) 显示三个变量之间的关系图中数据点的大小依赖于第三个变量多变量数据—雷达图 (radar chart) 也称为蜘蛛图(spider chart) 显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度多变量数据—雷达图 (雷达图的制作) 设有n组样本S1,S2,… , Sn,每个样本测得P个变量X1,X2 ,… , XP,要绘制这P个变量的雷达图,其具体做法是多变量数据—雷达图 (例题分析) 多变量数据—雷达图 (例题分析) 数据类型及图示 (小结) 鉴别图表优劣的准则一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况统计表的结构统计表的设计合理安排统计表的结构总标题内容应满足3W 要求数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“—”表示必要时可在表的下方加上注释本章小结数据预处理的内容和目的分类和顺序数据的整理与显示方法数值型数据的整理与显示方法合理使用图表用Excel作频数分布表和图形
社会统计学ppt:这是社会统计学ppt,包括了绪论,单变量的描述统计分析,两个类别变量关系的描述统计,两个尺度变量关系的描述统计,类别变量与尺度变量关系的描述统计,概率与随机变量的概率分布,大数定律、中心极限定理与抽样分布,参数估计,假设检验的基本原理,总体均值与方差的假设检验,两个类别变量关系的假设检验,两个尺度变量关系的假设检验,类别变量与尺度变量关系的假设检验,非参数检验,抽样,时间序列等内容,欢迎点击下载。
统计学曾五一ppt:这是统计学曾五一ppt,包括了什么是统计,统计学的种类及其性质,统计学的基本概念,无处不在的统计,精确到小数点的爱情--统计学博士的求婚信等内容,欢迎点击下载。
统计学假设检验ppt:这是统计学假设检验ppt,包括了假设检验的一般问题,一个正态总体的参数检验,两个正态总体的参数检验,假设检验中的其他问题等内容,欢迎点击下载。