最新更新最新专题

您的位置:首页 > ppt下载 > PPT课件 > 学校PPT > 统计学数据整理与展示PPT

统计学数据整理与展示PPT下载

素材大小:
1.42 MB
素材授权:
免费下载
素材格式:
.ppt
素材上传:
ppt
上传时间:
2018-03-13
素材编号:
118387
素材类别:
学校PPT

素材预览

统计学数据整理与展示PPT

这是一个关于统计学数据整理与展示PPT,主要介绍数据的预处理、品质数据的整理与显示、数值型数据的整理与显示、合理使用图表。第3章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表数据的预处理数据审核数据审核—原始数据 (raw data) 完整性审核准确性审核二手数据(second hand data) 适用性审核时效性审核:尽可能使用最新的数据有必要做进一步的加工整理数据筛选(data filter) 找出符合条件的数据 例3-1 数据排序 升序和降序数据透视表(pivot table) 按需要汇总 例3-2 品质数据的整理与显示分类数据频数和频数分布(frequency distribution)条形图(bar Chart)、柱形图(column chart)、对比条形图帕累托图(pareto chart) 饼图 (pie Chart) 环形图 (doughnut Chart) 分类数据的整理 (可计算的统计量) 频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据个数占全部数据个数的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值个数的比值顺序数据的整理(可计算的统计量) 1. 累积频数(cumulative frequencies):各类别频数的逐级累加,欢迎点击下载统计学数据整理与展示PPT哦。

统计学数据整理与展示PPT是由红软PPT免费下载网推荐的一款学校PPT类型的PowerPoint.

第3章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表数据的预处理数据审核数据审核—原始数据 (raw data) 完整性审核准确性审核二手数据(second hand data) 适用性审核时效性审核:尽可能使用最新的数据有必要做进一步的加工整理数据筛选(data filter) 找出符合条件的数据 例3-1 数据排序 升序和降序数据透视表(pivot table) 按需要汇总 例3-2 品质数据的整理与显示分类数据频数和频数分布(frequency distribution)条形图(bar Chart)、柱形图(column chart)、对比条形图帕累托图(pareto chart) 饼图 (pie Chart) 环形图 (doughnut Chart) 分类数据的整理 (可计算的统计量) 频数(frequency) :落在各类别中的数据个数比例(proportion) :某一类别数据个数占全部数据个数的比值百分比(percentage) :将对比的基数作为100而计算的比值比率(ratio) :不同类别数值个数的比值顺序数据的整理(可计算的统计量) 1. 累积频数(cumulative frequencies):各类别频数的逐级累加 2. 累积频率(cumulative percentages):各类别频率(百分比)的逐级累加数值型数据的整理:分组组数应以能显示数据分布特征和规律为目的。实际中,组数一般为5K 15 组距是一个组上、下限之差,根据数据的最大值和最小值及组数确定。即 组距=( 最大值-最小值)÷ 组数统计频数可整理出频数分布表 频数分布表的编制 (例题分析) 等距分组表 (上下组限重叠) 等距分组表 (使用开口组) 分组 Step 1: Decide on the number of classes. 确定组数 A useful recipe to determine the number of classes (k) is the “2 to the k rule.” such that 2k > n. There were 80 vehicles sold. So n = 80. If we try k = 6, which means we would use 6 classes, then 26 = 64, somewhat less than 80. Hence, 6 is not enough classes. If we let k = 7, then 27 = 128, which is greater than 80. So the recommended number of classes is 7. Step 2: Determine the class interval or width. 确定组距 The formula is: i  (H-L)/k where i is the class interval, H is the highest observed value, L is the lowest observed value, and k is the number of classes. If ($35,925 - $15,546)/7 = $2,911 Round up to some convenient number, such as a multiple of 10 or 100. Use a class width of $3,000 分组 Step 3: Set the individual class limits 确定各组组限 Put each observation into only one category, namely avoiding overlapping or unclear class limits. Put approximately equal amounts of the excess in each of the two tails. Select convenient class limits. A guideline is to make the lower limit of the first class a multiple of the class interval. Step 4: Tally the vehicle selling prices into the classes. 数据归入各组数值型数据的显示数值型数据的图示分组数据:直方图 (histogram) 未分组数据茎叶图(stem-and-leaf display) 箱线图 (box plot) 时间序列数据—线图(line plot) 两个变量间的关系—二维散点图(2D Scatterplots) 三个变量间的关系—气泡图(bubble chart) 多变量数据—雷达图 (radar chart) 分组数据—直方图 (histogram) 用矩形的面积表示频率分布横轴表示数据分组,纵轴表示频率/组距,各组与相应的频率就形成了一个矩形,即直方图分组数据—直方图 (直方图与条形图的区别) 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列条形图主要用于展示分类数据,直方图则主要用于展示数值型数据未分组数据—茎叶图 (stem-and-leaf display) 用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留最后一位数字 5. 茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据未分组数据—茎叶图 (例题分析) 未分组数据—箱线图 (box plot) 用于显示未分组的原始数据的分布由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接未分组数据—单批数据箱线图 (箱线图的构成) 未分组数据—单批数据箱线图(例题分析) 未分组数据—多批数据箱线图 (例题分析) 未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range) 未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range) 股票分析中的K线图与箱线图类似K线图最早是日本德川幕府时代大阪的米商用来记录当时一天、一周或一月中米价涨跌行情的图示法,后被引入股市。K线图有直观、立体感强、携带信息量大的特点,是各类传播媒介、电脑实时分析系统应用较多的技术分析手段。以日K线为例:是根据股价(指数)一天的走势中形成的四个价位即:开盘价,收盘价,最高价,最低价绘制而成的。收盘价高于开盘价时,则开盘价在下收盘价在上,二者之间的长方柱用红色或空心绘出,称之为阳线;其上影线的最高点为最高价,下影线的最低点为最低价。收盘价低于开盘价时,则开盘价在上收盘价在下,二者之间的长方柱用绿色或实心绘出,称之为阴线,其上影线的最高点为最高价,下影线的最低点为最低价。   08..11.27-09.3.26日K线图时间序列数据—线图 (line plot) 表示时间序列数据趋势的图形一般时间为横轴,数据为纵轴图形的长宽比例大致为10 : 7 一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断时间序列数据—线图 (例题分析) 时间序列数据—线图 (例题分析) 两个变量间的关系—二维散点图 (2D Scatterplots) 展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图两个变量间的关系—二维散点图 (2D Scatterplots) 三个变量间的关系—气泡图 (bubble chart) 显示三个变量之间的关系 图中数据点的大小依赖于第三个变量多变量数据—雷达图 (radar chart) 也称为蜘蛛图(spider chart) 显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度多变量数据—雷达图 (雷达图的制作)  设有n组样本S1,S2,… , Sn,每个样本测得P个变量X1,X2 ,… , XP,要绘制这P个变量的雷达图,其具体做法是多变量数据—雷达图 (例题分析) 多变量数据—雷达图 (例题分析) 2010年1月20日至1月25日中国及周边版图地震情况版图周边共计有901条地震记录,其中大于ML5级的一共两次: 2010-01-24  10:36:13.8       35.45   110.70       15 Ms4.8  天然地震        山西河津 2010-01-21  10:02:02.8       13.70   125.85       33 Ms5.1  天然地震  菲律宾群岛地区其他统计图举例:火箭对热火比赛(20100116)中,火箭球员的助攻网络关系 社会网络关系 假如:我是教练组成员,我提议(单从本场比赛结果看): Brooks、Battier、Ariza、Andersen 在火箭进攻体系中位置比较重要,轮转的时候尽量保证其中的两人或三人同时在场。 Budinger 属于绝好的替补球员,但似乎不适合同 Battier、Hayes 同时在场。 图并没有说谎,是说谎者在画图。 Benjamin Disraeli 鉴别图表优劣的准则一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况不恰当的统计图形举例:纵横比例不恰当的统计图形举例:三维效果不恰当的统计图形举例:图形类型不恰当的统计图形举例:压缩纵轴不恰当的统计图形举例:纵轴无零点统计表的设计合理安排统计表的结构总标题内容应满足3W 要求数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“—”表示必要时可在表的下方加上注释统计表的结构作业 P66-72 练习题二3.1——3.15 还有哪些统计图?查查看?列举几个。Qpq红软基地

社会统计学ppt:这是社会统计学ppt,包括了绪论,单变量的描述统计分析,两个类别变量关系的描述统计,两个尺度变量关系的描述统计,类别变量与尺度变量关系的描述统计,概率与随机变量的概率分布,大数定律、中心极限定理与抽样分布,参数估计,假设检验的基本原理,总体均值与方差的假设检验,两个类别变量关系的假设检验,两个尺度变量关系的假设检验,类别变量与尺度变量关系的假设检验,非参数检验,抽样,时间序列等内容,欢迎点击下载。

统计学曾五一ppt:这是统计学曾五一ppt,包括了什么是统计,统计学的种类及其性质,统计学的基本概念,无处不在的统计,精确到小数点的爱情--统计学博士的求婚信等内容,欢迎点击下载。

统计学假设检验ppt:这是统计学假设检验ppt,包括了假设检验的一般问题,一个正态总体的参数检验,两个正态总体的参数检验,假设检验中的其他问题等内容,欢迎点击下载。

PPT分类Classification

Copyright:2009-2024 红软网 rsdown.cn 联系邮箱:rsdown@163.com

湘ICP备2024053236号-1