当前位置 : 造价师 > 什么是决策树一级造价师

什么是决策树一级造价师

最新回答

乱世美女
决策树在机器学习中是一个十分优秀的算法,在很多技术中都需要用到决策树这一算法,由此可见,决策树是一个经典的算法,在这篇文章中我们给大家介绍决策树算法的优缺点,希望这篇文章能够更好的帮助大家理解决策树算法。
其实决策树倍受大家欢迎的原因就是其中的一个优势,那就是易于解释。同时决策树可以毫无压力地处理特征间的交互关系并且是非参数化的,因此你不必担心异常值或者数据是否线性可分。但是决策树的有一个缺点就是不支持在线学习,于是在新样本到来后,决策树需要全部重建。另一个缺点就是容易出现过拟合,但这也就是诸如随机森林RF之类的集成方法的切入点。另外,随机森林经常是很多分类问题的赢家,决策树训练快速并且可调,同时大家无须担心要像支持向量机那样调一大堆参数,所以在以前都一直很受欢迎。
那么决策树自身的优点都有什么呢,总结下来就是有六点,第一就是决策树易于理解和解释,可以可视化分析,容易提取出规则。第二就是可以同时处理标称型和数值型数据。第三就是比较适合处理有缺失属性的样本。第四就是能够处理不相关的特征。第五就是测试数据集时,运行速度比较快。第六就是在相对短的时间内能够对大型数据源做出可行且效果良好的结果。
那么决策树的缺点是什么呢?总结下来有三点,第一就是决策树容易发生过拟合,但是随机森林可以很大程度上减少过拟合。第二就是决策树容易忽略数据集中属性的相互关联。第三就是对于那些各类别样本数量不一致的数据,在决策树中,进行属性划分时,不同的判定准则会带来不同的属性选择倾向;信息增益准则对可取数目较多的属性有所偏好,而增益率准则CART则对可取数目较少的属性有所偏好,但CART进行属性划分时候不再简单地直接利用增益率尽心划分,而是采用一种启发式规则。
通过上述的内容相信大家已经知道了决策树的优点和缺点了吧,大家在学习或者使用决策树算法的时候可以更好的帮助大家理解决策树的具体情况,只有了解了这些算法,我们才能够更好的使用决策树算法。
duanxuehan
决策树是用二叉树形图来表示处理逻辑的一种工具。可以直观、清晰地表达加工的逻辑要求。特别适合于判断因素比较少、逻辑组合关系不复杂的情况。
  决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。比如,在贷款申请中,要对申请的风险大小做出判断,图是为了解决这个问题而建立的一棵决策树,从中我们可以看到决策树的基本组成部分:决策节点、分支和叶子。
  决策树中最上面的节点称为根节点,是整个决策树的开始。本例中根节点是“收入>¥40,000”,对此问题的不同回答产生了“是”和“否”两个分支。
  决策树的每个节点子节点的个数与决策树在用的算法有关。如CART算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。
  每个分支要么是一个新的决策节点,要么是树的结尾,称为叶子。在沿着决策树从上到下遍历的过程中,在每个节点都会遇到一个问题,对每个节点上问题的不同回答导致不同的分支,最后会到达一个叶子节点。这个过程就是利用决策树进行分类的过程,利用几个变量(每个变量对应一个问题)来判断所属的类别(最后每个叶子会对应一个类别)。
  假如负责借贷的银行官员利用上面这棵决策树来决定支持哪些贷款和拒绝哪些贷款,那么他就可以用贷款申请表来运行这棵决策树,用决策树来判断风险的大小。“年收入>¥40,00”和“高负债”的用户被认为是“高风险”,同时“收入5年”的申请,则被认为“低风险”而建议贷款给他/她。
  数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。常用的算法有CHAID、
CART、
Quest
和C0。
  建立决策树的过程,即树的生长过程是不断的把数据进行切分的过程,每次切分对应一个问题,也对应着一个节点。对每个切分都要求分成的组之间的“差异”最大。
  各种决策树算法之间的主要区别就是对这个“差异”衡量方式的区别。对具体衡量方式算法的讨论超出了本文的范围,在此我们只需要把切分看成是把一组数据分成几份,份与份之间尽量不同,而同一份内的数据尽量相同。这个切分的过程也可称为数据的“纯化”。看我们的例子,包含两个类别--低风险和高风险。如果经过一次切分后得到的分组,每个分组中的数据都属于同一个类别,显然达到这样效果的切分方法就是我们所追求的。
  到现在为止我们所讨论的例子都是非常简单的,树也容易理解,当然实际中应用的决策树可能非常复杂。假定我们利用历史数据建立了一个包含几百个属性、输出的类有十几种的决策树,这样的一棵树对人来说可能太复杂了,但每一条从根结点到叶子节点的路径所描述的含义仍然是可以理解的。决策树的这种易理解性对数据挖掘的使用者来说是一个显著的优点。
  然而决策树的这种明确性可能带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦(凭什么说年收入¥40,001的人具有较小的信用风险而¥40,000的人就没有)。
  建立一颗决策树可能只要对数据库进行几遍扫描之后就能完成,这也意味着需要的计算资源较少,而且可以很容易的处理包含很多预测变量的情况,因此决策树模型可以建立得很快,并适合应用到大量的数据上。
  对最终要拿给人看的决策树来说,在建立过程中让其生长的太“枝繁叶茂”是没有必要的,这样既降低了树的可理解性和可用性,同时也使决策树本身对历史数据的依赖性增大,也就是说这是这棵决策树对此历史数据可能非常准确,一旦应用到新的数据时准确性却急剧下降,我们称这种情况为训练过度。为了使得到的决策树所蕴含的规则具有普遍意义,必须防止训练过度,同时也减少了训练的时间。因此我们需要有一种方法能让我们在适当的时候停止树的生长。常用的方法是设定决策树的最大高度(层数)来限制树的生长。还有一种方法是设定每个节点必须包含的最少记录数,当节点中记录的个数小于这个数值时就停止分割。
  与设置停止增长条件相对应的是在树建立好之后对其进行修剪。先允许树尽量生长,然后再把树修剪到较小的尺寸,当然在修剪的同时要求尽量保持决策树的准确度尽量不要下降太多。
  对决策树常见的批评是说其在为一个节点选择怎样进行分割时使用“贪心”算法。此种算法在决定当前这个分割时根本不考虑此次选择会对将来的分割造成什么样的影响。换句话说,所有的分割都是顺序完成的,一个节点完成分割之后不可能以后再有机会回过头来再考察此次分割的合理性,每次分割都是依赖于他前面的分割方法,也就是说决策树中所有的分割都受根结点的第一次分割的影响,只要第一次分割有一点点不同,那么由此得到的整个决策树就会完全不同。那么是否在选择一个节点的分割的同时向后考虑两层甚至更多的方法,会具有更好的结果呢?目前我们知道的还不是很清楚,但至少这种方法使建立决策树的计算量成倍的增长,因此现在还没有哪个产品使用这种方法。
  而且,通常的分割算法在决定怎么在一个节点进行分割时,都只考察一个预测变量,即节点用于分割的问题只与一个变量有关。这样生成的决策树在有些本应很明确的情况下可能变得复杂而且意义含混,为此目前新提出的一些算法开始在一个节点同时用多个变量来决定分割的方法。比如以前的决策树中可能只能出现类似“收入<¥35,000”的判断,现在则可以用“收入¥35,000或抵押<150,000”这样的问题。
  决策树很擅长处理非数值型数据,这与神经网络只能处理数值型数据比起来,就免去了很多数据预处理工作。
  甚至有些决策树算法专为处理非数值型数据而设计,因此当采用此种方法建立决策树同时又要处理数值型数据时,反而要做把数值型数据映到非数值型数据的预处理。
小丫夏夏
决策树是决策过程中的一种有序的概率图解表示,决策者根据决策树所构造出来的决策过程的有序图示,不但能纵观决策过程的全局,而且能地对决策过程进行合理的分析,从而得到较好的决策结果。
决策树由节点和分枝组成,表现为一个树状图示,节点有二种,一种叫决策点,用“□”表示,从决策点引出的分枝称为方案分枝,另一种节点叫状态点,用“〇”表示,从状态点引出的分枝叫概率分枝。每一概率分枝表示一种自然发生的状态,在概率分枝的末端标明相应方案在该状态下的损益值,在概率分枝上注明不同状态可能发生的概率大小,在状态点上注明该方案计算所得的期望值。

我也是刚从老师那拿到的资料~正打算研究研究呢~
至于那个啥准则就抱歉了~貌似老师发过来的内容没怎么讲~
花的姿态zqr

(一)决策内容

所谓油气勘探决策分析,就是在油气资源评价分析基础上,将勘探对象、勘探方案和勘探结果三者紧密结合起来,进行风险分析和效益(经济效益、社会效益)分析,研究不同勘探可能产生的种种结果,从而遴选出最满意的勘探方案,为合理部署勘探工作提供依据。

油气勘探决策可依据决策对象不同而分出不同的层次,各层次的决策思路和内容是不尽相同的。概略而言,油气勘探决策的最高层次是国家石油工业战略方针决策,主要是根据国民经济发展的能源总体需求、国家能源结构、全国可动油气储量、资源量及其分布、国际油气价格、外交及军事战略、就业问题等,确定中长期石油工业发展方针政策、勘探投资总额和勘探工作总体布局。第二层次是区域勘探决策,主要是据区域油气资源量、勘探程度、勘探成本及油气市场供求关系、油气价格,分析进一步勘探的可能经济效益和社会效益,决策是否对该区域进行勘探,确定投资强度。第三层次是勘探目标选择,主要是在圈闭资源评价基础上,开展风险分析,研究勘探条件,估计各种勘探方案及其可能产生的勘探结果的投入产出,根据经济效益大小对一批勘探目标(即局部构造、潜山、岩性体、成岩体等)进行排队,确定哪些先勘探,哪些暂缓勘探及哪些不勘探。最低层次的决策是井位布置,在经济效益分析基础上,确定勘探目标的经济边界含油气面积(即低于此面积则不值得进一步勘探),按探井应钴在经济边界含油气面积边缘的原则,根据实际地质条件布井。

松辽盆地是我国最重要的油气工业基地之一,著名的大庆油田目前几乎支撑着全国油气生产的半边天。从全盆地油气赋存状况看,东南隆起区是盆内主要产气区,当地乃至整个东北的能源供需现实,有力地说明东南隆起区的天然气开发生产有利于改善区域能源消费结构,满足长春、四平及其它大中城市工业发展和民用的急需。研究区是盆地东南隆起区的最有利区块,现已有后五家户小五家子、万金塔、农安、八屋和艾家窝堡等气田和含气构造投入开发,初步建立起天然气生产基地和供应市场,有关部门正在加大投资力度,扩大勘探。因此,在工区内的勘探决策已不是区域选择这一层次,而是勘探目标选择这一层次。

在勘探决策分析中,勘探对象、勘探方案和勘探结果是一体化定量研究的三大组成部分,其中勘探方案起到连接勘探对象和勘探结果的桥梁作用,它也是唯一能人为控制的部分。对于勘探目标而言,最主要的勘探手段就是钻探,其它勘探研究工作是为其服务的。因此,在勘探目标选择这一决策层次中,我们把勘探方案定义为一组勘探目标的钻探序列,即钻探先后序次。对于一组勘探目标,钻探先后顺序不同,就是勘探方案不同。由于研究区内各勘探目标的含油气性及资源量不同,所以不同的方案会产生不同的勘探结果,从中选择最佳方案即是本书决策分析的主要内容。

(二)决策思路

决策的基本思路是:以经济效益为决策准则,在前面天然气资源评价专家圈闭含气性评价和圈闭资源量计算基础上,以局部构造为勘探目标(或叫勘探对象),逐一进行风险分析,分析钻第一、二口探井时将出现哪些勘探结果及其可能性,然后依据勘探开发成本和天然气产量、价格等计算经济效益期望值,最后按各局部构造经济效益期望值进行排序,提出一个最佳勘探方案。

(三)决策方法

为实现上述思路,我们选择程学福等(1994)研制的天然气资源勘探决策决策树分析法。下面简单介绍决策树分析法。

决策树概念:对于一个局部构造,是立即钻探呢还是先作物探等准备工作后再钻井?第一口探井可能找到一个大气田,或中气田,或小气田,更可能是干井;当为干井时还打第二口探井否?第二口探井又可能出现上述几种结果。这是一个围绕具体勘探目标的更深层次决策过程,其中包含着许多逻辑分析和计算,可以用一个树模型图来表示(图9—1):方框是决策节点,从它引出的每条支线就是一个方案;圆框是自然状态集节点,从它引出的支线分别代表一种可能出现的结果,支线上数据表示该结果出现的概率。

图9—1 决策树模型图

当进行局部构造选择这一级决策时,就需要对每个局部构造所有勘探方案及其结果进行综合考虑。但问题是用什么指标来表示综合考虑的结果,以便于局部构造排序。该决策树方法中所用的指标是经济效益期望值,并将其定义为所有可能出现结果的经济效益与其出现概率乘积之代数和。经济效益期望值表示了对多种情况的“综合”,是一种把风险和不确定性与经济因素统一起来的有意义的决策准则,其大于零代表有效益,等于零代表无损益,小于零代表亏损。我们即根据此指标来判断各局部构造的勘探效益优劣,从而进行决策。

决策树模型:天然气资源勘探决策针对局部构造目的层多寡,设计了三个决策树模图型。

Ⅰ型决策树模型是针对只有一个目的层的局部构造设计的,其基本结构见图9—1。对所有方案的限定是第一、第二口探井均为干井时即放弃该构造,故为二级决策树。当探井为发现井时,即只有该目的层为气藏一种情况,其资源量大小是考虑的主要方面之一。

解上决策树,得:

含油气盆地分析与资源评价:以松辽盆地十屋-德惠地区为例

式中:X1——平均干井费用;

X2——平均发现井费用;

X3——平均开发井费用;

X4——平均开发井密度:

Y1——采收率;

Y2——油气价格;

A——圈闭含油气面积;

n——资源划分区间数;

Qi、Pi——资源量第i区间的左端点值及资源量落入该区间的概率。

根据上述各式计算值,即可解得:

含油气盆地分析与资源评价:以松辽盆地十屋-德惠地区为例

这些就是决策分析的结果。

Ⅱ型决策树模型是针对具有两个目的层的局部构造设计的,也采用“二级”决策树,树结构及解法与l型决策树模型相似,只是所发现的资源量有三种情况:第一个目的层有油气而第二个没有油气;第二个目的层有油气而第一个没有油气;两个目的层均有油气。

Ⅲ型决策树模型是针对具有三个目的层的局部构造设计的,由于有三个目的层,故采用“三级”决策树,其构型与Ⅰ型决策树相似,只不过多了一级而已,且发现井所发现的可能有七种情况:第一个目的层有油气;第二个目的层有油气;第三个目的层有油气;第一、二两个目的层有油气;第二、三两个目的层有油气;第一、三两个日的层有油气;三个目的层均有油气。

风险估计:在上述三个决策树模型中,一个重要的问题是估计探井的风险。地提出了估计第一、二、三口井为干井的概率(即风险)的方法:

第一口探井风险 

第二口探井风险 

第三口探井风险 

式中:P0——局部构造含油气的概率;

C1——第一口探井的发现系数,C1=1时表示第一口探井为发现井的概率等于局部构造含气概率;

C2——第二口探井的发现系数,C2=(1~5)C1;

C3——第三口探井的发现系数,C3=(1~5)C2。

smilejune521
用决策树来描述处理逻辑是什么阶段?这是哲学问题了吧?要是到了决策处理阶段应该是?初七。有了决策才能进行实施。

相关问答

一级造价师决策树

决策树是决策过程中的一种有序的概率图解表示,决策者根据决策树所构造出来的决策过程的有序图示,不但能纵观决策过程的全局,而且能地对决策过程进行合理的分析,从而得到较好的决策结果。决策树由节点和分枝组成,表现为一个树状图示,节点有二种,一种叫决策点,用“□”表示,从决策点引出的分枝称为方案分枝,另一种节……

dongdongth

造价师树上决策树

决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树方法最早产生于上世纪2022年代,到2022年代末。由JRossQuinlan提出了ID3算法,……

A-水灵儿^O^

决策树一级造价师

决策树是决策过程中的一种有序的概率图解表示,决策者根据决策树所构造出来的决策过程的有序图示,不但能纵观决策过程的全局,而且能地对决策过程进行合理的分析,从而得到较好的决策结果。决策树由节点和分枝组成,表现为一个树状图示,节点有二种,一种叫决策点,用“□”表示,从决策点引出的分枝称为方案分枝,另一种节……

大嘴闯天下

决策树造价师决策枝

决策树的构成要素包括(DE)。A.概率收益值B.决策点C.方案枝D.决策节点E.概率枝决策树的构成有四个要素:包括决策点、方案枝、决策节点、概率枝。决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质……

坤坤890206

造价师决策树二级决策

(一)决策内容所谓油气勘探决策分析,就是在油气资源评价分析基础上,将勘探对象、勘探方案和勘探结果三者紧密结合起来,进行风险分析和效益(经济效益、社会效益)分析,研究不同勘探可能产生的种种结果,从而遴选出最满意的勘探方案,为合理部署勘探工作提供依据。油气勘探决策可依据决策对象不同而分出不同的层次,各层……

桃紅梨白