人工智能如何助力刑事司法

发布时间：2021-01-29 14:19:00 所属栏目：评论来源：互联网

导读：1.1.2 决策树一、定义决策树(Decision Tree)是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。决策树是一种树形结构，其中每个内部节

1.1.2 决策树

一、定义

决策树(Decision Tree)是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。

二、优缺点

1.优点

计算复杂度不高
输出结果易于理解
对中间值的缺失不敏感
可以处理连续和种类字段
可以处理不相关特征数据

2.缺点

可能出现过拟合现象，需要进行剪枝操作
对于各类别样本数量不一致的数据，信息增益偏向于那些更多数值的特征

三、应用场景

常用于解决分类和回归问题，用该算法的前提条件是：

1. 具有决策者期望达到的明确目标

2. 存在决策者可以选择的两个以上的可行的备选方案

3. 存在决策者无法控制的两个以上不确定因素

4. 不同方案在不同因素下的收益或损失可以计算出来

5. 决策者可以估计不确定因素发生的概率

四、重点知识点

1.信息熵

信息是很抽象的概念，很难进行量化对量，为了解决对信息的量化度量问题，香农提出了“信息熵”的概念。信息熵是在信息的基础上，将有可能产生的信息定义为一个随机变量，变量的期望就是信息熵。信息熵的计算公式为(单位为比特)：

前言

当我们做一个项目时往往都需要选择该用什么技术。这一部分不是我们普通员工想的，而是架构师会根据客户的需求选择出合适的技术。当选择合适的技术会让我们的开发事半功倍。下面我就来讲解下我做的项目(实时数仓)是如何进行选型的。

一、技术选型

当我们在选择技术时需要根据客户的需求来进行选择。比如：实时统计交易金额(要求延迟不能超过一秒),这时我们在选择技术时就不能用那些批处理的技术比如Hive,MapRducer 等，因为MapRducer 启动有可能就能超过了一秒钟，所以根本就不能满足这些需求。这时我们可以考虑用一些实时计算的技术如 Flink,SparkStreaming等。接下来我们就来讲解下如何选择。

目前市场是有很多实时计算的技术如：Spark streaming、Struct streaming、Storm 、JStorm(阿里) 、Kafka Streaming 、Flink 等众多的技术栈我们该如何选择那?

当我们在选择技术时需要全面考虑，并不是你喜欢这个技术就要用这个技术，这不是明智的选择。企业一般根据公司员工的技术基础、流行、技术复用、场景等众多的因素来进行选择。附上一张技术图

（编辑：衡水站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

蓄势待发！小米12三机	入世20年之我见\|宋和平
如何诚实地宣传 Win11	苹果柏林第二家AppleS