人工智能如何助力刑事司法
1.1.2 决策树 一、定义 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。 二、优缺点 1.优点
2.缺点
三、应用场景 常用于解决分类和回归问题,用该算法的前提条件是: 1. 具有决策者期望达到的明确目标 2. 存在决策者可以选择的两个以上的可行的备选方案 3. 存在决策者无法控制的两个以上不确定因素 4. 不同方案在不同因素下的收益或损失可以计算出来 5. 决策者可以估计不确定因素发生的概率 四、重点知识点 1.信息熵
信息是很抽象的概念,很难进行量化对量,为了解决对信息的量化度量问题,香农提出了“信息熵”的概念。信息熵是在信息的基础上,将有可能产生的信息定义为一个随机变量,变量的期望就是信息熵。信息熵的计算公式为(单位为比特): 前言 当我们做一个项目时往往都需要选择该用什么技术。这一部分不是我们普通员工想的,而是架构师会根据客户的需求选择出合适的技术。当选择合适的技术会让我们的开发事半功倍。下面我就来讲解下我做的项目(实时数仓)是如何进行选型的。 一、技术选型 当我们在选择技术时需要根据客户的需求来进行选择。比如:实时统计交易金额(要求延迟不能超过一秒),这时我们在选择技术时就不能用那些批处理的技术比如Hive,MapRducer 等,因为MapRducer 启动有可能就能超过了一秒钟,所以根本就不能满足这些需求。这时我们可以考虑用一些实时计算的技术如 Flink,SparkStreaming等。接下来我们就来讲解下如何选择。 目前市场是有很多实时计算的技术如:Spark streaming、Struct streaming、Storm 、JStorm(阿里) 、Kafka Streaming 、Flink 等众多的技术栈我们该如何选择那?
当我们在选择技术时需要全面考虑,并不是你喜欢这个技术就要用这个技术,这不是明智的选择。企业一般根据 公司员工的技术基础、流行 、技术复用、场景等众多的因素来进行选择。附上一张技术图 (编辑:衡水站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |