信用评估是商业银行等机构防范风险的重要途径,为了提高信用评估的准确率,使用随机森林(RF)来建立风险评估模型。针对随机森林模型的性能与参数的选择和数据集不平衡比例密切相关,提出了一种基于随机森林的组合分类算法(KM-GA-RF)。以UCI数据库中的German数据集进行研究,通过K-means算法对标签进行类分解。而对于哪个类分成的簇数(ki)以及随机森林算法自身的参数:树数(n_estimators)、特征数(max_features),使用改进的遗传算法对其进行优化选取。实验结果表明,基于随机森林的组合优化模型与传统RF以及其他算法进行比较,RF的预测精度高于支持向量机等算法,达到0.765,而提出的组合优化模型的预测精度为0.815,提高了5%。
1
歪斜 倾斜决策树和随机森林的 Clojure 实现。 用法 执照 版权所有 :copyright: 2015 FIXME 根据 Eclipse 公共许可证分发 1.0 版或(由您选择)任何更高版本。
2023-03-12 12:01:32 18KB Clojure
1
利用pytorch实现图像分类的一个完整的代码,训练,预测,TTA,模型融合,模型部署,cnn提取特征,svm或者随机森林等进行分类,模型蒸馏,一个完整的代码。 实现功能: 基础功能利用pytorch实现图像分类 包含带有warmup的cosine学习率调整 warmup的step学习率优调整 多模型融合预测,加权与投票融合 利用flask + redis实现模型云端api部署(tag v1) c++ libtorch的模型部署 使用tta测试时增强进行预测(tag v1) 添加label smooth的pytorch实现(标签平滑)(tag v1) 添加使用cnn提取特征,并使用SVM,RF,MLP,KNN等分类器进行分类(tag v1)。 可视化特征层。 转载:https://github.com/lxztju/pytorch_classification
2023-03-11 16:54:10 3.03MB 预测模型 图像分类 pytorch
1
SPORF-稀疏投影倾斜随机森林(aka RerF,Rander Forest或Random Projection Forests)-是由开发的算法 类似于由开发的Random Forest-Random Combination(Forest-RC 。 两种算法之间的区别是随机线性组合的发生位置:Forest-RC在树级别组合特征,而RerF在节点级别组合特征。 配套 内存优化的RandomForest和RerF的C ++实现。 Python对packedForest的绑定。 RerF的R和C ++实现。
2023-03-11 10:28:53 35.03MB python r cpp random-forest
1
随机森林分类器
2023-03-10 15:52:12 51KB JupyterNotebook
1
随机森林图像matlab代码步步森林 StepForest:使用局部强度和纹理特征分割结肠组织学图像中腺体的机器学习方法 为在结肠组织学图像中进行腺体分割而创建的基于机器学习的图像分割算法,可以针对其他图像分割问题进行修改。 该算法使用一种新颖的分层随机森林方法,其中使用3个级别的随机森林beeen来进行更好的分割。 为了测试该算法,使用了GlaS @ MICCAI'2015:腺体分割挑战赛()的数据集。 可在上述网站的“下载”标签下下载。 使用的第三方工具箱/代码(由相应作者提供的许可控制):- haralickTextureFeatures由Rune Monzel() Matlab的污点归一化工具箱,作者是Warwick大学的Nicholas Trahearn和Adnan Khan(),这些第三方工具箱/代码的源代码已上传到“工具箱”文件夹下。 可以下载最新版本,并可以从给定的网站获取许可证信息 这项研究是由Rupali Khatun进行的。 这项工作最初是在加尔各答的印度统计研究所(ISI)的电子和通信科学部门(ECSU)以及印度统计研究所(ISI)的印度模式识别和人工智能部门(
2023-03-07 12:57:08 7.89MB 系统开源
1
温度预测 python 随机森林,该模型用于预测气候温度 随机森林,该模型用于预测气候温度 问题重述:预测当日温度,运用RandomForestRegressor(随机森林回归) 1.确定最优训练集: 第一个训练集拥有253个样本+14个指标 第二个训练集拥有1635个样本+17个指标 第三个训练集拥有1635个样本+14个指标 最终确定为第二个训练集预测精确度最高 2.利用第二个训练集,调整随机森林模型超参数 以下两大方法调整 运用from sklearn.model_selection import RandomSearchCV 运用from sklearn.model_selection import GridSearchCV 不断调整参数,比较预测准确度,最终确定最优模型。
2023-03-01 00:11:18 143KB python 温度预测
1
spatialRF:使用随机森林轻松进行空间回归 介绍 该包装spatialRF便于与随机森林规则或不规则的数据拟合空间回归模型,使用所述发动机罩下的测距仪包所以通过产生空间预测器,其允许该模型考虑到的空间结构确实训练数据。 最终目标是尽可能减少模型残差的空间自相关。 残差中的空间自相关表明模型方差中存在空间自相关的源,而模型预测变量无法解释该源,并且很明显的迹象是模型中缺少重要的变量。 在理想模型中,残差不是自相关的,应该以零为中心,但是在处理空间数据时很少出现这种情况。 该程序包实现了两种主要方法来根据数据点的距离矩阵生成空间预测变量: 邻居矩阵的主坐标分析 。 距离矩阵列作为解释变量 。 该软件包还提供了一组工具,用于识别变量交互,调整随机森林超参数,评估空间独立数据折叠上的模型性能,并通过重要性图,响应曲线和曲面检查生成的模型。 安装包装 该软件包尚未在CRAN存储库中,因
2023-02-09 12:07:46 2.47MB R
1
心血管疾病使用决策树和随机森林分类器 决策树算法可用于预测心血管疾病并使用随机森林分类器和探索性数据分析来提高准确性
2023-02-08 15:13:46 778KB
1
本项目是世卫组织建立了一段时间内所有国家健康状况的数据集,其中包括预期寿命,成人死亡率等方面的统计数据。使用此数据集,探索各种变量之间的关系,通过数据集建立模型对预期寿命进行预测以及找出对预期寿命的最大影响因素是什么? 本项目主要解决以下问题: - 最初选择的各种预测因素是否真的影响预期寿命?实际影响预期寿命的预测变量有哪些? - 预期寿命值低于(<65)的国家是否应该增加其医疗保健支出以改善其平均寿命? - 婴儿和成人死亡率如何影响预期寿命? - 是否接受教育对人类寿命有何影响? - 预期寿命与饮酒是正相关还是负相关? - 人口稠密的国家的预期寿命是否有降低的趋势? 数据集:数据/探索影响预期寿命的因素/Life Expectancy Data.csv 案例来源:https://www.kaggle.com/kumarajarshi/life-expectancy-who
2023-01-31 10:55:30 2.44MB 数据挖掘 机器学习 课程设计
1