• 纸上得来终觉浅,绝知此事要躬行!

    Practice makes perfect!

    实验报告提交要求

     

    • 鼓励交流但需独立完成,按照自己思路进行数据处理和分析。
    • 展示的图表能传达有效信息。排列规整、配色统一、简洁大方,适当评述。图的横纵坐标标示清楚(如有单位需要标注),图标题明确。
    • 实验报告清晰、完整、有分析内容,不能仅有图表。优秀的报告有额外奖励分。
    • 实验报告请包含代码。不限定结果实现的软件。
    • 作业内外注明学号、姓名、班级(专业),及实验内容。
    • 提交文件命名方式为:第_次实验+学号+姓名
    • 提交时间:以老师通知的为准。
    • 提交地址:本网站中的课程系统

     

    实验课一

    本次实验报告围绕数据预处理和特征工程展开,实验所需数据请点击下方“实验数据-下载”链接下载homework_data.xlsx文件。具体任务和要求如下:

    任务一:了解信贷场景变量含义

    1. 请将数据文件中子表“Description”各字段翻译成中文,理解各变量的含义

    任务二:数据预处理

    1. 在数据处理前,请对所有变量进行描述性分析,并进行简单分析,提出数据清洗的思路

    2. 对缺失变量进行处理。

    3. 讨论TARGET标签为0的样本与TARGET标签为1的样本在以下几个变量中的特征(如均值,标准差等):CURR_FLAG_OWN_CAR、CURR_AMT_INCOME_TOTAL、CURR_NAME_INCOME_TYPE、CURR_NAME_EDUCATION_TYPE、CURR_NAME_FAMILY_STATUS

    任务三:特征工程

    1. 将变量CURR_NAME_INCOME_TYPE转换为数值型变量,并计算其IV值,判断其风险预测能力。

    任务四:数据可视化

    1. 按照TARGET的取值将样本区分为2类,然后绘制CURR_AMT_INCOME_TOTAL变量的概率密度图。

    绘图要求:将两张子图绘制到一个大画布中,并分别添加横纵坐标和标题,概率密度图里应包括高斯核密度曲线。

    在绘图之后对图形进行简单分析。

    提交日期:2023年11月12日24:00前

    实验课二

    本次实验报告围绕判别分析和模型评价展开,实验数据为python自带数据iris。具体任务和要求如下:

    任务一:构建判别分析

    1. 请对各组响应变量所对应的判别变量进行描述性分析。

    2. 构建线性判别分析,汇报各类别的预测概率和预测标签。

    任务二:进行模型评价

    1. 对上述构建的判别分析进行模型评价,输出混淆矩阵,计算并报告总体准确率。

    提交日期:2023年12月8日24:00前

    实验课三

    本次实验报告围绕逻辑回归和决策树模型展开,实验所需数据请点击下方“实验数据-下载”链接下载Data.xlsx文件。具体任务和要求如下:

    任务一:考察参数的使用

    1. 查看LogisticRegression函数中的class_weight参数,请理解其含义和使用方法。

    任务二:构建逻辑回归

    1. 对数据进行预处理,构建逻辑回归,并汇报ROC曲线和AUC值。

    任务三:构建决策树

    1. 对数据进行预处理,构建决策树模型。

    2. 采用成本复杂性剪枝方法进行剪枝。

    3. 对参数criterion、ccp_alphas采用网格搜索交叉验证法进行调参。

    4. 汇报ROC曲线和AUC值。

    提交日期:2023年12月15日24:00前

    实验课四

    本次实验报告围绕逻辑回归和决策树模型展开,实验所需数据请点击下方“实验数据-下载”链接下载Data.xlsx文件。具体任务和要求如下:

    任务一:划分训练集和测试集

    1. 将全部样本随机抽样,按照比例1:1或2:1,划分成训练集和测试集

    2. 选择10个变量(含target),报告训练集和测试集在这10个变量上的描述统计及对比分析

    任务二:构建随机森林模型

    1. 调用随机森林函数,构建随机森林模型,参数自行设定

    2. 画出训练集和测试集的ROC曲线

    3. 报告特征重要性排序图

    任务三:构建集成模型

    1. 构建任一基于决策树的集成模型

    2. 在同一幅ROC曲线图中,画出随机森林(虚线)和集成模型(实线)在测试集上的ROC曲线对比图

    提交日期:2023年12月25日24:00前

  • 请点击下方按钮下载实验数据

    实验数据

  • 绿色债券信用评级实验教学项目

    虚拟仿真实验