• 纸上得来终觉浅,绝知此事要躬行!

    Practice makes perfect!

    实验报告提交要求

    • 鼓励交流但需独立完成,按照自己思路进行数据处理和分析。
    • 展示的图表能传达有效信息。排列规整、配色统一、简洁大方,适当评述。图的横纵坐标标示清楚(如有单位需要标注),图标题明确。
    • 实验报告正确、表述清晰、内容完整、图表美观、有分析内容,不能仅有图表。优秀的报告有额外奖励分。
    • 实验报告请包含Python代码。
    • 作业内外注明学号、姓名、班级(专业),及实验内容。
    • 提交文件命名方式为:第_次实验+周_班+学号+姓名
    • 提交时间:以每次实验报告通知的为准。
    • 提交地址:本网站中的课程系统

    实验报告一

    数据清洗与转换

    本次实验报告围绕信贷场景中的数据分析内容展开,主要包括数据的清洗与转换。具体包括以下任务:

    任务一:结合信贷业务场景理解变量的基本情况

    1. 请对所有变量进行描述性分析,并对结果进行解读;

    2. 请分析该数据集存在何种数据问题,解决思路有哪些。

    任务二:数据清洗

    1. 请处理数据中的缺失值问题;

    2. 请分析变量“CURR_AMT_INCOME_TOTAL”的极端值情况,如存在极端值,请处理。

    任务三:

    1. 请选择一种方法对变量“ CURR_AMT_INCOME_TOTAL”进行分箱,并计算分箱之后各区间的好坏比率,并进行可视化展示;

    2. 请采用证据权重法将分类变量“CURR_NAME_HOUSING_TYPE”转换成数值型变量。

    数据:请点击本网站最下方的“实验数据——下载”按钮下载本次实验报告的作业

    提交时间:2025 年 10 月26 日 23:59 前。

    实验报告二

    判别分析

    本次实验报告围绕信贷场景中的判别分析内容展开,主要包括特征工程、建模与评价。具体包括以下任务:

    任务一:拆分数据集

    1. 请将样本拆分成训练集和测试集(比例为:8:2)

    任务二:数据预处理

    1. 请自选方法处理缺失值

    2. 将离散分类变量转换成数值型变量,方法自选。

    任务三:处理样本不平衡

    1. 请汇报样本标签的分布情况。

    2. 请选择1种方法处理样本的不平衡。

    任务四:建模

    1. 请对训练集采用线性判别分析方法建立模型。

    任务五:

    1. 汇报模型在测试集上的ROC曲线和AUC。


    数据:请点击本网站最下方的“实验数据——下载”按钮下载本次实验报告的作业

    提交时间:2025 年 11 月23 日 23:59 前。

    实验报告三

    逻辑回归

    本次实验报告围绕信贷场景中的逻辑回归内容展开,主要包括特征工程、建模与评价。具体包括以下任务:

    任务1:数据准备

    1.目标变量Y:loan_status为目标变量,其中“fully paid”定义为正常履约(标记为好人),“charged off”定义为违约(标记为坏人),并将其转化为数值变量;

    2.特征变量X:请根据数据含义自行甄选合适的特征,并确保所有特征均为数值变量。

    任务2:建立逻辑回归模型

    1.样本划分:自行确定划分比例,将总体样本划分为训练集和测试集。

    2.建模:使用训练集进行逻辑回归模型的参数估计。

    任务3:画出ROC曲线,汇报AUC,并汇报混淆矩阵。

    数据:请点击本网站最下方的“实验数据——下载”按钮下载本次实验报告的作业

    提交时间:2025 年 12 月 21 日 23:59 前。

    实验报告四

  • 请点击下方按钮下载实验数据

    实验数据

  • 绿色债券信用评级实验教学项目

    虚拟仿真实验