Appearance
金融机构信用评估系统中的业务数据审核流程设计
准考证号:
试题代码: 1.1.3
试题名称: 金融机构信用评估系统中的业务数据审核流程设计
考核时间: 30min
1.场地设备要求
人工智能训练师主机:CPU(intel i5 及以上)、内存(不少于 16GB)、操作系统(windows10)、支持深度学习训练;
2.工作任务
某金融机构计划引入智能信用评估系统,通过分析客户的历史交易数据和信用记录,使用机器学习算法预测客户的信用风险等级,从而辅助贷款审批和风险控制。为了确保数据的准确性和可靠性,该机构需要设计并实现一套全面的业务数据审核流程,确保数据在进入信用评估系统之前经过严格的审核和清洗。 我们提供一个客户信用数据集(credit_data.csv),包含以下字段:
- CustomerID: 客户ID
- Name: 客户姓名
- Age: 年龄
- Income: 收入
- LoanAmount: 贷款金额
- LoanTerm: 贷款期限(月)
- CreditScore: 信用评分
- Default: 是否违约(0: 否,1: 是)
- TransactionHistory: 历史交易记录(JSON格式) 你作为人工智能训练师,根据提供的credit_data.csv数据集和Python代码框架(1.1.3.ipynb),完成以下数据的审核和处理任务,确保数据的准确性和可靠性。请按照以下要求完成任务,确保结果准确并保存相应的截图。
(1)数据完整性审核:
通过运行Python代码(1.1.3.ipynb)检查数据集中的每个字段是否存在缺失值和重复值。将上述审核结果截图以JPG的格式保存,命名为"1.1.3-1"。
(2)数据合理性审核:
通过运行Python代码(1.1.3.ipynb)审核以下字段的合理性:
- 年龄:应在18到70岁之间。
- 收入:应大于2000。
- 贷款金额:应小于收入的5倍。
- 信用评分:应在300到850之间。 对不合理的数据进行标记,并将审核结果截图以JPG的格式保存,命名为"1.1.3-2"。
(3)通过运行Python代码(1.1.3.ipynb)对数据进行清洗,处理异常值。具体要求如下:
- 将不合理的数据进行标记,并对异常值所在行进行删除;
- 清洗后的数据保存为新文件cleaned_credit_data.csv。 所有结果文件储存在桌面新建的考生文件夹中,文件夹命名为"准考证号+身份证号后六位"。