1.导入库

python

import pandas as pd
import numpy as np

2.读取数据

python

data = pd.read_csv('patient_data.csv')

python

data['RiskLevel'] = np.where(data['DaysInHospital'] > 7, '高风险患者', '低风险患者')

python

risk_counts = data['RiskLevel'].value_counts()

python

high_risk_ratio = risk_counts['高风险患者'] / len(data)
low_risk_ratio = risk_counts['低风险患者'] / len(data)

python

print("高风险患者数量:", risk_counts['高风险患者'])
print("低风险患者数量:", risk_counts['低风险患者'])
print("高风险患者占比:", high_risk_ratio)
print("低风险患者占比:", low_risk_ratio)

python

bmi_bins = [0, 18.5, 24, 28, np.inf]
bmi_labels = ['偏瘦', '正常', '超重', '肥胖']

python

data['BMIRange'] = pd.cut(data['BMI'], bins=bmi_bins, labels=bmi_labels, right=False)

python

bmi_risk_rate = data.groupby('BMIRange')['RiskLevel'].apply(lambda x: (x == '高风险患者').mean())

python

bmi_patient_count = data['BMIRange'].value_counts()

python

print("BMI区间中高风险患者的比例和患者数:")
print(bmi_risk_rate) 
print(bmi_patient_count)

python

age_bins = [0, 26, 36, 46, 56, 66, np.inf]
age_labels = ['≤25岁', '26-35岁', '36-45岁', '46-55岁', '56-65岁', '＞65岁']

python

data['AgeRange'] = pd.cut(data['Age'], bins=age_bins, labels=age_labels, right=False)

python

age_risk_rate = data.groupby('AgeRange')['RiskLevel'].apply(lambda x: (x == '高风险患者').mean())

python

age_patient_count = data['AgeRange'].value_counts()

python

print("年龄区间中高风险患者的比例和患者数:")
print(age_risk_rate) 
print(age_patient_count)