构建数据中台系统助力迎新项目
import pandas as pd
from sqlalchemy import create_engine
# 创建数据库连接
engine = create_engine('mysql+pymysql://username:password@localhost/dbname')
# 读取Excel文件
df = pd.read_excel('student_data.xlsx')
# 将DataFrame写入数据库表
df.to_sql('students', con=engine, if_exists='append', index=False)
]]>
import pandas as pd
# 加载数据
df = pd.read_csv('students.csv')
# 处理缺失值

df['email'].fillna('no_email@example.com', inplace=True)
# 去除重复项
df.drop_duplicates(inplace=True)
# 标准化学号格式
df['student_id'] = df['student_id'].str.upper()
]]>

本站知识库部分内容及素材来源于互联网,如有侵权,联系必删!

