构建基于数据中台系统的湘潭数据集成解决方案
2025-04-12 17:38
import pandas as pd
# 假设这是公安局的数据
police_data = pd.read_csv("police_data.csv")
education_data = pd.read_csv("education_data.csv")
# 清洗和标准化数据
def clean_data(df):
df['date'] = pd.to_datetime(df['date'], format='%Y-%m-%d')
df['age'] = df['age'].astype(int)
return df
police_data_cleaned = clean_data(police_data)
education_data_cleaned = clean_data(education_data)
# 合并数据
combined_data = pd.concat([police_data_cleaned, education_data_cleaned], ignore_index=True)
# 导出标准化后的数据
combined_data.to_csv("standardized_data.csv", index=False)
这个脚本会读取两个CSV文件,清理数据,并将其保存为一个标准化的CSV文件。

本站知识库部分内容及素材来源于互联网,如有侵权,联系必删!
标签:数据中台系统

