背景介绍
在现代开发中,处理多样化数据格式的需求日益增加。本篇文章将展示如何使用Python实现对JSON和CSV格式文件的读取与统计功能,帮助开发者掌握数据处理的核心技术点。
思路分析
1. 数据格式读取
- CSV文件:使用
pandas.read_csv读取包含学生姓名、年龄、成绩的字段。 - JSON文件:通过
json.load()读取JSON数据,并拆分字段为姓名、年龄、成绩。
2. 统计信息
- 总人数:统计所有记录的数量。
- 平均成绩:计算所有成绩的总和除以记录数。
- 最大和最小值:找出所有成绩的最大值和最小值。
3. 程序结构
- 读取文件后,直接计算统计指标,输出结果。
- 程序不依赖第三方库,完全使用内置功能实现。
代码实现
1. 读取CSV文件
import pandas as pd
def read_csv_file(file_path):
df = pd.read_csv(file_path)
return df
# 示例:读取JSON文件
def read_json_file(json_file_path):
with open(json_file_path, 'r') as f:
data = f.read()
return pd.read_json(data, orient='records')
# 示例:读取CSV并统计信息
def read_and_statistical_info(file_path):
df = read_csv_file(file_path)
total_people = df.shape[0]
total_scores = sum(df['成绩'].values) / total_people
max_score = max(df['成绩'].values)
min_score = min(df['成绩'].values)
print("总人数:", total_people)
print("平均成绩:", total_scores)
print("最大成绩:", max_score)
print("最小成绩:", min_score)
# 示例调用
read_and_statistical_info("student_data.csv")
2. 读取JSON文件
import json
def read_json_file(json_file_path):
with open(json_file_path, 'r') as f:
data = json.load(f)
return data
# 示例:读取JSON并统计信息
def read_and_statistical_info(json_file_path):
data = read_json_file(json_file_path)
total_people = len(data)
total_scores = sum(row['成绩'] for row in data.values)
max_score = max(row['成绩'] for row in data.values)
min_score = min(row['成绩'] for row in data.values)
print("总人数:", total_people)
print("平均成绩:", total_scores / total_people)
print("最大成绩:", max_score)
print("最小成绩:", min_score)
# 示例调用
read_and_statistical_info("input_students.json")
总结
通过本实现,我们不仅掌握了如何读取CSV和JSON文件,还成功展示了如何计算总人数、平均成绩、最大值和最小值。程序实现了独立运行,并利用了 pandas 库的内置功能,提升了数据处理能力。该实现符合中级开发需求,能够帮助开发者在实际项目中灵活应用这一技术。
完成时间:2023-10-05
学习价值:提升JSON数据处理能力,掌握数据统计的基本操作。