**技术博客文章:读取CSV和JSON数据并统计信息**



背景介绍

在现代开发中,处理多样化数据格式的需求日益增加。本篇文章将展示如何使用Python实现对JSON和CSV格式文件的读取与统计功能,帮助开发者掌握数据处理的核心技术点。


思路分析

1. 数据格式读取

  • CSV文件:使用 pandas.read_csv 读取包含学生姓名、年龄、成绩的字段。
  • JSON文件:通过 json.load() 读取JSON数据,并拆分字段为姓名、年龄、成绩。

2. 统计信息

  • 总人数:统计所有记录的数量。
  • 平均成绩:计算所有成绩的总和除以记录数。
  • 最大和最小值:找出所有成绩的最大值和最小值。

3. 程序结构

  • 读取文件后,直接计算统计指标,输出结果。
  • 程序不依赖第三方库,完全使用内置功能实现。

代码实现

1. 读取CSV文件

import pandas as pd

def read_csv_file(file_path):
    df = pd.read_csv(file_path)
    return df

# 示例:读取JSON文件  
def read_json_file(json_file_path):
    with open(json_file_path, 'r') as f:
        data = f.read()
    return pd.read_json(data, orient='records')

# 示例:读取CSV并统计信息  
def read_and_statistical_info(file_path):
    df = read_csv_file(file_path)
    total_people = df.shape[0]
    total_scores = sum(df['成绩'].values) / total_people
    max_score = max(df['成绩'].values)
    min_score = min(df['成绩'].values)
    print("总人数:", total_people)
    print("平均成绩:", total_scores)
    print("最大成绩:", max_score)
    print("最小成绩:", min_score)

# 示例调用  
read_and_statistical_info("student_data.csv")

2. 读取JSON文件

import json

def read_json_file(json_file_path):
    with open(json_file_path, 'r') as f:
        data = json.load(f)
    return data

# 示例:读取JSON并统计信息  
def read_and_statistical_info(json_file_path):
    data = read_json_file(json_file_path)
    total_people = len(data)
    total_scores = sum(row['成绩'] for row in data.values)
    max_score = max(row['成绩'] for row in data.values)
    min_score = min(row['成绩'] for row in data.values)
    print("总人数:", total_people)
    print("平均成绩:", total_scores / total_people)
    print("最大成绩:", max_score)
    print("最小成绩:", min_score)

# 示例调用  
read_and_statistical_info("input_students.json")

总结

通过本实现,我们不仅掌握了如何读取CSV和JSON文件,还成功展示了如何计算总人数、平均成绩、最大值和最小值。程序实现了独立运行,并利用了 pandas 库的内置功能,提升了数据处理能力。该实现符合中级开发需求,能够帮助开发者在实际项目中灵活应用这一技术。

完成时间:2023-10-05
学习价值:提升JSON数据处理能力,掌握数据统计的基本操作。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注