# Python文件统计基础实践实践

背景介绍

编程学习中，文件统计是基础数据处理能力的体现。本项目要求实现对本地文本文件的统计需求，涵盖：
1. 读取所有行并统计总字数
2. 计算文本总字符数与平均字符数
3. 统计字符频率
要求代码独立运行，无需依赖外部框架，核心知识包括文件读取和统计算法实现。

思路分析

该问题的核心在于文件处理与数据统计的结合。具体实现思路如下：
1. 优先使用Python内置的文件读取功能open()，避免使用第三方库
2. 使用collections.Counter统计频率，避免手动处理大量数据
3. 统计总字数时，可采用sum(1 for line in lines)实现
4. 平均字符数的计算需通过总字符数除以行数，避免浮点精度问题
5. 文件读取采用逐行处理方式，确保数据完整性

代码实现

import sys
from collections import Counter

def count_stats(file_path):
    total_words = sum(1 for line in open(file_path, 'r'))  # 读取所有行
    average_char = sum(len(line) for line in open(file_path, 'r')) / len(open(file_path, 'r'))  # 计算平均字符数
    freq = Counter()  # 字符频率统计
    for line in open(file_path, 'r'):
        freq[line] += 1  # 统计每个字符出现的次数
    return total_words, average_char, freq

# 示例使用
file_path = "example.txt"
total, avg, freq = count_stats(file_path)
print(f"总字数：{total}")
print(f"平均字符数：{avg:.2f}")
print("字符频率：", freq)

总结

本项目通过Python的内置读取库实现了文件统计需求，核心知识包括：
– 使用open()进行本地文件处理
– 理解统计算法（平均值、频率统计）
– 独立实现本地文件处理功能

学习价值：
1. 掌握文件读取与数据处理的核心能力
2. 学习统计算法实现原理
3. 提升本地环境下程序运行能力

独立运行：
该脚本可直接在本地环境中运行，无需依赖第三方库，适合中级及以上开发者的实践项目。