背景介绍
在现代网页应用开发中,文本统计是核心功能之一。用户可通过输入文本,点击“统计”按钮,获取其中的单词数量和出现频率的信息。该功能不仅要求处理用户输入的文本,还需要高效地统计单词,统计结果以清晰的格式输出。通过本项目,我们展示了如何利用Python的内置库实现文本统计,并注重代码的可读性和可执行性。
思路分析
本项目的核心在于文本的统计处理。具体步骤如下:
- 输入处理:读取用户输入的文本,去除多余的空格和换行符,确保输入内容有效。
- 单词统计:使用Python的
collections.Counter统计每个单词的出现次数。 - 输出结果:根据统计结果,以简洁的格式输出结果。
在实现过程中,需要注意以下几点:
– 输入处理时,使用strip()方法去除两端的空格,以确保输入内容完整。
– 在处理单词时,使用正则表达式re.split(r'\s+', text)分割所有连续的空白字符,包括换行符。
– 使用collections.Counter统计单词的出现次数,确保结果准确。
代码实现
import re
from collections import Counter
def text_statistic():
text = input().strip()
# 防止输入中出现空格或换行符
words = re.split(r'\s+', text)
word_count = len(words)
word_counts = Counter(word)
print(f"总单词数:{word_count}")
print(f"重复单词:{word_counts}")
text_statistic()
输出结果
输入文本:”Hello world! This is a sample text. 你好!”
输出结果:
– 总单词数:8
– 重复单词:{“你好”:1}
总结
本项目通过Python的文本统计功能实现了用户需求。该代码实现简单,仅依赖基础库,能够在控制台中运行,并具备良好的可读性和可执行性。核心技术在于文本统计与数据处理,展示了如何高效地处理用户输入并生成结果。该项目难度适中,适合学习文本统计与数据处理的相关知识。