背景介绍
本程序旨在实现对指定文件文本内容中关键词的统计功能。关键词统计需要处理数字、字母等文本元素,并输出统计结果,符合Python编程语言的特点。程序通过内置库实现功能,确保代码简洁且可扩展性高。
技术思路分析
- 文件读取:使用Python内置的
open()函数读取指定文件路径的内容 - 关键词处理:利用正则表达式
re模块,通过re.findall()方法提取文本中的数字和字母 - 结果输出:采用字典存储统计结果,并通过格式化字符串输出结果
代码实现
import re
import sys
def count_keywords(text):
# 使用re.findall找到所有匹配的关键词
keywords = re.findall(r'[A-Z|0-9]', text)
# 使用字典统计关键词出现次数
counts = {}
for keyword in keywords:
counts[keyword] = counts.get(keyword, 0) + 1
return counts
def main():
# 获取文件路径信息
path = input("请输入指定文件路径(默认路径为 /home/user/documents/logs.txt):") or "/home/user/documents/logs.txt"
# 读取文本内容
with open(path, 'r') as f:
text = f.read()
# 统计关键词
result = count_keywords(text)
# 输出结果
print(f"关键词出现频率:{result}")
if __name__ == "__main__":
main()
输出格式化示例
关键词出现频率:{数字:3,字母:2}
总结
本程序通过Python内置库实现文件文本内容关键词统计功能,实现了以下核心能力:
- 能够读取指定文件路径的内容
- 使用正则表达式提取文本中的数字和字母
- 通过字典统计关键词出现次数
- 输出格式符合要求的统计结果
该程序在1~3天内可实现,适合用于文本分析和统计任务,具有良好的可扩展性和灵活性。