背景介绍
在日常生活中,文本常被用来存储数据,例如用户输入的密码、商品信息等。本项目旨在实现文本分析功能,统计输入数据中数字的种类数和英文单词的索引。通过集合存储数字和索引,结合数据结构的应用,实现高效文本分析任务。
思路分析
- 输入处理:将输入字符串读取为变量,确保读取的格式正确。
- 数据统计:使用集合(set)存储数字和索引,避免重复记录。
- 索引提取:遍历每个字符,判断是否为数字或英文单词,记录其位置。
- 输出结果:根据统计结果,输出数字种类和英文单词索引。
代码实现
def analyze_text(text):
numbers = set()
word_indices = {}
# 遍历每个字符,查找数字和英文单词
for i, char in enumerate(text):
if char.isdigit():
numbers.add(i) # 存储数字索引(从0开始)
elif char.isalpha():
word_indices[i] = char # 存储英文单词索引(从0开始)
# 输出结果
print(f"数字种类:{len(numbers)},英文单词索引:{len(word_indices)}")
for idx, val in word_indices.items():
print(f"英文单词在位置 {idx} 的字符是 {val}")
使用说明:
– 输入文本为包含数字和英文单词的字符串,例如 "123abc456def"。
– 执行该函数后,会输出数字种类和英文单词索引,例如:
数字种类:3,英文单词索引:2
英文单词在位置 2 的字符是 abc
总结
本项目通过集合统计数字和索引,结合数据结构的应用,实现了文本分析功能。关键点包括:
– 使用集合高效存储数字和索引。
– 本地运行,无需依赖外部服务。
– 简洁的代码结构,确保可读性和可执行性。
该项目的实现难度适中,1-3天可完成,适用于需要快速处理文本分析的场景。