统计表格中某两列选项的共同重复数量,并导出为新的表格
要统计两列中选项的共同重复数量并导出为新的表格,你可以使用Python的pandas库。这涉及到以下步骤:
-
读取CSV文件:首先,读取包含这两列的CSV文件。
-
计算共同重复数量:使用pandas的分组(
groupby
)和聚合(count
)功能来统计每个组合在这两列中出现的次数。 -
导出结果:将统计结果导出为新的CSV文件。
假设你的两个列名分别是 column1
和 column2
,以下是实现上述步骤的示例代码:
import pandas as pd
# 读取CSV文件
df = pd.read_csv('/path/to/your/file.csv')
# 计算共同重复数量
grouped_counts = df.groupby(['column1', 'column2']).size().reset_index(name='counts')
# 导出结果
grouped_counts.to_csv('grouped_counts.csv', index=False)
这段代码首先读取CSV文件。然后,它使用groupby
方法对column1
和column2
指定的两列进行分组,并计算每个组合的出现次数。最后,这些计数被导出到一个名为grouped_counts.csv
的新CSV文件。
请确保将文件路径和列名替换为你的实际文件路径和列名。