统计表格中某两列选项的共同重复数量,并导出为新的表格


统计表格中某两列选项的共同重复数量,并导出为新的表格

要统计两列中选项的共同重复数量并导出为新的表格,你可以使用Python的pandas库。这涉及到以下步骤:

  1. 读取CSV文件:首先,读取包含这两列的CSV文件。

  2. 计算共同重复数量:使用pandas的分组(groupby)和聚合(count)功能来统计每个组合在这两列中出现的次数。

  3. 导出结果:将统计结果导出为新的CSV文件。

假设你的两个列名分别是 column1column2,以下是实现上述步骤的示例代码:

import pandas as pd

# 读取CSV文件
df = pd.read_csv('/path/to/your/file.csv')

# 计算共同重复数量
grouped_counts = df.groupby(['column1', 'column2']).size().reset_index(name='counts')

# 导出结果
grouped_counts.to_csv('grouped_counts.csv', index=False)

这段代码首先读取CSV文件。然后,它使用groupby方法对column1column2指定的两列进行分组,并计算每个组合的出现次数。最后,这些计数被导出到一个名为grouped_counts.csv的新CSV文件。

请确保将文件路径和列名替换为你的实际文件路径和列名。


发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注