Python合并多個(gè)Excel文件
1. 導(dǎo)入包在進(jìn)行Excel文件合并之前,首先需要導(dǎo)入所需的包。使用以下代碼導(dǎo)入`os`、`pandas`和`openpyxl`包:```pythonimport osimport pandas as
1. 導(dǎo)入包
在進(jìn)行Excel文件合并之前,首先需要導(dǎo)入所需的包。使用以下代碼導(dǎo)入`os`、`pandas`和`openpyxl`包:
```python
import os
import pandas as pd
import openpyxl
import warnings
("ignore")
```
2. 添加源文件地址,獲取文件名
通過指定源文件目錄,并使用`()`函數(shù)獲取該目錄下所有文件的文件名列表。例如,將源文件目錄設(shè)置為`./源文件`,則可以使用以下代碼獲取文件名列表:
```python
dir "./源文件"
filenames (dir)
print(filenames)
```
3. 新增空list,遍歷文件append到空列
為了存儲(chǔ)從每個(gè)Excel文件中讀取的數(shù)據(jù),我們創(chuàng)建一個(gè)空的列表`dfs`。然后,使用`_excel()`函數(shù)遍歷文件名列表,并將每個(gè)文件的數(shù)據(jù)存儲(chǔ)在一個(gè)臨時(shí)DataFrame中。接著,我們將文件名作為新的一列添加到臨時(shí)DataFrame中,并將其添加到`dfs`列表中。以下是實(shí)現(xiàn)上述操作的代碼:
```python
dfs []
df1 []
for name in filenames:
print(name)
df1 _excel((dir, name))
username name
df1['文件名'] username
(df1)
```
4. 合并文件名列,表示數(shù)據(jù)來源,后保存合并后的文件
最后一步是將所有臨時(shí)DataFrame合并成一個(gè)大的DataFrame,用于表示數(shù)據(jù)的來源。使用`()`函數(shù)將`dfs`列表中的所有DataFrame進(jìn)行合并,并將結(jié)果保存為Excel文件。以下是合并文件和保存的代碼:
```python
df (dfs, ignore_indexTrue)
_excel('./合并文件.xlsx', indexFalse)
```
這樣,你就成功地合并了多個(gè)Excel文件,并保存了合并后的文件。這在處理大量數(shù)據(jù)時(shí)非常有用,可以節(jié)省時(shí)間和精力。